Milvus 用法?
Milvus是一个开源的向量搜索引擎,提供了可插拔、高度可扩展的数据处理方式和多种索引类型。下面是一个使用Python的Milvus基本示例:
- 首先安装Python Milvus SDK:
pip install pymilvus==2.0.0rc5
注意: 请根据你的环境选择合适的版本,以上命令可能会随着时间推移而变化。
启动Milvus服务器。您可以参照官方文档关于如何通过Docker启动Milvus。
使用Python连接到Milvus并创建向量数据库:
from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection
# 连接到Milvus服务器
connections.connect("default", host="localhost", port="19530")
# 定义字段和集合模式
dim = 128
fields = [
FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=dim)
]
schema = CollectionSchema(fields=fields, description="test collection")
# 创建向量数据库
collection = Collection(name="my_collection", schema=schema)
# 插入一些向量数据
import numpy as np
vectors = np.random.rand(100, dim).tolist()
ids = [i for i in range(len(vectors))]
mr = collection.insert([ids, vectors])
# 执行查询
topK = 10
query_embedding = vectors[0]
res = collection.search(query_embedding, "embedding", param={'nprobe': 10}, limit=topK)
以上代码连接到本地的Milvus服务器,创建一个集合(相当于传统数据库中的表),并插入一些随机生成的向量数据。然后执行一个查询,返回查询向量的最近邻。