利用 pymilvus 使用milvus
在Python环境中使用pymilvus
库可以方便地操作Milvus向量数据库。下面是一个基本的例子,演示了如何创建集合,插入数据和执行搜索。
首先,确保你已经安装了pymilvus
库:
pip3 install pymilvus
然后,连接到运行的Milvus服务,并进行操作:
from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection
# 连接到Milvus服务
connections.connect("default", host="localhost", port="19530")
# 定义字段和集合模式
dim = 128
fields = [
FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=dim)
]
schema = CollectionSchema(fields=fields, description="test collection")
# 创建向量数据库
collection = Collection(name="my_collection", schema=schema)
# 插入一些向量数据
import numpy as np
vectors = np.random.rand(100, dim).tolist()
ids = [i for i in range(len(vectors))]
mr = collection.insert([ids, vectors])
# 执行查询
topK = 10
query_embedding = vectors[0]
res = collection.search(query_embedding, "embedding", param={'nprobe': 10}, limit=topK)
这个代码片段首先连接到运行在本地的Milvus服务,然后创建一个新的集合并插入一些随机生成的向量数据。之后,它将执行一个查询,返回查询向量的最近邻。
请注意,这只是一个非常基本的例子。Milvus提供了许多其他功能,包括分区、索引管理、数据管理和高级搜索等。具体信息可以参考pymilvus的官方文档。