数据迁移:Milvus 至 HDF5
你可以使用 MilvusDM 将 Milvus 数据存储为 HDF5 文件。
- 下载 M2H.yaml:
$ wget https://raw.githubusercontent.com/milvus-io/milvus-tools/main/yamls/M2H.yaml
- 配置参数:
source_milvus_path:Milvus 工作路径。mysql_parameter:Milvus 的 MySQL 配置。如未使用 MySQL,将该参数设置为 ‘’。source_collection:Milvus 中 collection 与 partition 名称。data_dir:导出的 HDF5 文件保存目录。
示例:
M2H:milvus_version: 2.xsource_milvus_path: '/home/user/milvus'mysql_parameter:host: '127.0.0.1'user: 'root'port: 3306password: '123456'database: 'milvus'source_collection: # specify the 'partition_1' and 'partition_2' partitions of the 'test' collection.test:- 'partition_1'- 'partition_2'data_dir: '/home/user/data'
- 运行 MilvusDM:
$ milvusdm --yaml M2H.yaml
示例代码
读取指定集合或分区的元数据,根据元数据读取本地 milvus/db 下的数据文件,返回特征向量和对应的 ID 并存为本地的 HDF5 文件:
collection_parameter, version = milvus_meta.get_collection_info(collection_name)r_vectors, r_ids, r_rows = milvusdb.read_milvus_file(self.milvus_meta, collection_name, partition_tag)data_save.save_yaml(collection_name, partition_tag, collection_parameter, version, save_hdf5_name)
