百万级向量检索,FAISS和Qdrant是两个最常用的选择。一个来自Meta,一个来自独立开源社区。
FAISS
Facebook AI Similarity Search,纯C++核心,Python封装。支持精确搜索和近似搜索(IVF、HNSW、PQ)。最大优势是极致性能,单机能处理亿级向量。缺点是没有内置服务化能力,数据持久化需要手动管理。
Qdrant
Rust编写的向量数据库,原生支持HTTP和gRPC接口。内置数据持久化、向量增删改、过滤搜索。开箱即用的分布式支持。性能比FAISS慢10%-20%,但多了完整的数据库能力。
选型建议
追求极致性能和大数据量选FAISS。需要开箱即用的数据库能力选Qdrant。百万级以下性能差距不大。过滤搜索对实际应用非常关键。