RAG 앱을 위한 초경량 벡터 DB
별도 서버 없이 앱 내장형으로 동작.
100만 벡터 검색 <10ms
Pinecone, Weaviate... 별도 인프라 필요
매달 청구되는 클라우드 비용
DevOps 지식 필요. 관리 피로
앱에 임베딩. 끝.
별도 서버 없음. 프로세스 내 동작. 네트워크 레이턴시 제로.
HNSW 알고리즘. 100만 벡터 10ms 이내 검색.
패키지 크기 2MB. 의존성 최소화.
오픈소스. 클라우드 비용 없음.
| DB | 1M 벡터 검색 | 메모리 |
|---|---|---|
| Zvec | 8ms | 512MB |
| Pinecone | 45ms | - |
| Chroma | 32ms | 2GB |
| Weaviate | 28ms | 4GB |
from zvec import VectorDB
db = VectorDB()
db.add("doc1", embedding_vector)
db.add("doc2", embedding_vector)
results = db.search(query_vector, top_k=5)