Glossary
Data

Vector Database

고차원 벡터 임베딩을 저장하고 밀리초 단위의 유사도 검색을 수행하는 AI 시대의 핵심 데이터 인프라. RAG, 추천 시스템, 시맨틱 검색의 기반 기술로 2024년 엔터프라이즈 AI 스택의 필수 구성요소로 자리잡았습니다.

목차

1. Executive Summary

2. Vector Database 정의

3. 핵심 개념: 임베딩과 유사도

4. 인덱싱 알고리즘

5. 주요 Vector Database 비교

6. AWS 기반 구현

7. 활용 사례

8. 성능 최적화

9. 선택 가이드

10. 참고 자료

1. Executive Summary

Vector Database는 텍스트, 이미지, 오디오 등 비정형 데이터를 고차원 벡터(임베딩)로 변환하여 저장하고, 의미적 유사도 기반 검색을 수행하는 특수 목적 데이터베이스입니다. 전통적인 키워드 검색이 아닌시맨틱 검색을 가능하게 하여 AI 애플리케이션의 핵심 인프라로 부상했습니다.

<10ms

10억 벡터 검색 시간

99%+

Recall 정확도 (HNSW)

1536D

일반적 임베딩 차원

$2.8B

2028년 시장 규모 전망

핵심 요약

  • 비정형 데이터를 벡터 임베딩으로 변환하여 저장
  • ANN(Approximate Nearest Neighbor) 알고리즘으로 밀리초 검색
  • RAG, 추천 시스템, 이상 탐지, 이미지 검색 등 AI 핵심 인프라
  • Pinecone, Weaviate, Qdrant, Milvus, pgvector 등 다양한 선택지

2. Vector Database 정의

2.1 Vector Database란?

“A vector database stores data as high-dimensional vectors and enables fast similarity searches using approximate nearest neighbor algorithms.”

Vector Database는 데이터를 고차원 수치 벡터로 표현하여 저장합니다. 각 벡터는 원본 데이터의 의미적 특성을 수백~수천 개의 숫자로 인코딩합니다. 이를 통해 “비슷한 의미”를 가진 데이터를 빠르게 찾을 수 있습니다.

전통적 데이터베이스

  • • 정확한 키워드 매칭
  • • 구조화된 데이터 (행/열)
  • • SQL 쿼리
  • • B-tree, Hash 인덱스

Vector Database

  • • 의미적 유사도 검색
  • • 비정형 데이터 (텍스트, 이미지)
  • • 벡터 쿼리 (k-NN)
  • • HNSW, IVF 인덱스
2.2 Vector Database가 필요한 이유

시맨틱 검색

“강아지”를 검색하면 “puppy”, “개”, “반려견” 등 의미적으로 유사한 결과도 반환

RAG (Retrieval-Augmented Generation)

LLM에 관련 컨텍스트를 제공하여 정확한 응답 생성. Vector DB는 RAG의 핵심 구성요소

실시간 추천

사용자 행동/선호도 벡터와 유사한 상품/콘텐츠를 밀리초 내 검색

멀티모달 검색

텍스트로 이미지 검색, 이미지로 유사 이미지 검색 등 다양한 형식 간 검색

3. 핵심 개념: 임베딩과 유사도

3.1 벡터 임베딩 (Vector Embedding)

임베딩은 텍스트, 이미지 등의 데이터를 고차원 공간의 점(벡터)으로 변환한 것입니다. 의미적으로 유사한 데이터는 벡터 공간에서 가까운 위치에 배치됩니다.

# 텍스트를 벡터로 변환하는 예시
"강아지가 공원에서 뛰어놀고 있다" → [0.23, -0.45, 0.12, ..., 0.67]  # 1536차원
"개가 잔디밭에서 놀고 있다"       → [0.21, -0.43, 0.14, ..., 0.65]  # 유사한 벡터
"주식 시장이 상승했다"           → [-0.56, 0.78, -0.23, ..., 0.11] # 다른 벡터

# 유사도 계산
cosine_similarity(강아지, 개) = 0.95  # 높은 유사도
cosine_similarity(강아지, 주식) = 0.12 # 낮은 유사도

384-4096

일반적인 벡터 차원

1536

OpenAI text-embedding-3-small

3072

OpenAI text-embedding-3-large

3.2 유사도 측정 방법
방법공식범위특징사용 사례
Cosine Similaritycos(θ) = A·B / (|A||B|)-1 ~ 1방향만 비교, 크기 무시텍스트 유사도 (가장 일반적)
Euclidean (L2)√Σ(Ai-Bi)²0 ~ ∞실제 거리 측정이미지, 클러스터링
Dot ProductΣ(Ai × Bi)-∞ ~ ∞방향 + 크기 모두 반영추천 시스템
Manhattan (L1)Σ|Ai-Bi|0 ~ ∞격자 거리희소 벡터

4. 인덱싱 알고리즘

4.1 ANN (Approximate Nearest Neighbor)

수십억 개의 벡터에서 정확한 최근접 이웃을 찾는 것은 계산적으로 불가능합니다. ANN 알고리즘은 약간의 정확도를 희생하여 밀리초 단위 검색을 가능하게 합니다.

HNSW (Hierarchical Navigable Small World)

그래프 기반 알고리즘. 계층적 구조로 빠른 탐색 가능.

  • ✓ 높은 정확도 (99%+ recall)
  • ✓ 빠른 검색 속도
  • ✓ 동적 삽입/삭제 지원
  • △ 메모리 사용량 높음
  • △ 인덱스 빌드 시간 김
사용: Pinecone, Weaviate, Qdrant, pgvector

IVF (Inverted File Index)

클러스터링 기반. 벡터를 그룹으로 나누어 검색 범위 축소.

  • ✓ 메모리 효율적
  • ✓ 빠른 인덱스 빌드
  • ✓ 대규모 데이터셋에 적합
  • △ HNSW 대비 낮은 정확도
  • △ 클러스터 수 튜닝 필요
사용: FAISS, Milvus, pgvector
4.2 인덱스 알고리즘 비교
알고리즘검색 속도정확도메모리빌드 시간적합한 상황
HNSW매우 빠름매우 높음높음느림정확도 중시, 실시간 검색
IVF빠름중간낮음빠름대규모 데이터, 비용 중시
PQ (Product Quantization)빠름중간매우 낮음중간메모리 제한 환경
Flat (Brute Force)느림100%중간없음소규모, 정확도 필수

5. 주요 Vector Database 비교

5.1 종합 비교표
Database유형인덱스하이브리드호스팅강점
Pinecone관리형독자클라우드Zero-ops, 빠른 시작
Weaviate오픈소스HNSW둘 다멀티모달, GraphQL
Qdrant오픈소스HNSW둘 다Rust 성능, 필터링
Milvus오픈소스다양둘 다대규모, GPU 지원
Chroma오픈소스HNSW로컬간편함, 프로토타입
pgvector확장HNSW/IVF둘 다PostgreSQL 통합
OpenSearch관리형HNSWAWSAWS 통합, 엔터프라이즈
Pinecone
가장 인기 있는 관리형 Vector DB
  • 완전 관리형, Zero-ops
  • 빠른 시작, 간편한 API
  • 하이브리드 검색 지원
  • 벤더 종속, 비용 높음
ServerlessEnterprise
Weaviate
멀티모달 지원 오픈소스
  • 텍스트, 이미지, 오디오 통합
  • GraphQL API
  • 셀프호스팅/클라우드 선택
  • 학습 곡선 있음
Open SourceMulti-modal

6. AWS 기반 구현

6.1 AWS Vector Database 옵션

Amazon OpenSearch Serverless

Bedrock Knowledge Bases의 기본 벡터 스토어

  • ✓ 완전 관리형, 자동 스케일링
  • ✓ 하이브리드 검색 (BM25 + kNN)
  • ✓ Bedrock 네이티브 통합
  • ✓ 엔터프라이즈 보안

Amazon Aurora PostgreSQL + pgvector

기존 PostgreSQL 인프라 활용

  • ✓ 익숙한 SQL 인터페이스
  • ✓ 트랜잭션 지원
  • ✓ 기존 데이터와 조인 가능
  • ✓ 비용 효율적
6.2 Bedrock Knowledge Bases 아키텍처
┌─────────────────────────────────────────────────────────────────┐
│                 Amazon Bedrock Knowledge Bases                   │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│   ┌──────────┐    ┌──────────────┐    ┌───────────────────┐    │
│   │    S3    │───►│   Bedrock    │───►│    OpenSearch     │    │
│   │ Documents│    │  Embedding   │    │    Serverless     │    │
│   │          │    │ (Titan/Cohere)│    │  (Vector Store)   │    │
│   └──────────┘    └──────────────┘    └─────────┬─────────┘    │
│                                                  │              │
│   ┌──────────┐    ┌──────────────┐              │              │
│   │  Query   │───►│   Retrieve   │◄─────────────┘              │
│   │          │    │   & Generate │                              │
│   └──────────┘    └──────┬───────┘                              │
│                          │                                       │
│                          ▼                                       │
│                   ┌──────────────┐                              │
│                   │   Response   │                              │
│                   │ + Citations  │                              │
│                   └──────────────┘                              │
└─────────────────────────────────────────────────────────────────┘

7. 활용 사례

RAG (Retrieval-Augmented Generation)

LLM에 관련 문서를 컨텍스트로 제공하여 정확한 응답 생성

효과: 할루시네이션 85% 감소, 정확도 95%+
시맨틱 검색

키워드가 아닌 의미 기반 검색으로 관련 문서 발견

효과: 검색 관련성 40% 향상
추천 시스템

사용자/상품 임베딩으로 유사 아이템 실시간 추천

효과: 클릭률 25% 증가
이상 탐지

정상 패턴과 거리가 먼 벡터를 이상으로 탐지

효과: 사기 탐지 정확도 30% 향상
이미지/비디오 검색

텍스트로 이미지 검색, 유사 이미지 찾기

효과: 검색 시간 90% 단축
중복 탐지

유사한 문서, 이미지, 코드 중복 식별

효과: 중복 콘텐츠 95% 탐지

8. 성능 최적화

인덱스 최적화

  • • HNSW: ef_construction, M 파라미터 튜닝
  • • IVF: nlist (클러스터 수) 최적화
  • • 데이터 크기에 맞는 알고리즘 선택
  • • 정기적인 인덱스 리빌드

쿼리 최적화

  • • 메타데이터 필터링으로 검색 범위 축소
  • • 적절한 Top-K 값 설정
  • • 배치 쿼리 활용
  • • 캐싱 전략 적용

9. 선택 가이드

🚀 빠른 시작, 관리 최소화

Pinecone (관리형, Zero-ops)

🏢 AWS 엔터프라이즈 환경

OpenSearch Serverless (Bedrock 통합)

💰 비용 효율, 기존 PostgreSQL

pgvector (Aurora/RDS)

🔧 프로토타입, 로컬 개발

Chroma (간편, 무료)

🖼️ 멀티모달, 온프레미스

Weaviate (오픈소스, 유연)

10. 참고 자료

공식 문서

  • • Amazon OpenSearch Service
  • • Pinecone Documentation
  • • Weaviate Docs
  • • pgvector GitHub

벤치마크

  • • ANN Benchmarks
  • • VectorDBBench
  • • Zilliz Benchmark
Summary

Vector Database는 AI 시대의 핵심 데이터 인프라입니다. 비정형 데이터를 벡터로 변환하여 의미 기반 검색을 가능하게 하며, RAG, 추천 시스템, 시맨틱 검색의 기반 기술로 활용됩니다.

핵심 요약

  • 정의: 고차원 벡터 저장 및 유사도 검색 DB
  • 핵심 알고리즘: HNSW (정확도), IVF (효율)
  • 유사도: Cosine, Euclidean, Dot Product
  • AWS: OpenSearch Serverless, Aurora pgvector

선택 기준

  • 1. 관리형 vs 셀프호스팅
  • 2. 데이터 규모 및 성장 예상
  • 3. 하이브리드 검색 필요 여부
  • 4. 기존 인프라 통합
  • 5. 비용 및 성능 요구사항