메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://teeemai.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

지식 베이스(Knowledge Base, KB)는 회사의 문서를 색인해두고 에이전트가 답변할 때 출처와 함께 인용할 수 있도록 하는 영구 저장소입니다. 단순 임베딩 검색이 아니라 3단계 중복 제거, 버전 관리, 민감도 분류를 갖춘 정식 자료 관리 체계입니다.
Teeem AI 지식 베이스 관리 화면

핵심 개념

2-tier 민감도

공개 (Public) — 모든 직원 접근 가능 비공개 (Private) — 채널 단위 ACL, 권한자만

3단계 중복 제거

동일 파일은 자동 인식하여 중복 색인을 막습니다. 토큰 비용과 검색 노이즈를 동시에 줄입니다.

버전 체인

같은 문서의 새 버전 업로드 시 이전 버전은 소프트 삭제, 변경 이력은 보존.

인용 영속화

답변에 사용된 출처는 별도 메시지로 영속 기록 (감사 추적용).

업로드 방법

채팅창에 파일을 드래그앤드롭하면 즉시 업로드 큐에 들어갑니다. 진행 상황은 채팅 위쪽 진행 표시줄로 확인.

민감도 분류

업로드 시 민감도가 자동 분류되며, 관리자가 수동으로 변경할 수도 있습니다.
분류누가 검색·인용 가능한가
public조직의 모든 직원
private해당 채널/팀 멤버만 (ACL 기반)
민감도가 높아진 경우(public → private) 이력이 sensitivity_history에 기록되어 누가 언제 왜 변경했는지 감사 가능합니다.

3단계 중복 제거

같은 파일이나 사실상 같은 내용을 두 번 색인하지 않도록 합니다.
1

Tier 1 — 해시 비교

파일 바이트의 SHA256 해시 + 정규화된 텍스트 fingerprint로 즉시 매칭. 동일하면 색인을 건너뜁니다.
2

Tier 2 — 정규화 fingerprint

공백·줄바꿈·페이지 번호를 무시한 정규화된 텍스트로 fingerprint 생성. PDF/Word 같은 다른 포맷이지만 같은 내용인 경우를 잡아냅니다.
3

Tier 3 — 벡터 유사도 게이트

cosine 유사도 0.92 이상이면 Gemini로 의미적 동등성을 한 번 더 검증. 진짜 새 정보일 때만 색인.
이 3단계 게이트로 평균 25–40% 의 색인 비용을 절감합니다.

버전 관리

같은 문서의 새 버전(예: 정책.pdf정책_v2.pdf)을 업로드하면 이전 버전이 소프트 삭제되고 새 버전이 그 자리를 차지합니다. 이전 버전이 만든 청크(chunks)는 트랜잭션으로 함께 삭제되어 검색에 노출되지 않습니다.
  • supersede_reason: 누가 왜 이 문서를 대체했는지 기록 (예: “정책 개정”)
  • getDocumentVersionChain: 관리자 콘솔에서 같은 문서의 전체 버전 이력을 시간 순으로 조회
  • 버전 히스토리 패널: 한 문서를 클릭하면 이전 버전과의 차이, 대체 사유, 작성자 확인 가능

검색과 인용

답변 생성 시 KB는 다음 순서로 검색합니다:
  1. BM25 키워드 검색 (한국어 조사 제거 토크나이저)
  2. 벡터 의미 검색 (LanceDB)
  3. Reciprocal Rank Fusion 으로 두 결과 결합
  4. Re-rank (선택적, 정확도 우선 시나리오)

인용 표시

답변에 사용된 출처는 다음과 같이 표시됩니다.
  • Slack: 답변 메시지 다음에 별도 컨텍스트 블록으로 출처 카드
  • 웹챗: 답변 우측에 인용 카드 (파일명 클릭 시 미리보기)
  • 공통 원칙: 출처는 인라인 각주가 아니라 영속 메시지로 표기 — 감사 추적과 변경 추적을 쉽게 합니다

지원 파일 형식

엑셀, CSV, PDF, 한글(HWP/HWPX), PPTX, DOCX, 이미지(OCR 포함), 동영상(자막), 오디오, ZIP. 전체 목록과 각 형식별 가능 작업은 파일 처리 참고.