n8n을 활용한 사내 Q&A 봇
챗봇 형태로 데이터 로드
Chat UI 설정
•
On Chat Message: 사용자 질문 처리
•
Public 탭: 외부 접근 설정
•
N8NUserAuthentication: 인증 시스템
Question and Answer Chain 방식
QA Chain 노드 구성
•
Model: AI 모델 연결
•
Retriever: Pinecone 벡터 스토어
•
질문 답변 전용: 특화된 체인
설정값
•
모델: 답변 품질을 위한 비싼 모델
•
문서 개수 제한: 5개
•
벡터 스토어: Pinecone 인덱스 선택
•
임베딩 모델: 동일한 모델 사용
테스트 및 오류 해결
첫 번째 테스트
•
질문: "네트워크 담당자는 누구인가?"
•
잘못된 답변: 박성훈 과장
•
실제 답변: 김영수
문제 원인 및 해결
•
로그 확인: 네트워크 관련 문서 없음
•
데이터 업로드 문제: Loop 실행 누락
•
재실행: 전체 워크플로우 다시 실행
•
Pinecone 확인: 레코드 수 증가 확인
Agent 방식 구현
Agent vs QA Chain 차이점
QA Chain
•
숨겨진 시스템 프롬프트: "컨텍스트 기반으로 답변, 모르면 모른다고 답변"
Agent
•
도구 사용: 주어진 도구로 판단
•
프롬프트: "주어진 도구를 사용하여 사용자 질문에 답변"
Agent 설정
•
모델 연결: 중요 작업이므로 비싼 모델
•
Vector Store Tool: Pinecone을 도구로 추가
•
도구 이름: "회사 지식 베이스"
•
Description: AI가 도구 목적 이해
•
문서 개수: 5개
•
임베딩 모델: 동일 모델 사용
복잡한 질문 처리의 한계
테스트 사례
•
질문: "$3,000 승인 절차"
•
답변: "이사 승인 필요"
•
한계: 정확한 직급별 승인 권한 부족
텍스트 분할의 문제점
•
청크 단위 분할: 관련 정보가 분리됨
•
테이블 처리 어려움: 행렬 관계 정보 손실
•
이미지 처리 불가: 시각적 정보 누락
•
순서 정보 손실: 화살표 연결 관계 파악 불가
실제 업무 문서의 복잡성
처리 어려운 요소들
•
비용 규정: 테이블 형태
•
안전 규정: 스티커 작성법 이미지
•
업무 순서: 단계별 이미지와 화살표
데이터 품질의 중요성
•
Garbage In, Garbage Out: 쓰레기 데이터 입력 시 쓰레기 결과
•
데이터 전처리 중요성: AI 성능에 직접적 영향
n8n 활용성 검증 완료
검증 결과
•
기본 기능: n8n으로 사용성 검증 완료
•
한계 인식: 복잡한 문서 구조 처리 어려움
•
다음 단계: Python을 이용한 데이터 전처리