Brave API를 활용한 n8n 뉴스 감정 분석 시스템
뉴스 감정 분석의 필요성
업무 현실 및 활용 사례
광고/홍보 업계의 요구사항
•
일일 뉴스 모니터링: 매일 아침 뉴스 스크래핑 후 리더 보고
•
외주 업체 활용: 많은 회사에서 뉴스 수집 전문 업체 고용
•
자동화 필요성: 반복적인 수작업을 효율적으로 대체
실제 구현 사례
•
환경 관련 뉴스: 매주 금요일 키워드 기반 스크래핑
•
국내외 기사: 포괄적인 뉴스 소스 활용
•
AI 필터링: 중요 기사 자동 추출 및 리더 보고서 생성
감정 분석 기술의 발전
전통적 NLP vs 현대 LLM
기존 감정 분석 방식
•
대형 IT 기업: AWS, IBM 등에서 별도 감정 분석 섹션 운영
•
GPT 이전 중요성: NLP에서 핵심적인 작업 영역
•
전용 데이터셋: AI Hub 등에서 감정 분석 학습 데이터 제공
현대적 접근 방식
•
LLM 활용: 별도 모델 개발 대비 효율적이고 경제적
•
n8n 통합: 복잡한 개발 없이 쉬운 구현
•
비용 효율성: 자체 모델 개발 대비 저렴한 운영
스케줄 기반 자동화 설정
시간대 설정 및 트리거 구성
글로벌 시간대 고려
•
뉴욕 시간 기준: n8n 기본 설정
•
한국 시간 변환: 뉴욕(-4) vs 한국(+9), 약 15시간 차이
•
실행 시간 계산: 뉴욕 오후 6시 = 한국 오전 시간
일정 관리
•
매일 아침 실행: 업무 시작 전 뉴스 분석 완료
•
시간 최적화: 적절한 실행 시간대 설정
Brave API 연동 및 뉴스 검색
Brave Search API 설정
API 계정 및 인증
•
계정 생성: Brave Search API 공식 페이지
•
무료 플랜: 월 2,000회 요청 제한
•
비용 효율성: 일일 보고서 기준 충분한 무료 사용량
n8n 연동 설정
•
Credential 생성: API 키 등록
•
News Search 노드: 웹 검색 대신 뉴스 전용 검색
•
결과 구조: 검색 결과의 Description 필드 활용
검색 결과 처리
•
기업명 검색: 예시로 Apple 사용
•
결과 데이터: Title, Description, URL 등
•
감정 분석 대상: Description 필드 중심 분석
감정 분석 방법론 선택
n8n 내장 Sentiment Analysis vs Basic LLM Chain
내장 기능의 한계
•
Sentiment Analysis 노드: 기본 제공되지만 제한적
•
카테고리 분류: Positive/Neutral/Negative 단순 분류
•
워크플로우 제약: 분류 결과에 따른 분기 처리 중심
Basic LLM Chain 선택 이유
•
유연성: 분류보다는 정렬 및 저장 목적
•
커스터마이징: 프롬프트를 통한 세밀한 제어
•
통합성: 다른 처리 과정과의 자연스러운 연결
모델 선택 및 프롬프트 설계
경제적 모델 활용
•
작은 모델 선택: 감정 분석의 단순성 고려
•
Nano 모델: 비용 효율적인 선택
•
성능 대비 비용: 적절한 품질과 경제성 균형
프롬프트 엔지니어링
•
시스템 프롬프트: 뉴스 분석 전문가 페르소나
•
분석 목적: 경영진 보고용 명시
•
결과 형식: 구조화된 출력 정의
반복 처리 및 데이터 구조화
Loop over Items를 통한 배치 처리
데이터 구조 문제 해결
•
배열 처리: 여러 뉴스 기사의 일괄 처리
•
순차 실행: 각 기사별 개별 감정 분석
•
인덱스 문제: 객체 구조로 인한 접근 어려움
중간 코드 노드 활용
•
데이터 변환: 필요한 필드만 추출
•
배열 재구성: 7개 기사 → 7개 개별 아이템
•
처리 최적화: 불필요한 데이터 제거
구조화된 출력 설정
Structured Output Parser
•
Require Specific Output Format: 일관된 응답 형식
•
Sentiment 필드: String 타입의 감정 분석 결과
•
검증 가능한 결과: 명확한 Positive/Negative 분류
Google Spreadsheet 연동
Google Sheets API 설정
인증 및 권한 설정
•
Client ID/Secret: Gmail 연동과 동일한 OAuth 방식
•
API 활성화: Google Sheets API 사용 권한
•
기존 Credential 재활용: 중복 설정 방지
스프레드시트 구성
•
사전 준비: 헤더 행이 있는 스프레드시트 생성
•
Append Row: 새 데이터 행 추가 방식
•
실시간 업데이트: 분석 결과 즉시 반영
데이터 저장 및 관리
저장 필드 구성
•
기본 정보: Title, Description, URL
•
분석 결과: Sentiment (Positive/Negative)
•
추가 메타데이터: 날짜, 키워드 등
출력 최적화
•
LLM 출력 구조: 분석 결과와 원본 데이터 통합
•
필드 매핑: 스프레드시트 컬럼과 데이터 연결
•
오류 처리: 데이터 누락 시 대응 방안
실제 테스트 및 검증
워크플로우 실행 및 결과 확인
테스트 케이스
•
Apple 벌금 뉴스: 1.8조원 벌금으로 Negative 판정
•
스마트폰 판매 1위: Positive 판정
•
결과 정확성: 실제 뉴스 내용과 감정 분석 일치도
데이터 검증
•
스프레드시트 확인: 실시간 데이터 입력 상태
•
URL 연결: 원본 기사 링크 유효성
•
분석 품질: AI 판정의 적절성 평가
확장 가능성 및 개선 방향
추가 뉴스 소스 연동
•
네이버 뉴스: 국내 뉴스 소스 추가 예정
•
다양한 API: 여러 뉴스 제공업체 통합
•
언어별 처리: 한국어/영어 뉴스 별도 분석
고도화 방안
분석 깊이 향상
•
키워드 추출: 주요 이슈 자동 식별
•
트렌드 분석: 시간별 감정 변화 추적
•
종합 리포트: 주간/월간 감정 동향 보고서
업무 효율성 개선
•
알림 시스템: 중요 뉴스 즉시 알림
•
필터링 고도화: 관련성 높은 뉴스만 선별
•
시각화: 감정 분석 결과 차트 및 그래프
운영 및 유지보수 고려사항
비용 관리
•
API 사용량: Brave API 무료 한도 모니터링
•
모델 비용: 경제적 모델 선택을 통한 비용 절약
•
확장성: 사용량 증가 시 유료 플랜 고려
품질 관리
•
분석 정확도: 주기적인 결과 검토
•
프롬프트 최적화: 분석 품질 향상을 위한 지속적 개선
•
예외 상황: 특수한 뉴스 유형에 대한 대응 방안