Backend-Guide-Bot

🖥️ 서버 설명

LGCMS의 FAQ를 기반으로 답변해주는 RAG(Retrieval-Augmented Generation) 기반의 AI 챗봇 서버입니다
자주 묻는 질문(FAQ) 데이터를 Vector DB에 저장하여 사용자의 질문과 가장 유사한 문서를 효율적으로 검색합니다. 검색된 문서를 기반으로 LLM(Large Language Model)이 자연스러운 답변을 생성하여 사용자가 서비스 이용을 편리하게 하는 것을 목표로 합니다.
패키지 구조

lgcns-final-lgcms-backend-guide-bot/
    ├── src/
    │   ├── main/
    │   │   ├── java/
    │   │   │   └── com/
    │   │   │       └── lgcms/
    │   │   │           └── backendguidebot/
    │   │   │               ├── BackendGuideBotApplication.java
    │   │   │               ├── advice/
    │   │   │               │   └── GuideControllerAdvice.java
    │   │   │               ├── api/
    │   │   │               │   └── open/
    │   │   │               │       ├── ChatController.java
    │   │   │               │       └── VectorStoreController.java
    │   │   │               ├── common/
    │   │   │               │   ├── annotation/
    │   │   │               │   │   └── DistributedLock.java
    │   │   │               │   ├── aspect/
    │   │   │               │   │   ├── DistributedLockAspect.java
    │   │   │               │   │   └── TokenMetricsAspect.java
    │   │   │               │   └── dto/
    │   │   │               │       ├── BaseResponse.java
    │   │   │               │       └── exception/
    │   │   │               │           ├── BaseException.java
    │   │   │               │           ├── DataError.java
    │   │   │               │           ├── ErrorCode.java
    │   │   │               │           ├── ErrorCodeInterface.java
    │   │   │               │           ├── LockError.java
    │   │   │               │           └── QnaError.java
    │   │   │               ├── config/
    │   │   │               │   └── redis/
    │   │   │               │       ├── RedissonConfig.java
    │   │   │               │       └── RedissonProperties.java
    │   │   │               ├── domain/
    │   │   │               │   ├── advisor/
    │   │   │               │   │   ├── QueryExpansionAdvisor.java
    │   │   │               │   │   └── ReRankAdvisor.java
    │   │   │               │   ├── dto/
    │   │   │               │   │   └── ChatResponse.java
    │   │   │               │   └── service/
    │   │   │               │       ├── ai/
    │   │   │               │       │   └── local/
    │   │   │               │       │       └── ChatService.java
    │   │   │               │       └── vectorDb/
    │   │   │               │           ├── VectorStoreInitRunner.java
    │   │   │               │           ├── VectorStoreInitService.java
    │   │   │               │           └── VectorStoreService.java
    │   │   │               └── remote/
    │   │   │                   └── core/
    │   │   │                       ├── RemoteFaqService.java
    │   │   │                       └── dto/
    │   │   │                           └── FaqResponse.java
    │   │   └── resources/
    │   │       ├── application-local.yaml
    │   │       ├── application-test.yaml
    │   │       ├── application.yaml
    │   │       └── prompts/
    │   │           └── rag-prompt.st
    │   └── test/
    │       └── java/
    │           └── com/
    │               └── lgcms/
    │                   └── backendguidebot/
    │                       └── BackendGuideBotApplicationTests.java
    └── .github/
        ├── pull_request_template.md
        └── workflows/
            ├── githubCD.yaml
            └── githubCI.yaml

👨🏻‍💻 담당자

이름	역할
김선호	가이드 봇 개발
이재원	CI/CD, 모니터링

🛠️ 기술 스택

Languages

Framework

Middleware

Database

📌 기능

FAQ 기반 질의응답

시퀀스: 사용자 질문 → Vector DB 유사도 검색 → 검색된 문서 기반 프롬프트 생성 → LLM 답변 생성 → 사용자에게 답변

설명: 사용자의 질문 의도를 파악하여 PostgreSQL(pgvector)에 저장된 FAQ 벡터 데이터와 비교하고, 가장 유사한 문서를 찾아 LLM에게 전달하여 최종 답변을 생성합니다.

Vector DB 데이터 관리

시퀀스: 서버 시작 시 데이터 유무 확인 → Core 서버에서 FAQ 데이터 호출 → 데이터 임베딩 → Vector DB 저장

설명: 서버가 시작될 때 Vector DB가 비어있는 경우에만 Core 서버로부터 최신 FAQ 데이터를 가져와 임베딩하고 Vector DB에 저장합니다. 이 과정은 분산 락을 통해 여러 인스턴스가 동시에 실행되는 것을 방지합니다.

LLM 토큰 사용량 모니터링

시퀀스: LLM API 호출 → AOP를 통해 응답 가로채기 → 토큰 사용량 추출 → Prometheus로 메트릭 전송

설명: Spring AOP를 활용하여 LLM API 호출의 응답을 가로채고, 사용된 토큰 정보를 추출합니다. 이 데이터는 모니터링 도구(Prometheus)로 전송되어 AI 모델 사용 비용을 추적하고 관리하는 데 사용됩니다.

📜 주요 기능

질문 확장(Query Expansion) 기능: 사용자의 질문이 모호하더라도, LLM을 통해 질문을 여러 개로 확장하여 검색 정확도를 높입니다.
답변 재정렬(Re-ranking) 기능: Vector DB에서 검색된 여러 문서 중 가장 질문과 관련성이 높은 문서를 다시 정렬하여 답변의 품질을 향상시킵니다.
질문 답변 : LGCMS서비스에 대한 사용자의 질문에 대해 친절하게 답변합니다.
이미지 제공 : 글만으로 어려운 답변일 경우 미리 저장해 놓은 이미지버블을 사용자에게 답변과 같이 제공합니다.
URL 카드 제공 : 특정 페이지에 관한 질문일 경우 faq데이터에 저장되어 있는 LGCMS의 URL을 블록으로 전달합니다.

⚡ 트러블슈팅

문제 상황: 여러 서버 인스턴스가 동시에 기동될 때, Vector DB에 동일한 데이터를 중복으로 저장하려는 문제 발생.
- 해결: Redisson을 이용한 분산 락을 도입하여, 최초의 서버 인스턴스 하나만 데이터 초기화 작업을 수행하도록 제어했습니다.
문제 상황: LLM 호출 시 정확도가 낮은 답변이나 환각 현상이 발생하는 경우.
- 해결: rag-prompt.st 파일을 수정하여 LLM에 더 명확한 지시를 내리고, 컨텍스트로 제공된 문서만을 기반으로 답변하도록 제한하는 프롬프트 엔지니어링을 적용했습니다.

💡 느낀점

Spring AI를 통해 LLM 기반의 AI 기능을 Java/Spring 환경에 매우 편리하게 통합할 수 있었습니다. 추상화가 잘 되어 있어 다양한 LLM 모델로 쉽게 교체할 수 있는 장점을 확인했습니다. 자바환경에서 여러기능을 활용하여 LLM사용시 좋다고 생각합니다.
RAG 파이프라인에서 검색(Retrieval) 단계의 성능이 전체 답변의 품질을 좌우한다는 것을 깨달았습니다. pgvector에서 유사도 검색을 보다 확실히 하기 위해 확장쿼리를 이용하는 것처럼 다양한 전략을 생각하고 적용할 수 있는 경험이 좋았습니다.
AOP를 활용한 토큰 사용량 모니터링 기능은 운영 환경에서 비용을 예측하고 관리하는 데 좋은 기능임을 체감했습니다. 선언적인 방식으로 비즈니스 로직과 부가 기능 분리가 가능해 코드의 유지보수성이 향상되었습니다.
분산락의 필요성에 대해 몰랐지만 실제 서비스에서 여러 개의 서버 인스턴스가 동시에 가동될 때 core서버의 데이터를 임베딩해 저장하는 과정이 동시에 일어날 수 있는 문제를 마주하면서, 분산락의 적용 이유에 대해 알게되었습니다.

Name		Name	Last commit message	Last commit date
Latest commit History 85 Commits
.github		.github
docker		docker
gradle/wrapper		gradle/wrapper
src		src
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
build.gradle		build.gradle
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Backend-Guide-Bot

🖥️ 서버 설명

👨🏻‍💻 담당자

🛠️ 기술 스택

Languages

Framework

Middleware

Database

📌 기능

📜 주요 기능

⚡ 트러블슈팅

💡 느낀점

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

LGCNS-FINAL-LGCMS/backend-guide-bot

Folders and files

Latest commit

History

Repository files navigation

Backend-Guide-Bot

🖥️ 서버 설명

👨🏻‍💻 담당자

🛠️ 기술 스택

Languages

Framework

Middleware

Database

📌 기능

📜 주요 기능

⚡ 트러블슈팅

💡 느낀점

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages