Skip to content
/ AI Public

2024 이브와 ICT멘토링 공모전 금상 수상작

Notifications You must be signed in to change notification settings

TOGEDU/AI

Repository files navigation

CLONING AI

😀 AI 팀원 및 역할

이름 역할 담당
소원 Back-end / AI
채팅, 배지, 오늘의질문, RAG, DB, 배포/인프라, ERD🗨️ 실시간 채팅 시스템
  • 채팅방 생성, 메시지 전송 및 답변 생성 API
  • 메시지 히스토리 조회 / 채팅방 목록 조회 API
  • Spring Boot ↔ FastAPI 간 텍스트 → 음성 합성 연동
  • Whisper 기반 음성 → 텍스트(STT) 변환 API
  • 초기 메시지 기반 채팅방 생성 및 메시지 소속 관리 로직 설계
🗂️ 기록 현황 / 배지 시스템
  • 주간 기준 배지 획득 여부 조회
  • 달력 기반 활동 현황 조회 API
  • 일기/질문/기록 여부에 따른 UI 표시 데이터 제공
  • 누적 기록 기반 진행률 계산 로직 구현
📝 오늘의 질문(Daily Question)
  • 질문 리스트 조회(아코디언용 전체 텍스트 포함)
  • 답변 작성/수정/조회 API
  • 날짜별 답변 유무 기반 분기 처리 로직
  • 페이징 구조 설계 반영
  • 자정 기준 자동 질문 로테이션 로직 구현
🧠 RAG 파이프라인 구축
  • LangChain 기반 RAG 구조 설계 및 구현
  • 텍스트 청크 분할 후 임베딩 생성
  • Cosine Similarity 기반 문맥 검색
  • 검색된 컨텍스트를 활용한 정확한 답변 생성
🗂️ 데이터베이스 인프라 구성
  • ChromaDB 기반 벡터 저장소 초기 구축 및 임베딩 관리 파이프라인 설계
  • AWS RDS(MySQL) 기반 서비스 데이터 저장 환경 구성
☁️ 배포 및 서버 인프라
  • Docker 기반 AWS EC2 컨테이너 빌드 & 배포
  • RDS–Spring Boot–FastAPI 연동
  • CUDA + NVIDIA Docker 기반 GPU 추론 환경 구축
🧱 ERD 및 도메인 모델링
  • 전체 서비스 ERD 설계
  • 도메인 구조화(Child, ChatRoom, Message 등)
조소윤 Back-end / AI
인증/보안, 음성기록, 육아일기, 푸시알림, 부모/자녀 마이페이지, TTS, 배포/인프라, DB, ERD🔐 인증/보안
  • 부모와 자녀 회원가입 로직 구현
  • 이메일 중복 검사 API
  • Spring Security 기반 JWT 인증/인가 구조 구축
  • Access Token 발급 로직 구현
  • 로그아웃 API
  • 회원 탈퇴 API
🎙️ 음성 기록 기능
  • TTS 모델 학습용 음성 녹음 업로드 처리
  • 음성 파일 생성·병합·저장 로직
  • 음성 기록 진행 현황 API
📷 육아일기(사진 포함) API
  • 부모 공통 일기 작성 및 자녀별 개별 일기 작성 API
  • 일기 작성 전 기존 작성 여부 확인 API
  • 육아일기 수정/작성/날짜별 기록 조회/캘린더 API 구현
📱 푸시 알림
  • Firebase Cloud Messaging(FCM) 사용
  • Spring Boot 스케줄러 기반 지정 시간 푸시 알림
👨‍👧 부모 마이페이지
  • 부모 정보 조회 및 수정(이름, 프로필 사진)
  • 자녀 목록 조회 및 관리(추가, 이름 변경)
  • 알림 시간 설정(on/off 포함)
  • 육아일기 캘린더 조회 및 날짜별 일기 확인
🔊 텍스트 음성 변환(TTS) 기능
  • XTTS 모델 하이퍼파라미터 파인튜닝
  • XTTS 기반 음성 재생 기능 API
🧒 자녀 마이페이지
  • 자녀 정보 조회
  • 사진첩 조회
  • 알림 시간 설정(on/off 포함)
☁️ 배포 및 인프라
  • Docker 기반 AWS EC2 컨테이너 빌드 & 배포
  • CUDA + NVIDIA Docker 기반 GPU 추론 환경 구축
  • S3와 Spring Boot 연동
🗂️ 데이터베이스 인프라 구성
  • FAISS 기반 벡터 저장소 초기 구축 및 임베딩 파이프라인 설계
🧱 ERD 및 도메인 모델링
  • 전체 서비스 ERD 설계
  • 도메인 구조화(DailyQuestion, DailyQuestionRecord, Parent, VoiceRecordingRecord, VoiceRecordingSentence)
홍다인 Back-end / AI
음성처리, 육아일기, 사진첩, LLM 전처리, LLM 파인튜닝, 배포/인프라, ERD🔊 부모 음성 처리 기능
  • 부모 음성 녹음 업로드 처리
  • 음성 파일 생성·병합·저장 로직
  • 음성 기록 조회/관리 API
📷 육아일기(사진 포함) API
  • 텍스트 + 이미지 업로드/조회 API
  • AWS S3 기반 이미지 저장소 구축
  • 캘린더 기반 전체 육아일기 조회
  • 날짜별 육아일기 상세 조회
  • 육아일기 작성 기능
  • 작성된 일기 수정 기능
📷 사진첩 기능
  • 사진 업로드 API
  • 사진 저장 및 관리 로직
  • 업로드된 이미지 조회 기능
  • S3 기반 사진 파일 저장 구조 적용
🧠 LLM 데이터 수집·전처리
  • AI Hub 공감형 대화 데이터에서 부모–자녀 대화만 선별
  • 발화 역할 통일(‘어머니/아버지 → 부모’) 및 문장 정제·구조화
  • LLM 학습용 Instruction 형식 데이터셋 구성
🤖 LLM 파인튜닝
  • Llama 3 Korean Blossom 8B로 부모 말투·대화 패턴 학습
  • 전처리된 대화 데이터를 활용해 공감형 응답 생성 모델 구축
  • FastAPI 환경에서 학습 모델 로딩하여 실시간 대화 서비스 적용
☁️ 배포 및 인프라
  • Docker 기반 컨테이너화
  • Docker 기반 AWS EC2 컨테이너 빌드 & 배포
  • EC2에서 Spring Boot · FastAPI 서버 연동
🧱 ERD 및 도메인 모델링
  • 전체 서비스 ERD 설계
  • 도메인 구조화(ParentChild, Diary 등)

1. AI 개요

  • 부모의 육아일기·대화 기록·음성 데이터를 활용하여 LLM + RAG + TTS 파이프라인으로 사고방식과 음성을 복제한 AI 모델을 구축
  • 부모가 제공한 텍스트 맥락을 기반으로 개인화된 대화형 모델 생성, TTS를 통해 부모 음성과 유사한 형태로 응답 생성
  • 자녀가 정서적·심리적 지지를 필요로 하는 순간, 부모의 말투와 사고 패턴을 반영한 맞춤형 상담·대화 AI 제공

2. AI 아키텍처 개요

  • LLM: Llama3 Korean Blossom 8B를 기반으로 공감형 대화 특화 파인튜닝
  • RAG: 부모의 육아일기·대화 기록을 벡터화하여 문맥 기반 답변 생성
  • TTS: XTTS 기반 음성 합성으로 부모 음색을 복원
  • Embedding: sRoBERTa 멀티태스크 기반 문맥 임베딩 추출
  • Pipeline: 텍스트 전처리 → LLM 학습 → 문서 벡터 인덱싱 → RAG 검색 → 음성 합성

3. 모델 세부 구성

📘 3-1. LLM 파인튜닝

  • Blossom-8B 모델 기반
  • 부모-자녀 대화 구조화 데이터로 Instruction Fine-tuning
  • AI Hub 공감형 대화 데이터 추가 학습
  • LoRA 적용을 통한 파라미터 효율적 학습
  • 역할 구분(prompt role) 및 문맥 강화 처리

🔍 3-2. RAG (Retrieval-Augmented Generation)

  • LangChain + FAISS 기반 검색 구조
  • 육아일기·상담기록 등을 chunking 후 벡터 인덱싱
  • 검색된 실제 부모 기록을 LLM 답변 생성에 주입하여 더 일관적이고 부모 특화 맥락을 반영한 대화 생성

🎧 3-3. TTS (XTTS 기반 Voice Cloning)

  • 7분 가량의 부모 음성으로 화자 임베딩 생성
  • 텍스트 → 멜스펙트로그램 → waveform으로 단계적 합성
  • 한국어 음성 스타일에 최적화된 XTTS v2 모델 적용
  • 사용자 질문 → 부모 음성으로 응답 생성 end-to-end 처리

4. 개발 스택

🧠 AI / Machine Learning

5. 참고 자료

  • 공감형 대화 데이터셋 (AI Hub)
  • Llama3 Korean Blossom 8B
  • XTTS v2 (Coqui)
  • FAISS Dense Vector Index

About

2024 이브와 ICT멘토링 공모전 금상 수상작

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •