Skip to content

frog9088/samsunf_ocr_chatbot

Repository files navigation

Samsung_OCR-Chatbot

삼성증권 과제_OCR 챗봇 서비스 개발

과제 설명

  • 상황설명
    • 생성형 AI 기술의 발전으로 다양한 산업에 접목할 수 있는 가능성이 제시되고 있습니다. 금융권의 업무 프로세스에서도 이를 통해 온프레미스 형태로 사용 가능한 서비스를 개발하고자 합니다. 하지만 증권 데이터 특성상 테이블과 그래프 형태의 자료가 담긴 PDF, 이미지 파일이 많아 다양한 서비스 개발에 어려움을 겪고 있습니다. 위 문제 상황을 해결하기 위해, 여러분은 증권에서 사용할 수 있는 서비스를 제안하고, 파일 업로드 및 OCR 기능을 담아 서비스를 개발하세요
    • [ 제약 조건 ] : OpenAPI(GPT-3.5, Embedding 등), Clova API 호출 불가
    • [ 필수 포함 기능 ] : 파일 업로드, OCR, 질의 응답
  • 과제 내용
    1. 개발 환경
      • OS : Ubuntu20.04 / Cuda :12.1 / Python : 3.10
      • UI : Chainlit 혹은 streamlit
    2. 제출 파일
      1. requirements.txt
      2. Dockerfile
      3. Docker Image 파일 혹은 docker hub 주소
      4. 결과 보고서(PPT) : 서비스 및 기능 소개, UI 시연 동영상 및 캡쳐

설치 방법

  1. Git Clone
git clone -b ollama https://github.com/namkidong98/Samsung_OCR-Chatbot.git
cd Samsung_OCR-Chatbot
  1. 가상 환경 설치 및 활성화
conda create -n samsung python=3.10
conda activate samsung
  1. torch 설치
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu121
  1. 나머지 dependency 설치
pip install -r requirements.txt
  1. HuggingFace에서 모델 다운
    https://huggingface.co/heegyu/EEVE-Korean-Instruct-10.8B-v1.0-GGUF/tree/main에서 ggml-model-Q5_K_M.gguf을 다운받아 models폴더 안에 저장한다



  1. Ollama 설치 후 Modelfile로 create

https://ollama.com/download에서 OS에 맞게 Ollama를 설치하고 실행한다
다음 명령어를 실행

ollama list
ollama create EEVE-Korean-10.8B -f models/Modelfile
ollama list                            # EEVE-Korean-10.8B:latest 생성된 것을 확인
ollama run EEVE-Korean-10.8B           # 이렇게 터미널에서 테스트 가능 


  1. streamlit 실행
streamlit run app.py

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors