Skip to content

feat : HTML 추출 자동화 Util 추가#108

Merged
rll2641 merged 3 commits intodevelopfrom
feature/extraction-html
Sep 17, 2025
Merged

feat : HTML 추출 자동화 Util 추가#108
rll2641 merged 3 commits intodevelopfrom
feature/extraction-html

Conversation

@rll2641
Copy link
Collaborator

@rll2641 rll2641 commented Sep 17, 2025

📝 작업 내용

  1. HTML 전처리
  2. 프롬프트로 HTML 요소 추출
  3. 사용 시, 해당 페이지 분석 필요

🔗 관련 이슈

  • Closes #이슈번호
  • Related to #이슈번호

💬 추가 요청사항


✅ 체크리스트

코드 품질

  • 커밋 컨벤션 준수 (feat/fix/docs/refactor 등)
  • 불필요한 코드/주석 제거

테스트

  • 로컬 환경에서 동작 확인 완료
  • 기존 기능에 영향 없음 확인

배포 준비

  • 환경변수 추가/변경사항 문서화
  • DB 마이그레이션 필요 여부 확인
  • 배포 시 주의사항 없음

Selenium으로 HTML 가져오기 -> HTML 불필요한 태그 삭제 -> LLM 프롬프트로 요소 추출 자동화

현재 네이버, 티스토리 블로그 작동 확인 완료.
해당 파일 사용 시, 페이지 분석 및 상세한 프롬프트 작성 필수
@rll2641 rll2641 marked this pull request as ready for review September 17, 2025 01:50
@rll2641 rll2641 merged commit 1cedc53 into develop Sep 17, 2025
12 of 14 checks passed
@rll2641 rll2641 deleted the feature/extraction-html branch September 17, 2025 01:54
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant