Skip to content

feat : HTML 추출 자동화 Util 추가#107

Closed
rll2641 wants to merge 3 commits intodevelopfrom
feature/extraction-html
Closed

feat : HTML 추출 자동화 Util 추가#107
rll2641 wants to merge 3 commits intodevelopfrom
feature/extraction-html

Conversation

@rll2641
Copy link
Collaborator

@rll2641 rll2641 commented Sep 17, 2025

📝 작업 내용

  1. HTML 전처리
  2. 프롬프트로 HTML 요소 추출
  3. Util 파일 쓰기 전에 해당 페이지 분석 필수

🔗 관련 이슈

  • Closes #이슈번호
  • Related to #이슈번호

💬 추가 요청사항


✅ 체크리스트

코드 품질

  • 커밋 컨벤션 준수 (feat/fix/docs/refactor 등)
  • 불필요한 코드/주석 제거

테스트

  • 로컬 환경에서 동작 확인 완료
  • 기존 기능에 영향 없음 확인

배포 준비

  • 환경변수 추가/변경사항 문서화
  • DB 마이그레이션 필요 여부 확인
  • 배포 시 주의사항 없음

Selenium으로 HTML 가져오기 -> HTML 불필요한 태그 삭제 -> LLM 프롬프트로 요소 추출 자동화

현재 네이버, 티스토리 블로그 작동 확인 완료.
해당 파일 사용 시, 페이지 분석 및 상세한 프롬프트 작성 필수
@rll2641 rll2641 changed the base branch from main to develop September 17, 2025 01:41
@rll2641 rll2641 closed this Sep 17, 2025
@rll2641 rll2641 deleted the feature/extraction-html branch September 17, 2025 01:54
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant