-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
Summary
- Related PR: [Task1] 평가 척도 생성 및 Agent 최적화 (프롬프트, 토폴로지) #4
- 리팩토링 후, 이전과 동일한 기능을 하는지 판단하는 평가 지표 필요
- 리팩토링한 테스트가 단위 테스트를 모두 통과하는지 확인 (통과하지 못 할 경우 재생성)
- 기존 코드 기반 단위테스트 생성
- HumanEval, MBPP 데이터셋 활용
- Self-consistency 프롬프트 기법 적용
- 리팩토링한 테스트가 단위 테스트를 모두 통과하는지 확인 (통과하지 못 할 경우 재생성)
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels