-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
session_id 부여 로직 수정 및 Airflow dag 개발 #5
Conversation
- 수정 이유 : 기존 user_id와 session_number 만으로 session_id를 부여할 경우 전체 데이터에선 일관성이 보장되지 않을 가능성 존재 - 수정 내용 : 동일 세션의 start_event_time 컬럼 생성 및 session_id 부여에 활용
session_id 컬럼 로직 변경 session_number 정의는? session_number가 꼭 필요한가요? |
- 이전 30분 데이터 확인하여 active 여부 판단 - active 세션이라면 이미 세션id가 존재하므로 기존 세션id 동일하게 부여 - inactive 세션이라면 새로운 세션id 부여 - session_start_time & user_id로 session_id 식별자 수정 - schema 수정 - session_id 컬럼 추가
- airflow 실행 날짜 및 시간을 인자로 받아 경로 지정 - 에러 추적을 위해 print 명령어 추가
Quality Gate passedIssues Measures |
ds 및 hour 인자로 file path 동적으로 변경하였습니다. start_date 설정 및 backfill 부분까지 완료하였습니다. |
#4 아래와 같은 이유로 session_id 부여 로직 수정하였습니다.
로직 수정 사항
Airflow dag 개발
Airflow dag 개발 하였습니다. PR을 쪼개지 못한 점 양해부탁드립니다.
변경 사항