Skip to content

AIFFEL-GN-2nd/CatchingDudeoji

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CatchingDudeoji

가까이 하기에는 너무 두꺼운 두더지책! 함께 잡아봅시다 👊👊
함께 두더지 잡으실 분 상시모집 중 ⚒️


🔨 스터디 소개

👍 스터디명 두더지 잡기
📚 교재 파이썬 라이브러리를 활용한 데이터 분석
시간 매일 오후 8시
📆 날짜 7월 19일(월)부터 책을 끝내는 날까지!
🙋 스터디원 모집기간 7월 15일~7월 16일(스터디 시작 이후로는 상시모집)
👾 노션 페이지 https://sunrise-octagon-91e.notion.site/8b0734caa7a34f0687ff05f40e1d0c39

파이썬 라이브러리를 활용한 데이터 분석 책의 CHAPTER4부터 부록까지의 내용을 함께 공부하는 스터디입니다. Numpy/Pandas/Matplotlib의 용법을 정리하고 이를 활용하여 기본적인 데이터 분석법을 공부하시고 싶은 분들과 함께 하고 싶습니다.


🔨 스터디 진행방식

  1. 한명의 발표자가 정해진 분량만큼의 발표를 진행하고 질의응답 시간을 가집니다.
  2. 발표자료를 출판사에서 제공되는 소스코드를 사용합니다.
    1. 발표자는 해당 소스코드에 주석을 달아오고 그 내용으로 발표를 진행합니다.
    2. 발표자는 발표자료를 스터디 시작 이전에 깃허브에 업로드 하여야 합니다.
  3. 진도는 매일 10~20페이지 가량으로 한시간 안에 스터디가 끝나는 것이 목표 입니다.

🔨 스터디 자료

🕵️ 교재 파이썬 라이브러리를 활용한 데이터 분석 (2판) - YES24
🕵️ 게더타운 노션 참고
🕵️ 소스코드 - 깃허브 wesm/pydata-book
🕵️ 소스코드 - 코랩 Google Colaboratory
🕵️ 깃허브 github
🕵️ datasets google drive
🕵️ examples google drive


🔨 커리큘럼

👼 커리큘럼은 하루에 스터디 시간이 한시간이 넘지 않도록 유동적으로 조정하고 있습니다.
👼 커리큘럼은 스터디의 상황에 따라 유동적으로 변할 수 있습니다.
👼 커리큘럼은 순차적으로 업데이트 됩니다.

✨ CHAPTER 4 NumPy 기본: 배열과 벡터 연산
날짜 챕터 페이지 발표자 발표자료
07월 19일 4.1 NumPy ndarray: 다차원 배열 객체 135~157 정수희 🔗
07월 20일 4.2 유니버설 함수: 배열의 각 원소를 빠르게 처리하는 함수 158~161 김인유 🔗
07월 20일 4.3 배열을 이용한 배열지향 프로그래밍 161~171 김인유 🔗
07월 21일 4.4 배열 데이터의 파일 입출력 171~171 김영협 🔗
07월 21일 4.5 선형대수 172~174 김영협 🔗
07월 21일 4.6 난수 생성 174~176 김영협 🔗
07월 21일 4.7 계단 오르내리기 예제 176~180 김영협 🔗
✨ CHAPTER 5 pandas 시작하기
날짜 챕터 페이지 발표자 발표자료
07월 22일 5.1 pandas 자료구조 소개 181~197 손진아 🔗
07월 23일 5.2 핵심 기능 (1) 198~210 김은서 🔗
07월 26일 5.2 핵심 기능 (2) 210~225 손지우 🔗
07월 27일 5.3 기술 통계 계산과 요약 226~235 최병휘 🔗
✨ CHAPTER 6 데이터 로딩과 저장, 파일 형식
날짜 챕터 페이지 발표자 발표자료
07월 28일 6.1 텍스트 파일에서 데이터를 읽고 쓰는 법 237~257 강지윤 🔗
07월 29일 6.2 이진 데이터 형식 258~263 우범진 🔗
07월 29일 6.3 웹 API와 함께 사용하기 263~264 우범진 🔗
07월 29일 6.4 데이터베이스와 함께 사용하기 264~267 우범진 🔗
✨ CHAPTER 7 데이터 정제 및 준비
날짜 챕터 페이지 발표자 발표자료
07월 30일 7.1 누락된 데이터 처리하기 269~276 이지수 🔗
08월 02일 7.2 데이터 변형 277~295 정태호 🔗
08월 03일 7.3 문자열 다루기 296~306 김민경 🔗
✨ CHAPTER 8 데이터 준비하기: 조인, 병합, 변형
날짜 챕터 페이지 발표자 발표자료
08월 09일 8.1 계층적 색인 307~314 정수희 🔗
08월 10일 8.2 데이터 합치기 315~334 전지은 🔗
08월 11일 8.3 재형성과 피벗 334~345 윤세휘 🔗
✨ CHAPTER 9 그래프와 시각화
날짜 챕터 페이지 발표자 발표자료
08월 12일 9.1 matplotlib API 간략하게 살펴보기 347~365 강지윤 🔗
08월 13일 9.2 pandas에서 seaborn으로 그래프 그리기 365~382 손진아 🔗
08월 13일 9.3 다른 파이썬 시각화 도구 382~383 손진아 🔗
✨ CHAPTER 10 데이터 집계와 그룹 연산
날짜 챕터 페이지 발표자 발표자료
08월 17일 10.1 GroupBy 메카닉 385~396 박기민 🔗
08월 17일 10.2 데이터 집계 396~403 박기민 🔗
08월 18일 10.3 Apply: 일반적인 분리-적용-병합 403~417 안형준 🔗
08월 18일 10.4 피벗테이블과 교차일람표 418~422 안형준 🔗
✨ CHAPTER 11 시계열
날짜 챕터 페이지 발표자 발표자료
08월 19일 11.1 날짜, 시간 자료형, 도구 423~428 🔗
08월 19일 11.2 시계열 기초 428~435 🔗
08월 19일 11.3 날짜 범위, 빈도, 이동 436~445 🔗
08월 20일 11.4 시간대 다루기 445~451 🔗
08월 20일 11.5 기간과 기간 연산 451~462 🔗
08월 23일 11.6 리샘플링과 빈도 변환 462~471 🔗
08월 23일 11.7 이동창 함수 471~479 🔗
✨ CHAPTER 12 고급 pandas
날짜 챕터 페이지 발표자 발표자료
8월 24일 12.1 Categorical 데이터 481~493 🔗
8월 25일 12.2 고급 GroupBy 사용 493~501 김은서 🔗
8월 25일 12.3 메서드 연결 기법 501~504 김은서 🔗
✨ CHAPTER 13 파이썬 모델링 라이브러리
날짜 챕터 페이지 발표자 발표자료
8월 25일 13.1 pandas와 모델 코드의 인터페이스 505~509 김은서 🔗
8월 26일 13.2 Patsy를 이용해서 모델 생성하기 509~517 우범진 🔗
8월 26일 13.3 statsmodels 소개 518~523 우범진 🔗
8월 26일 13.4 scikit-learn 소개 523~528 우범진 🔗
✨ CHAPTER 14 데이터 분석 예제
날짜 챕터 페이지 발표자 발표자료
8월 27일 14.1 Bit.ly의 1.USA.gov 데이터 529~542 김영협 🔗
8월 27일 14.2 MovieLens의 영화 평점 데이터 542~550 이지수 🔗
8월 27일 14.3 신생아 이름 550~567 🔗
8월 27일 14.4 미국농무부 영양소 정보 567~574 김민경 🔗
8월 27일 14.5 2012년 연방선거관리위원회 데이터베이스 574~585 전지은 🔗
✨ APPENDIX A 고급 NumPy
날짜 챕터 페이지 발표자 발표자료
8월 30일 A.1 ndarray 객체 구조 587~590 윤세휘 🔗
8월 30일 A.2 고급 배열 조작 기법 590~600 윤세휘 🔗
8월 30일 A.3 브로드캐스팅 600~607 윤세휘 🔗
8월 31일 A.4 고급 ufunc 사용법. 607~611 🔗
8월 31일 A.5 구조화된 배열과 레코드 배열 612~614 🔗
8월 31일 A.6 정렬에 관하여 614~621 🔗
8월 31일 A.7 umba를 이용하여 빠른 NumPy 함수 작성하기 622~626 🔗
8월 31일 A.8 고급 배열 입출력 626~629 🔗

  • 본 저장소의 파일들은 wesm/pydata-book의 내용을 수정한 것임을 밝힙니다.