캐글, ML/AI 실무자답게 접근하라!
국내 캐글 실력자 8명이 직접 설명하는 캐글 컴페티션,
어떻게 접근해 얼마나 노력하느냐에 따라 경험의 깊이가 달라진다.
국내 캐글 실력자 8명이 모였다. 직접 참가한 대회를 소개하고, 시작부터 제출까지 전 과정을 생생하게 담아 냈다. 자신의 솔루션을 소개하며 자신만의 팁과 노하우를 전하고, 우승팀/고득점팀의 아이디어와 솔루션도 추가로 소개함으로써 하나의 대회에서 가능한 많은, 풍부한 인사이트를 얻을 수 있도록 구성했다. 캐글의 특징과 기능은 물론 철학과 활용법, 캐글러의 마인드를 자세히 알려주는 1장을 시작으로, 이미지 데이터를 사용하는 컴페티션, 정형 데이터를 경험할 수 있는 컴페티션, 캐글의 TPU를 사용해 자연어 처리를 하는 컴페티션, 좋은 캐글 노트북을 작성하기 위한 가이드 등을 살펴보면서 좀더 깊이 있게 캐글을 경험하는 방법에 대해 숙고해 보자.
1장 Kaggle
__1.1 컴페티션
____1.1.1 컴페티션 파악
____1.1.2 컴페티션 선택
____1.1.3 컴페티션 종료
__1.2 초보 캐글러를 위한 컴페티션 시작 팁
____1.2.1 컴페티션이 어려운 이유
____1.2.2 컴페티션 시작
____1.2.3 컴페티션 점수에 대한 생각
__1.3 코드
____1.3.1 노트북
____1.3.2 클라우드 노트북
____1.3.3 Save Version
____1.3.4 공유
__1.4 데이터셋
____1.4.1 캐글 데이터셋
____1.4.2 데이터셋 생성
____1.4.3 데이터셋 활용
____1.4.4 공유
__1.5 디스커션
____1.5.1 디스커션 종류와 역할
____1.5.2 Thanks for sharing!
__1.6 More
____1.6.1 Progression System
____1.6.2 Learn
__1.7 이제 캐글의 세계로
2장 Instant Gratification
__2.1 들어가기 전에
____2.1.1 캐글 프로필: 김연민
____2.1.2 코드
__2.2 Overview
____2.2.1 대회 목적
____2.2.2 평가 지표
____2.2.3 데이터 소개
__2.3 솔루션 소개
____2.3.1 Overview
____2.3.2 EDA
____2.3.3 스태킹
____2.3.4 솔루션 상세
____2.3.5 제출 전략
__2.4 디스커션
3장 IEEE-CIS Fraud Detection
__3.1 들어가기 전에
____3.1.1 캐글 프로필: 김현우
____3.1.2 캐글 프로필: 정성훈
____3.1.3 코드
__3.2 Overview
____3.2.1 대회 목적
____3.2.2 평가 지표
____3.2.3 데이터 소개
__3.3 솔루션 소개
____3.3.1 Overview
____3.3.2 EDA
____3.3.3 피처 엔지니어링
____3.3.4 모델링
__3.4 다른 솔루션 소개
____3.4.1 Overview
____3.4.2 EDA
____3.4.3 피처 엔지니어링
____3.4.4 피처 선택
____3.4.5 모델링
__3.5 디스커션
4장 Quick, Draw! Doodle Recognition
__4.1 들어가기 전에
____4.1.1 캐글 프로필: 명대우
____4.1.2 코드
__4.2 Overview
____4.2.1 대회 목적
____4.2.2 평가 지표
__4.3 솔루션
____4.3.1 EDA
____4.3.2 데이터 전처리
____4.3.3 데이터 생성
____4.3.4 모델링
____4.3.5 앙상블
__4.4 다른 솔루션 소개
__4.5 디스커션
5장 Bengali.AI Handwritten Grapheme Classification
__5.1 들어가기 전에
____5.1.1 캐글 프로필: 이유한
____5.1.2 코드
__5.2 Overview
____5.2.1 대회 목적
____5.2.2 평가 지표
____5.2.3 데이터 소개
__5.3 솔루션 소개
____5.3.1 검증 전략 설정
____5.3.2 학습 전 전처리
____5.3.3 데이터셋 만들기
____5.3.4 학습
____5.3.5 데이터 증강
____5.3.6 수도 레이블링
____5.3.7 앙상블
__5.4 다른 솔루션 소개
____5.4.1 1등 솔루션
____5.4.2 2등 솔루션
__5.5 디스커션
____5.5.1 Tips
____5.5.2 후기
6장 SIIM-ACR Pneumothorax Segmentation
__6.1 들어가기 전에
____6.1.1 캐글 프로필: 권순환
____6.1.2 코드
__6.2 Overview
____6.2.1 대회 목적
____6.2.2 평가 지표
____6.2.3 데이터 소개
__6.3 솔루션 소개
____6.3.1 Object Detection, Instance/Semantic Segmentation
____6.3.2 U-Net
____6.3.3 하이퍼컬럼
____6.3.4 fast.ai 프레임워크
____6.3.5 손실 함수 정의
____6.3.6 Cyclic Learning Rates
____6.3.7 데이터 증강
____6.3.8 경량화의 중요성
____6.3.9 전체 정리
__6.4 다른 솔루션 소개
____6.4.1 Model
____6.4.2 Fast Prototyping(Uptrain)
____6.4.3 Combo loss
____6.4.4 세 개의 임곗값 활용
__6.5 디스커션
7장 Jigsaw Unintended Bias in Toxicity Classification
__7.1 들어가기 전에
____7.1.1 캐글 프로필: 김태진
____7.1.2 코드
__7.2 Overview
____7.2.1 대회 목적
____7.2.2 평가 지표
____7.2.3 데이터 소개
__7.3 EDA
__7.4 솔루션 소개(텐서플로, TPU)
____7.4.1 전처리
____7.4.2 모델
____7.4.3 토큰화
____7.4.4 TPU
____7.4.5 TFRecord
____7.4.6 학습 with TPU
____7.4.7 서브미션 노트북 만들기
____7.4.8 결과 제출
__7.5 솔루션 소개(Ours)
__7.6 솔루션 소개(2nd Prize)
__7.7 디스커션
8장 캐글 노트북 작성을 위한 팁
__8.1 들어가기 전에
____8.1.1 캐글 프로필: 안수빈
____8.1.2 코드
____8.1.3 8장에 대하여
__8.2 각 타입별 노트북과 작성 팁
____8.2.1 EDA
____8.2.2 전처리
____8.2.3 파이프라인
____8.2.4 고득점 노트북
____8.2.5 튜토리얼
____8.2.6 My First Notebook
__8.3 좋은 노트북을 위한 가이드라인
____8.3.1 시각화
____8.3.2 재사용성
____8.3.3 가독성
____8.3.4 SEO
____8.3.5 홍보
____8.3.6 출처
__8.4 맺음말
찾아보기
ㆍ지은이 김태진
ㆍ지은이 권순환
ㆍ지은이 김연민
ㆍ지은이 김현우
ㆍ지은이 명대우
ㆍ지은이 안수빈
ㆍ지은이 이유한
ㆍ지은이 정성훈
안녕하세요. 길벗 출판사입니다.
이 책은 길벗 홈페이지나 길벗 깃허브에서 예제 파일을 제공하지 않습니다.
(도서 9p에 안내된 내용 참고하시기 바랍니다)
각 장의 코드는 저자의 캐글 노트북이나 깃허브로 제공되며,
제공 링크는 각 장마다 앞부분에 안내하고 있으니, 책을 참고하여 이용 부탁드립니다.
감사합니다.
독자의견 남기기