Click Through Rate Prediction
Kaggle
Avazu - Predict whether a mobile ad will be clicked
https://www.kaggle.com/c/avazu-ctr-prediction
Data
https://www.kaggle.com/c/avazu-ctr-prediction/data 에서 제공하는 test.gz, train.gz 파일을 내려받는다.
train.gz 파일의 크기는 1.12GB 이다.
4 Idiots' Solution & LIBFFM
https://www.kaggle.com/c/avazu-ctr-prediction/discussion/12608
Beat the benchmark with less than 1MB of memory
https://www.kaggle.com/c/avazu-ctr-prediction/discussion/10927
논문, 구현체
https://www.csie.ntu.edu.tw/~cjlin/libffm/
https://github.com/guestwalk/kaggle-avazu
CriteoLabs - Display Advertising Challenge
https://www.kaggle.com/c/criteo-display-ad-challenge
Data
kaggle 의 data 페이지에서 제공하는 data download link 는 깨어져 있다. CriteoLab 홈페이지에서 다운로드 받을 수 있는 링크는 다음과 같다.
- http://labs.criteo.com/2014/02/download-kaggle-display-advertising-challenge-dataset/
- https://s3-eu-west-1.amazonaws.com/criteo-labs/dac.tar.gz 위 labs.criteo.com 페이지에서 연결된 실제 다운로드 링크
위의 링크에서 제공하는 dac.tar.gz 파일은 약 4GB 의 크기이다. 인터넷을 통해 내려받는데 속도가 느려 시간이 10시간 이상 걸릴 수 있다.
https://jkkim.me/kaggle/dac.tar.gz - 내려받아 놓은 파일
md5sum 확인용
Beat the benchmark with less than 200MB of memory
https://www.kaggle.com/c/criteo-display-ad-challenge/discussion/10322
https://github.com/guestwalk/kaggle-2014-criteo
https://www.csie.ntu.edu.tw/~r01922136/kaggle-2014-criteo.pdf