kaggle初心者向け。「5-Day Data Challenge」まとめ
5-Day Data Challengeって何?
2017年10月23日~27日にかけてkaggleで実施された、kaggle初心者向けのストリーミング講座です。
先生はどんな人?
Kaggle TeamのRachael Tatman先生です。ストリーミングではかなりお茶目なトークを展開してくれます。初心者向けのデータセットも沢山作ってくれていて、お世話になった方も少なくないのでは。
概要教えて?
- kaggle初心者向けに、データを読み込んだりグラフを表示する方法などについて解説していて、pandas(データ操作)とmatplotlibやseaborn(データ視覚化)のさわりについて学べます。
- sklearnなど実際の機械学習のライブラリ類については言及していないので、チュートリアルコンペのtitanicに参加するなどして触つつ他の人のKernelを見るのがよいかも。
- kaggleでコンペ出てるよ、視覚化も出来るよ、という人はまったく必要ないと思われます。それぐらいに入門向け。
- データサイエンス的なものに手をつけてみたいけれど良く分からないどうすればいいんだ、みたいな人にお勧めしたい感じです。
どんなカリキュラム?
Rachael先生から期間中毎日メールが届いていました。
(もちろん原文は英語ですので、いちおうgoogle翻訳で日本語化しておきました)
参考にKernels見せて?
まとめ
私としてはほぼ手付かずだった視覚化や基本的なデータ表示が学べたことと、統計の勉強をするべきと気が付いたという2点でためになりました。
Kernelsを公開するとRachael先生が「Nice work!」などいろいろコメントをくれるので、結構励みになります。海外の人ってこういうほめ方とかモチベーションの上げ方とか上手ですよね。見習いたい!