周回遅れでIT業界デビューしたエンジニアのブログ

就職氷河期にモロにぶち当たり、人生で混迷を極めた末にIT業界に安寧を見出そうとしているアラフォーのお勉強日記です。

kaggle初心者向け。「5-Day Data Challenge」まとめ

5-Day Data Challengeって何?

2017年10月23日~27日にかけてkaggleで実施された、kaggle初心者向けのストリーミング講座です。

先生はどんな人?

f:id:sionff:20171028153229p:plain
Rachael Tatman | Kaggle

Kaggle TeamのRachael Tatman先生です。ストリーミングではかなりお茶目なトークを展開してくれます。初心者向けのデータセットも沢山作ってくれていて、お世話になった方も少なくないのでは。

概要教えて?

  • kaggle初心者向けに、データを読み込んだりグラフを表示する方法などについて解説していて、pandas(データ操作)とmatplotlibやseaborn(データ視覚化)のさわりについて学べます。
  • sklearnなど実際の機械学習のライブラリ類については言及していないので、チュートリアルコンペのtitanicに参加するなどして触つつ他の人のKernelを見るのがよいかも。
  • kaggleでコンペ出てるよ、視覚化も出来るよ、という人はまったく必要ないと思われます。それぐらいに入門向け。
  • データサイエンス的なものに手をつけてみたいけれど良く分からないどうすればいいんだ、みたいな人にお勧めしたい感じです。

参考にKernels見せて?

はい。こちらです。
3日目以降タイトルにPythonがついていませんが、中身は全部Pythonです。

まとめ

私としてはほぼ手付かずだった視覚化や基本的なデータ表示が学べたことと、統計の勉強をするべきと気が付いたという2点でためになりました。

Kernelsを公開するとRachael先生が「Nice work!」などいろいろコメントをくれるので、結構励みになります。海外の人ってこういうほめ方とかモチベーションの上げ方とか上手ですよね。見習いたい!