周回遅れでIT業界デビューしたプロジェクトマネージャーのブログ

就職氷河期にモロにぶち当たり、人生で混迷を極めた末にIT業界に安寧を見出そうとしているアラフォーの活動日記です。

Data Science

いま進めている勉強の途中経過をメモしておく

こんにちは。毎日ちょっとずつ勉強を進めているのですが、地道すぎて書くことがなくなりそうなので途中経過をメモしておきたいと思います。 数学 進めているのはこの本です。もう一度高校数学作者: 高橋一雄出版社/メーカー: 日本実業出版社発売日: 2009/07/…

データサイエンスのスキルチェックを受けて爆死した話

用事があってデータサイエンス協会のDSスキルチェックを受けてみました。www.datascientist.or.jp サイエンス力 エンジニアリング力 ビジネス力 の3つの観点からスキルチェックをするというもので、Yes/Noで設問に答えていくと最後にこんな感じで偏差値や順…

kaggle初心者向け。「5-Day Data Challenge」まとめ

5-Day Data Challengeって何? 2017年10月23日~27日にかけてkaggleで実施された、kaggle初心者向けのストリーミング講座です。 先生はどんな人? Rachael Tatman | KaggleKaggle TeamのRachael Tatman先生です。ストリーミングではかなりお茶目なトークを展…

kaggleぐるぐる 5-Day Data Challenge - Day 5

5日間のチャレンジの最後の日です。 1つの最後のタスク! 今日は何をしていますか? 異なるグループ間の観測数の違いはランダムな変化の結果だけですか?あるいは、それは2つのグループの根本的な違いを反映していますか?例えば、赤と緑のリンゴがあり、そ…

kaggleぐるぐる 5-Day Data Challenge - Day 4

4日目です。 一週間ってあっというま! いつものgoogle翻訳でお届けします。 すでに4日目、あなたはそれを信じることができますか?あなたはすべてそれにこだわった。 今日は何をしていますか? 今日では、数値データから抜け出し、カテゴリデータに変わりま…

kaggleぐるぐる 5-Day Data Challenge - Day 3

3日目です。 今日はt検定のお話です。にしてもgoogle先生……中途半端です、って。(面白いからそのまま) 半分まで来ました!ですよね。あはは。信じられますか?私たちはすでに中途半端です! 今日は何をしていますか? 今日、私たちは質問に答えるつもりで…

kaggleぐるぐる 5-Day Data Challenge - Day 2

2日目です。 今日も微妙なgoogle翻訳でお届けします。 ヒストグラムを描いてみましょう! 私はあなたが昨日の挑戦を楽しんだことを願っています。今日、私たちのデータを見ていきます。文字通り! 今日は何をしていますか? 今日では、ヒストグラムを使って…

kaggleぐるぐる 5-Day Data Challenge - Day 1

2017年10月23日から27日はkaggle週間! ということで5-Day Data Challengeにエントリーしました。毎日、やることを書いたメールが届いて、Live Streamもやってという感じです。 取り急ぎ案内のメールをgoogle翻訳にかけたのでぺたり。 訳が相変わらずちょっ…

kaggleぐるぐる(4) 0.80382になった!次元削減は大事

やりましたー! ランキングに輝く0.80382の文字。 0.80超えの目標達成できてうれしい! 上位13%だそうです。※2017/11/28追記:なんとTop10%入りしました!参加者が増えた模様。 特徴量作りでやったこと Cabinの頭文字で判別してみた → あんまり効果が無かっ…

kaggleぐるぐる(3) 現在0.78947。titanicの研究

現在0.78947 10/14現在、スコアは0.78947。 2828位/8603チーム参加まで来ました。上位33%といったところ。↓コードはこんな感じ。 github.com ここからさらに上を目指したい! 先輩の手法に学ぼう ものすごく参考になるkernelがあったので、コードと解説を…

kaggleぐるぐる(2) Titanic生存者問題にちょっとトライ

こんにちは。相変わらずUdacityのIntro to Machine Learningで勉強してます。 子供が小さいので朝5時半ぐらいに起きて7時半に奥さんが起きてくるまで勉強する日々です。折角勉強してるんだから、ちょっとは使ってみたいよね! ってことでちょこちょこkaggle…

kaggleぐるぐる(1) 入門の入門

せっかく機械学習の勉強をしたので、実際にデータ分析してみたい! ということで見つけたのがkaggleというサイト。やることは「与えられた問題とデータセットについて自分でコードを書いて分析して、正解率を上げよう!」 ……うん、シンプルです。 kaggleはこ…