周回遅れでIT業界デビューしたプロジェクトマネージャーのブログ

就職氷河期にモロにぶち当たり、人生で混迷を極めた末にIT業界に安寧を見出そうとしているアラフォーの活動日記です。

2017-10-01から1ヶ月間の記事一覧

kaggle初心者向け。「5-Day Data Challenge」まとめ

5-Day Data Challengeって何? 2017年10月23日~27日にかけてkaggleで実施された、kaggle初心者向けのストリーミング講座です。 先生はどんな人? Rachael Tatman | KaggleKaggle TeamのRachael Tatman先生です。ストリーミングではかなりお茶目なトークを展…

kaggleぐるぐる 5-Day Data Challenge - Day 5

5日間のチャレンジの最後の日です。 1つの最後のタスク! 今日は何をしていますか? 異なるグループ間の観測数の違いはランダムな変化の結果だけですか?あるいは、それは2つのグループの根本的な違いを反映していますか?例えば、赤と緑のリンゴがあり、そ…

kaggleぐるぐる 5-Day Data Challenge - Day 4

4日目です。 一週間ってあっというま! いつものgoogle翻訳でお届けします。 すでに4日目、あなたはそれを信じることができますか?あなたはすべてそれにこだわった。 今日は何をしていますか? 今日では、数値データから抜け出し、カテゴリデータに変わりま…

kaggleぐるぐる 5-Day Data Challenge - Day 3

3日目です。 今日はt検定のお話です。にしてもgoogle先生……中途半端です、って。(面白いからそのまま) 半分まで来ました!ですよね。あはは。信じられますか?私たちはすでに中途半端です! 今日は何をしていますか? 今日、私たちは質問に答えるつもりで…

kaggleぐるぐる 5-Day Data Challenge - Day 2

2日目です。 今日も微妙なgoogle翻訳でお届けします。 ヒストグラムを描いてみましょう! 私はあなたが昨日の挑戦を楽しんだことを願っています。今日、私たちのデータを見ていきます。文字通り! 今日は何をしていますか? 今日では、ヒストグラムを使って…

kaggleぐるぐる 5-Day Data Challenge - Day 1

2017年10月23日から27日はkaggle週間! ということで5-Day Data Challengeにエントリーしました。毎日、やることを書いたメールが届いて、Live Streamもやってという感じです。 取り急ぎ案内のメールをgoogle翻訳にかけたのでぺたり。 訳が相変わらずちょっ…

Python dictのkeyとitemを全て取得する(Python2)

勉強中に詰まった話 udacityの「Intro to Machine Learning」で勉強している途中、Lesson 9の22でちょっと詰まりました。エンロン社の不正にかかわった人物が行使したストックオプションの最大値と最低値を検出する問題なんですけれど…… データが入っているd…

アメリカの大学院に行くのってどうなの?行けるの?

ITの実務をしていると、情報系の大学などで勉強してきた方とではベースの違いを感じさせられます。 海外の大学院はどうだろう そんな中、こちらのブログを拝見しました。大学院に行きたいと思いながらこの年になってしまったのですが、海外留学がもし出来た…

kaggleぐるぐる(4) 0.80382になった!次元削減は大事

やりましたー! ランキングに輝く0.80382の文字。 0.80超えの目標達成できてうれしい! 上位13%だそうです。※2017/11/28追記:なんとTop10%入りしました!参加者が増えた模様。 特徴量作りでやったこと Cabinの頭文字で判別してみた → あんまり効果が無かっ…

kaggleぐるぐる(3) 現在0.78947。titanicの研究

現在0.78947 10/14現在、スコアは0.78947。 2828位/8603チーム参加まで来ました。上位33%といったところ。↓コードはこんな感じ。 github.com ここからさらに上を目指したい! 先輩の手法に学ぼう ものすごく参考になるkernelがあったので、コードと解説を…

irisのデータをもとに可視化したり単回帰したり

機械学習界隈では超有名なiris(あやめ)のcsvデータを使って、可視化の練習をしました。GitHubはこちら。 https://github.com/sion-learning/Study/blob/master/iris_training/iris_visualize.ipynb参考にしたのは「データサイエンティスト養成読本 改訂2版…

kaggleぐるぐる(2) Titanic生存者問題にちょっとトライ

こんにちは。相変わらずUdacityのIntro to Machine Learningで勉強してます。 子供が小さいので朝5時半ぐらいに起きて7時半に奥さんが起きてくるまで勉強する日々です。折角勉強してるんだから、ちょっとは使ってみたいよね! ってことでちょこちょこkaggle…