2017-10-01から1ヶ月間の記事一覧
5-Day Data Challengeって何? 2017年10月23日~27日にかけてkaggleで実施された、kaggle初心者向けのストリーミング講座です。 先生はどんな人? Rachael Tatman | KaggleKaggle TeamのRachael Tatman先生です。ストリーミングではかなりお茶目なトークを展…
5日間のチャレンジの最後の日です。 1つの最後のタスク! 今日は何をしていますか? 異なるグループ間の観測数の違いはランダムな変化の結果だけですか?あるいは、それは2つのグループの根本的な違いを反映していますか?例えば、赤と緑のリンゴがあり、そ…
4日目です。 一週間ってあっというま! いつものgoogle翻訳でお届けします。 すでに4日目、あなたはそれを信じることができますか?あなたはすべてそれにこだわった。 今日は何をしていますか? 今日では、数値データから抜け出し、カテゴリデータに変わりま…
3日目です。 今日はt検定のお話です。にしてもgoogle先生……中途半端です、って。(面白いからそのまま) 半分まで来ました!ですよね。あはは。信じられますか?私たちはすでに中途半端です! 今日は何をしていますか? 今日、私たちは質問に答えるつもりで…
2日目です。 今日も微妙なgoogle翻訳でお届けします。 ヒストグラムを描いてみましょう! 私はあなたが昨日の挑戦を楽しんだことを願っています。今日、私たちのデータを見ていきます。文字通り! 今日は何をしていますか? 今日では、ヒストグラムを使って…
2017年10月23日から27日はkaggle週間! ということで5-Day Data Challengeにエントリーしました。毎日、やることを書いたメールが届いて、Live Streamもやってという感じです。 取り急ぎ案内のメールをgoogle翻訳にかけたのでぺたり。 訳が相変わらずちょっ…
勉強中に詰まった話 udacityの「Intro to Machine Learning」で勉強している途中、Lesson 9の22でちょっと詰まりました。エンロン社の不正にかかわった人物が行使したストックオプションの最大値と最低値を検出する問題なんですけれど…… データが入っているd…
ITの実務をしていると、情報系の大学などで勉強してきた方とではベースの違いを感じさせられます。 海外の大学院はどうだろう そんな中、こちらのブログを拝見しました。大学院に行きたいと思いながらこの年になってしまったのですが、海外留学がもし出来た…
やりましたー! ランキングに輝く0.80382の文字。 0.80超えの目標達成できてうれしい! 上位13%だそうです。※2017/11/28追記:なんとTop10%入りしました!参加者が増えた模様。 特徴量作りでやったこと Cabinの頭文字で判別してみた → あんまり効果が無かっ…
現在0.78947 10/14現在、スコアは0.78947。 2828位/8603チーム参加まで来ました。上位33%といったところ。↓コードはこんな感じ。 github.com ここからさらに上を目指したい! 先輩の手法に学ぼう ものすごく参考になるkernelがあったので、コードと解説を…
機械学習界隈では超有名なiris(あやめ)のcsvデータを使って、可視化の練習をしました。GitHubはこちら。 https://github.com/sion-learning/Study/blob/master/iris_training/iris_visualize.ipynb参考にしたのは「データサイエンティスト養成読本 改訂2版…
こんにちは。相変わらずUdacityのIntro to Machine Learningで勉強してます。 子供が小さいので朝5時半ぐらいに起きて7時半に奥さんが起きてくるまで勉強する日々です。折角勉強してるんだから、ちょっとは使ってみたいよね! ってことでちょこちょこkaggle…