周回遅れでIT業界デビューしたエンジニアのブログ

就職氷河期にモロにぶち当たり、人生で混迷を極めた末にIT業界に安寧を見出そうとしているアラフォーのお勉強日記です。

Python

「言語処理100ノック2015」をPythonで練習(No.10~19)

www.cl.ecei.tohoku.ac.jp第2章: UNIXコマンドの基礎(No.10~19)です。 ただし、Pythonのコード部分のみです。UNIXコマンドはやっていません。以下を出来るだけ意識して書いています。 内包表記を使う 関数化する 一般化する 今回は関数化を結構頑張りまし…

「言語処理100ノック2015」をPythonで練習(No.0~9)

自然言語処理の練習をあまりやってこなかったので、空いた時間を見つけてはちょこちょこコードを書いています。機械学習なりお手伝いAIなりを実装していくのに使いますしね!今回は足慣らし。第1章: 準備運動(No.0~9)です。以下を出来るだけ意識して書い…

Pythonでブロックチェーンに入門。コードを書いてみた

あけましておめでとうございます。 今年もよろしくお願いいたします! ブロックチェーンに入門 なんだかスゴいらしい!と前から気になってはいたものの、実際にどんなものかはよく知らなかったので、手を動かしてみることにしました。まずは事前のインプット…

Pythonでfor文とlambdaの書き方&速度を比較してみた

こんにちは。もうそろそろ一年も終わりですね。 私はいろいろ環境が激変した年でした。 皆様にとっては、今年はどんな年でしたか? Pythonでlambdaを使おう できるだけ簡潔で高速なコードを書けるようになりたくて、lambdaをおさらいしました。そこで、まず…

Pythonで素数のリストを作ろう

こんにちは。今年もあと10日ちょっとになってしまいました。 年賀状書きました? 私はこれからです。 素数大富豪って何? ネットで面白そうなものを見つけたんですよ。 www.ajimatics.com「カードの切り方が素数」のトランプゲーム「大富豪」だとか。107なん…

Pythonの内包表記を覚えよう ~入門編~

こんにちは。今日も寒い! Python使いにはどえらいニュースが舞い込んできました www.publickey1.jpもうVBA全部やめちゃってPythonに切り替えてくれてもいいんだよ……! 内包表記のお話 閑話休題。Pythonの内包表記です。はじめPythonを勉強していた時、[]で…

Pythonの基礎固め。それでも「初めてのPython」を選んだ理由

私の勉強時間はおもに2つ。朝の朝食前と、会社の昼休みです。 朝はCouseraやUdacityのビデオ講義のような、比較的重たいもの 昼休みはテキストのような、比較的軽いもの という分け方をしていて、今のところ昼休みはPythonのおさらいをしています。※11/24追…

kaggleぐるぐる 5-Day Data Challenge - Day 5

5日間のチャレンジの最後の日です。 1つの最後のタスク! 今日は何をしていますか? 異なるグループ間の観測数の違いはランダムな変化の結果だけですか?あるいは、それは2つのグループの根本的な違いを反映していますか?例えば、赤と緑のリンゴがあり、そ…

kaggleぐるぐる 5-Day Data Challenge - Day 4

4日目です。 一週間ってあっというま! いつものgoogle翻訳でお届けします。 すでに4日目、あなたはそれを信じることができますか?あなたはすべてそれにこだわった。 今日は何をしていますか? 今日では、数値データから抜け出し、カテゴリデータに変わりま…

kaggleぐるぐる 5-Day Data Challenge - Day 3

3日目です。 今日はt検定のお話です。にしてもgoogle先生……中途半端です、って。(面白いからそのまま) 半分まで来ました!ですよね。あはは。信じられますか?私たちはすでに中途半端です! 今日は何をしていますか? 今日、私たちは質問に答えるつもりで…

kaggleぐるぐる 5-Day Data Challenge - Day 2

2日目です。 今日も微妙なgoogle翻訳でお届けします。 ヒストグラムを描いてみましょう! 私はあなたが昨日の挑戦を楽しんだことを願っています。今日、私たちのデータを見ていきます。文字通り! 今日は何をしていますか? 今日では、ヒストグラムを使って…

kaggleぐるぐる 5-Day Data Challenge - Day 1

2017年10月23日から27日はkaggle週間! ということで5-Day Data Challengeにエントリーしました。毎日、やることを書いたメールが届いて、Live Streamもやってという感じです。 取り急ぎ案内のメールをgoogle翻訳にかけたのでぺたり。 訳が相変わらずちょっ…

Python dictのkeyとitemを全て取得する(Python2)

勉強中に詰まった話 udacityの「Intro to Machine Learning」で勉強している途中、Lesson 9の22でちょっと詰まりました。エンロン社の不正にかかわった人物が行使したストックオプションの最大値と最低値を検出する問題なんですけれど…… データが入っているd…

kaggleぐるぐる(4) 0.80382になった!次元削減は大事

やりましたー! ランキングに輝く0.80382の文字。 0.80超えの目標達成できてうれしい! 上位13%だそうです。※2017/11/28追記:なんとTop10%入りしました!参加者が増えた模様。 特徴量作りでやったこと Cabinの頭文字で判別してみた → あんまり効果が無かっ…

kaggleぐるぐる(3) 現在0.78947。titanicの研究

現在0.78947 10/14現在、スコアは0.78947。 2828位/8603チーム参加まで来ました。上位33%といったところ。↓コードはこんな感じ。 github.com ここからさらに上を目指したい! 先輩の手法に学ぼう ものすごく参考になるkernelがあったので、コードと解説を…

irisのデータをもとに可視化したり単回帰したり

機械学習界隈では超有名なiris(あやめ)のcsvデータを使って、可視化の練習をしました。GitHubはこちら。 https://github.com/sion-learning/Study/blob/master/iris_training/iris_visualize.ipynb参考にしたのは「データサイエンティスト養成読本 改訂2版…

kaggleぐるぐる(2) Titanic生存者問題にちょっとトライ

こんにちは。相変わらずUdacityのIntro to Machine Learningで勉強してます。 子供が小さいので朝5時半ぐらいに起きて7時半に奥さんが起きてくるまで勉強する日々です。折角勉強してるんだから、ちょっとは使ってみたいよね! ってことでちょこちょこkaggle…

Python 2系と3系を使い分ける環境をつくる

Udacityのpython実習が2系なので、必要に応じて使い分けられる体制をつくりたい!と思って探していたら見つけたのがこちらのブログ。素晴らしいほどにフィット。PENGUINITIS - Anaconda における Python 2 と Python 3 の共存 活用させていただきます。あり…

Udacity「Intro to Machine Learning」で機械学習のおさらい

courseraで習った理論関係をpythonで実装していくために「基本的なことをおさらいしよう」編として始めました。オープニングでワイン傾けてるのは何なの???とか思いながら受講スタート。先生2人の掛け合いが中々アメリカンで、撮影場所も街中だったり車の…

Python リストで文字列と数字が混在する場合の扱い

自分メモ。この方法だと、文字列と数字が混在した時に文字列を除外しつつ数字をint化できる。ラクチン。 内包表記でリスト作成 # coding: utf-8 str_a = ["s"] int_a = [str(x) for x in range(5)] list = str_a + int_a print(list) # -> ['s', '0', '1', '…

Pythonで書いたコードをリファクタリング

最近モヤモヤしていること。 1. python自体の理解不足 python案件の仕事でサブシステム1つ担当して実装して単体テスト通すくらいはできるけれど、そもそもその実装がpythonに合った書き方をしているか、効率的に書けているかどうかというのは怪しいわけで。 …

kaggleぐるぐる(1) 入門の入門

せっかく機械学習の勉強をしたので、実際にデータ分析してみたい! ということで見つけたのがkaggleというサイト。やることは「与えられた問題とデータセットについて自分でコードを書いて分析して、正解率を上げよう!」 ……うん、シンプルです。 kaggleはこ…

courseraのMachine LearningをPythonで復習。リンク集

というわけで、Octaveでの演習をPythonに置き換えて復習です。自分メモなので中の人の勉強が進むと加筆するかもしれません。 参考にさせていただいているサイト Qiita@nokomitchさんex1(線形回帰)ex2(ロジスティック回帰)ex3(ロジスティック回帰で手書…

Pythonで定数定義

pythonは定数が作れないようなのですが、それでも必要な時ってあるようなぁと探したらありました。が、python2対応なので使えない部分がちらほら……。 python3対応に書き直したのでメモ。 # coding: utf-8import sysclass SetConstant(): class ConstError(Ty…