こんにちは。本日は、データサイエンス・機械学習を学ぶに当たって、これはぜひ読んでおくべき!と思う本を主観に基づいてご紹介したいと思います!
私自身も、アプリケーションエンジニアとしてキャリアを進めていたところから、1年間機械学習・データサイエンスを独学で学び、ようやくデータアナリティクスを本業にすることができました。まだまだ駆け出しですが、独学中に手に取った教材の中で個人的に良かったと思うものを紹介できればと思います。これから学習を始める方にお役に少しでも立てれば幸いです。
本記事は目的別に記載しておりますので、ご自身が特に身に付けたいと思っている領域を中心にみていただければと思います。それではまいります!
Contents
データサイエンスを学ぶ
オライリー:データサイエンス講義
統計学を学ぶ
東京大学出版会:統計学入門
こんな人にオススメ:-
コメント:こちらは、色々なブログなどで良本と紹介されている通称「赤本」です・・!
現在私も頑張って読んでいるところですので、読み終わったら更新しようと思います・・・!
データ分析に必要なPythonを学ぶ
マイナビ:東京大学のデータサイエンティスト育成講座
こんな人にオススメ:Pythonでデータ分析を行う時に必要になる各種処理の書き方や便利ライブラリを学んでおきたい人
コメント:こちらは、モデリングのもう少し前、データ分析の工程から丁寧に解説されています。データ分析で使うライブラリやPythonの処理を押さえておくのにはもってこいだと思います!
機械学習の理論を学ぶ
Coursera: Machine Learning
https://www.coursera.org/learn/machine-learning

こんな人にオススメ:機械学習アルゴリズムの理論を理解したい人
コメント:こちらは、Stanford大が提供する講義です。受講は無料で、最後に修了書を発行する際に8000円程度かかるのみです。GoogleのAndrew Ng先生による直接講義で、機械学習をこれから学ぶ方は必ず受けておくべきかと思います!
Deep Learningなども含めて網羅的に解説されています!
Deep Learningを学ぶ
オライリー:ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
こんな人にオススメ:ニューラルネットワーク、ディープラーニングの仕組みを理解したい人
コメント:
ディープラーニング学習初心者に大変オススメです。コードが豊富に載っており、自分でコードを真似して書きながら理解することができます。そして何より解説がとても分かりやすいです。
もっとも簡単な単層パーセプトロンから画像や音声認識で使われるCNNといった最新のディープラーニングまでしっかり解説されていますので、ディープラーニングって聞いたことあるけどどんな実装してるのか想像もつかない、といった人はこの本から始めるとしっかり全体感がつかめると思います。
オライリー:ゼロから作るDeep Learning2 自然言語処理編
こんな人にオススメ:Deep Learningで自然言語処理を行う仕組みを理解したい方
コメント:
こちらは、自然言語処理への応用に特化して書かれています。最新の手法に到るまでの技術変遷を、実装を含めてすごく丁寧に解説されていて、とても分かりやすいです。
機械学習モデル構築の実践スキルを学ぶ
オライリー:scikit-learnとTensorFlowによる実践機械学習
こんな人にオススメ:
データ分析・モデリングのためのライブラリ・コーディングを理解したい人
コメント:
こちらは、データサイエンス業務の中でもよりエンジニアリング寄りの工程のTipsが満載の本です。モデリングの際に注意すべきこと、実装のTipsなど、実務に直結する情報に溢れています。初めてデータサイエンスに取り組んでみる方は、前の「データサイエンス講義」を読んだ後に、この本をみながら進めていくと、非常に分かりやすいのではないかなと思いました。
下の特徴量エンジニアリングの本で紹介されている本よりも、モデル構築の全体プロセスに焦点を当てていて、アルゴリズム選定や、その理論も丁寧に解説されており、個人的にも大満足の本でした。
オライリー:機械学習のための特徴量エンジニアリング
こんな人にオススメ:より精度の高いモデルを作りたい方、特徴量エンジニアリングのベストプラクティスを知りたい方
コメント:
機械学習モデルを構築するときの、特徴量エンジニアリングのベストプラクティスを学べます。本のボリュームは他の本ほどはないですが、マストなポイントは抑えることができます!
Kaggleで勝つデータ分析の技術
こんな人にオススメ:モデルの精度を高めるためにもっと色々工夫してみたい人
コメント:こちらは、オライリーの特徴量エンジニアリングの本よりももう一歩踏み込んで、モデルの精度をさらに高めるための工夫がたくさん紹介されています。理論よりも、より実践にフォーカスした本で、いますぐ実践できるテクニックが満載でした!!
以上、私がこれまでに読んだ本の中からオススメなものをご紹介させていただきました!
これから読む本も随時更新していければと思います!
最後までご覧いただきありがとうございました!
こんな人にオススメ:データサイエンスって具体的に何をするの?をクリアにしたい人
コメント:
こちらは、データサイエンティストの業務を具体的にイメージしたい方が読むのに最適です。データサイエンティストの役割から、データサイエンティストが実際に必要とする統計・機械学習手法の知識が幅広く解説されているので、全体感が非常によく分かります。これからデータサイエンティストを目指す方はまず最初に読むことをオススメします!