10分でできる!Anacondaで機械学習・データ分析環境構築

こんにちは。本日はローカル環境に機械学習環境を構築する手順を整理します。
10分でやってしまいましょう!ということなのでもうサクサクと手順を説明していきます!

また、これから説明する手順はMac/Windowsともに共通フローです。

1、Anaconda3のインストール

作業時間をこんなにも短くできる理由はこのAnaconda3というツールにあります。

簡単に言うと、機械学習・データ分析に必要なプログラミング言語、開発エディタ、拡張ライブラリなどをごっそり入れてくれるツールです。なので事前準備も要りません。Python? R? PCに何も入っていなくても大丈夫です。Anaconda3が全てセットアップしてくれます。

下記のサイトでAnacondaをダウンロードしましょう。Python3系とPython2系の2種類が配布されていますが、機械学習・データ分析をされる方はPython3にしてください。Python3とPython2では利用できるライブラリなどがガラっと変わりますので。

ダウンロードしたら、インストールします。すべてデフォルトの設定で大丈夫です。

はい、これで90%の作業が終わりました笑

2、PythonとJupyterNotebookの動作確認

インストールが終わったらPythonのエディタを開いて動作確認してみます。AnacondaではデフォルトでJupyter Notebookというコードエディタがインストールされていますので、そちらを使います。

Anacondaの操作はUIから行うか、コマンドプロンプトから実施するのですが、私はコマンドプロンプトから実施する派なのでそちらで説明します。(UIは若干重いので・・・)

PCのメニューからAnaconda Promptを探します。これは、通常のコマンドプロンプトと機能や使い方としては変わらないのですが、Anacondaのルートディレクトリをデフォルトで開くような設定になっており、Anacondaのコマンドのパスが読み込まれているため、ここからすぐにAnacondaのコマンドを打てます。

(もちろんWindows/Macデフォルトのターミナルでも、PATHの設定をすればAnacondaのコマンドが打てるように、まったく同じ使い方ができます。)

Anaconda Promptが開いたら、

“jupyter lab”

と打ってみてください。説明を飛ばしましたが、JupyterにはJupyter NotebookとJupyter Labという2種類のUIが提供されています。どちらでも基本機能は同じなのでどちらを使うかは好みで良いのですが、個人的には、Jupyterの拡張ライブラリの豊富さ、UIの見やすさからJupyter Labを好んで使っています。

Jupyter Notebookを使いたい場合は、”jupyter notebook”と打てば開きます。簡単ですね。。。

以下がJupyter Labのトップ画面になります。
ここで、Notebook>Python3を選択します。AnacondaにはEnvironmentという概念があり、Environment毎に利用するPythonバージョン、ライブラリなどを使い分けることができます。デフォルトではPython3環境が用意されるのですが、例えばDeep Learningを使う場合はPython3 + Tensorflowという環境を別で作っておくことができます。

Python3環境を立ち上げると、Pythonが利用可能になった状態でNotebookが作成されます。
動作確認ですので、以下のコードを書いて実行してみてください。下に実行結果が表示されたら動作確認完了です!
なんとサクサクなんでしょう・・・

print("Hello Wordl!")

以上で基本的なセットアップは完了になります。

この時点で機械学習の必須ライブラリ “scikit-learn”, “matplotlib”, “seaborn”なども入っているのですが、追加で入れなければならないライブラリもあったりします。あとは都度、Anaconda経由でインストールしていくだけです。

3、追加ライブラリのインストール

例えば、機械学習のモデルライブラリである”lightgbm”は、デフォルトでAnacondaに入っていません。ですので、外部からインストールしてみようと思います。

1点注意なのが、Pythonをもともとインストールされていた方は、pipコマンドを使ってライブラリを追加していたと思います。Anaconda経由でインストールしたPythonにライブラリを追加する場合は、下で紹介するpipではなくcondaコマンドを使ってください。Anaconda経由でインストールするのが既存のPythonとの競合を起こさないため、最も無難です。

各ライブラリのインストールコマンドは、AnacondaのWebページに書かれていることが多いです。

https://anaconda.org/conda-forge/lightgbm

ここによると、以下のコマンドを打てと書いています。

conda install -c conda-forge lightgbm

はい、先ほどのAnaconda Promptからこのコマンドを打ってみます。

このCondaコマンドの素晴らしいところは、インストールしようとしているライブラリと依存関係にある関連ライブラリもまとめてインストール/アップデートしてくれることです。

コマンドを実行すると、最終的にインストールしてよいかのYes/No [Y/N]を聞かれますので、Yを押してインストール実行。

これでさっくり完了。追加されたことを確認するには、Jupyterで以下のコマンドを打ってください。エラーがでなければ完了しています。

import ライブラリ名

っとここで、Condaコマンドでエラーが出る人がいると思います。

おそらくそれはプロキシ環境下でインストールしようとしているためであると思われます。

社内ネットワークなどからインターネットにアクセスする際にはセキュリティ上プロキシを経由しなけばいけない仕組みになっていることが多いと思います。

そんな方は以下を実施してください。

4、プロキシ環境下でAnacondaを使えるようにする

はい、さくさくといきます。ます、”.condarc”というファイルを作ってください。Windowsの場合は、拡張子だけのファイル作成はできないため、適当なファイル名でファイル作成→.condarcに変更という流れをとってください。

Windowsの場合のコマンドを書いておきます。以下をコマンドプロンプトのAnacondaのルートディレクトリで打ってください。一つ目のコマンドでファイルを作成し、二つ目のコマンドでファイル名を変更しています。

nul copy ファイル名
ren ファイル名 .condarc

次はこの.condarcに経由させたいプロキシの設定を書き込みます。

proxy_servers:
    http: http://[プロキシアドレス]:[ポート番号]
    https: https://[プロキシアドレス]:[ポート番号]

もし、ログイン認証がある場合は、
proxy_servers:
    http: http://[アカウント]:[パスワード]@[プロキシアドレス]:[ポート番号]
    https: https://[アカウント]:[パスワード]@[プロキシアドレス]:[ポート番号]

これを保存したら設定完了です。(このファイルはAnacondaのルートディレクトリに配置する必要があります。マシンによって違うように思いますが、Windowsだと隠しフォルダAppData/Localの奥にAnaconda3というご本尊のディレクトリがあります。

実際に設定が反映されているかは、Anaconda Promptから以下を打って確認します。

conda config --show

このコマンドでAnacondaの設定関連のパラメータが一覧表示されるのですが、このproxy_serves:のところが先ほど設定したURLが反映されていれば設定が正しく完了しています。

この状態で先ほどの追加ライブラリインストールを試してみてください。こんどはうまくいくはすです!

いかがでしたでしょうか。

10分で終わりましたでしょうか?笑

本日は以上になります。最後まで御覧いただき有難うごさいました!

この記事を気に入っていただけたらシェアをお願いします!

コメントを残す

メールアドレスが公開されることはありません。

ABOUT US

Yuu113
初めまして。Yuu113と申します。 兵庫県出身、東京でシステムエンジニアをしております。現在は主にデータ分析、機械学習を活用してビジネスモデリングに取り組んでいます。日々学んだことや経験したことを整理していきたいと思い、ブログを始めました。旅行、カメラ、IT技術、江戸文化が大好きですので、これらについても記事にしていきたいと思っています。