主に人工知能(AI)開発に活用されることの多いライブラリPyTorch(パイトーチ)。PyTorchを活用するためには、プログラミング言語であるPythonの開発環境を整える必要があります。しかし、どのように開発環境を整えたら良いのか、特に初心者の方にとっては右も左もわからないということもあるのではないでしょうか。
本記事では、AnacondaとGoogle Colaboratoryそれぞれを使用してPythonの開発環境を構築する方法及びPyTorchを活用する方法について、解説致します。
Anacondaとは
プログラミングであるPythonの開発環境を整える前に、今回使用するAnacondaについての概要を押さえておきましょう。Anacondaとは、データサイエンス向けのプログラミング言語Pythonの実行環境を提供するプラットフォームのことです。基本的には無料で使用することができる上、人工知能(AI)開発及び機械学習等のライブラリを豊富に提供していることから、環境構築を効率よく行うことができるため、利用されることが多いプラットフォームです。
Anacondaのメリット
Anacondaが利用されることが多い理由として、様々なメリットがあることが挙げられます。本項目では、主なメリット4点について解説致します。
- セットアップが容易
- 使いやすいソフトも同時にインストールされる
- 容易に仮想環境が作成可能
- 必要なパッケージをクリックするだけでインストール可能
セットアップが容易
Anacondaの最も大きいメリットとしては、セットアップが容易であるということが挙げられます。ほぼマウスのクリックのみでプログラミング言語Pythonを動作することが可能な状態まで持っていくことができるので、手間も時間もかからずにセットアップ可能です。
使いやすいソフトも同時にインストールされる
Anacondaでは、1つのソフトだけでなく、Jupyter Notebook等に代表されるプログラミングを補助してくれるような使いやすいソフトも複数同時にインストールされます。右も左もわからない初心者にとっては、嬉しい機能と言えるでしょう。
容易に仮想環境が作成可能
Anacondaでは、容易に仮想環境を作成することが可能です。そのため、仮に仮想環境内でプログラミングがごちゃごちゃになってしまい、やり直したいと思った時にでも、すぐに新しい仮想環境を作成し直したり、仮想環境をコピーして複数作成したりとすぐに軌道修正することができ、初心者でも試行錯誤しながら思い切りプログラミングを行うことができます。
必要なパッケージをクリックするだけでインストール可能
パッケージをとは、プログラミングをする時に使用する便利なプログラムをまとめたものです。Anacondaでは、必要に応じてパッケージを画面操作だけでインストールすることが可能となっており、コマンドライン操作が不慣れな方にとって、とっかかりやすくなっています。
Anacondaのデメリット
前述した通り、とても便利なAnacondaではありますが、メリットがあればデメリットも存在します。本項目では、代表的な主なデメリット3点について解説致します。
- 動作が重い
- 不要なソフトのインストール
- 微調整しにくい
動作が重い
Anacondaにおける最も大きなデメリットとして、Anacondaを動作させるためにPCのスペックを大量消費してしまうことが挙げられます。シンプルなプログラミングを行なっている初心者の頃には大きな問題はありませんが、複雑なプログラミングを行うようになってくると、動作が重くなってくるのを実感してしまうでしょう。
不要なソフトのインストール
メリットの部分で述べましたが、Anacondaは、様々な使いやすいソフトを同時にインストールしてくれますが、その中には実際には使用しないものも含まれています。使用しないソフトは、ただただPCの動作を重くしてしまうだけなので、あらかじめ不要なソフトはインストールしないようにするなど対策して、必要に応じてソフトをインストールするようにすると良いでしょう。
微調整しにくい
Anacondaは、PCの設定を変更する際もあくまでAnacondaを通して行うため、PCで直接なんらかの設定を行うよりも様々な制限がかかってしまい、細かな微調整ができないといった弊害が起こり得ます。
Anacondaのインストール方法
まず初めにAnaconda公式サイト(https://www.anaconda.com)にアクセスし、Anacondaのダウンロードを行います。
画面上部の「Products」をクリックすると、下記5つの選択肢が表示されます。
- Individual Edition(Open Source Distribution):個人版(オープンソース配布)
- Commercial Edition(Premium Package Repository):商用版(プレミアムパッケージリポジトリ)
- Team Edition(On-prem Package Repository):チーム版(オンプレムパッケージリポジトリ)
- Enterprise Edition(Full Data Science Platform):エンタープライズ版(データサイエンスプラットフォーム)
- Professional Services(Data Experts Work Together):プロフェッショナルサービス(データの専門家が協力)
5つの選択肢の中から任意の1つを選択しますが、今回は無料で利用することができる「Individual Edition(Open Source Distribution)」を選択し進んでいきます。
「Individual Edition(Open Source Distribution)」を選択後、「Anaconda Installers」まで画面をスクロールします。
「Anaconda Installers」の中では、使用しているOSと環境を選択することができますので、環境に合ったものを選択し、クリックするとダウンロードが開始されますので、任意の場所に保存しましょう。
※Anacondaは、日本語を含むフォルダにはインストール不可能ですので注意してください。関連して、Windowsのアカウント名が日本語になっている場合には、デフォルトのインストール先フォルダ名も日本語になってしまうため、別途フォルダを作成しなければなりません。
次にAnacondaのインストールを行います。任意の場所に保存したファイルをダブルクリックし、起動しましょう。「Welcome to Anaconda〜〜〜Set up」という画面が表示されたら「Next」をクリックします。
その後ライセンスが表示されるので、内容を熟読し問題なければ「I Agree(同意する)」をクリックし、次の画面で現在ログイン中のユーザーのみで使用する場合は「Just Me」、他のユーザーでも使用できるようにする場合には「All Users」を選択し「Next」をクリックし、次の画面では、任意の設定を選択し「Install」をクリックします。(特にこだわりがなければデフォルトのまま進みます。)インストール後、画面が表示されるので「Next」→「Finish」の順でクリックをし完了です。
AnacondaでPyTorch開発環境を構築する方法
Anacondaのインストールが完了したら、Pytorch開発環境を構築していきます。
AnacondaでPythonの仮想環境を作成する
まず初めに、Anacondaでプログラミング言語Pythonを使用可能な仮想環境を作成するために、Anaconda Promptを立ち上げましょう。コンソールが開き次第、下記コマンドで新規の仮想環境「pytorch_env」を作成します。
conda create -n pytorch_env python=3.6 anaconda |
もし、上記コマンド入力後「Proceed」と表示されたら「[y](yes)」で進めていきます。その後、作成した仮想環境を下記コマンドで有効にします。
activate pytorch_env |
PyTorchをインストールする
次にPyTorchをインストールしていきます。PyTorch公式サイト(https://pytorch.org)にアクセスし、トップページをスクロールしていくと「INSTALL PYTORCH」という見出しがあり、下記項目内の選択肢を使用しているPC及び環境に合わせて設定することができますので、確認しながら設定します。
- PyTorch Build
- Your OS
- Package
- Language
- Compute Platform
詳しくは下記記事を参照してください。
各項目を設定した後「Run this Command:」という項目に、設定に準じたコマンドが表示されますので、コピーし、先ほど有効にした仮想環境のAnaconda Prompt上に打ち込むと、PyTorchをインストールすることができます。
テストコードの実行をする
上記工程が全て完了したら、テストコードを実行して、環境構築が成功しているか否かを確認します。まず、「test_pytorch.py」として、下記のコードを保存します。
import torch print(torch.cuda.is_available()) |
その後、Anaconda Promptより「Python test_pytorch.py」で実行し、「True」あるいは「False」が表示されるようであれば環境構築が成功しているものと思われます。逆に何かしらのエラーが表示されてしまうといった場合には、環境構築が失敗している可能性が高いため、原因を探し修正して、改めてテストコードを実行してみて下さい。
Google Colaboratoryとは
これまでは、Anacondaを使用してPyTorchの環境構築を行う方法について解説してきましたが、本項目以降は、Google Colaboratoryを使用してPyTorchの環境構築を行う方法について解説致します。
Google Colaboratoryとは、Googleが提供している機械学習の教育及び研究用に作られたプログラミング言語であるPython及び機械学習、ディープラーニングの環境を整えることが可能な無料サービスのことです。略してGoogle Colabとも呼ばれることが多く、Googleアカウントさえあれば、CPU及びGPU(1回あたり12時間の制限)での環境で利用可能です。
Google Colaboratoryのメリット
Google Colaboratoryには、様々なメリットが存在します。中でも代表的な次の3点のメリットについて解説致します。
- 環境構築がほとんど不要
- プロジェクトメンバー内での共有が容易
- GPUを含め無料で使用可能
環境構築がほとんど不要
Google Colaboratoryでは、クラウド上でJupyter Notebookを動作させることになりますが、プログラミング言語であるPython及びライブラリであるNumpy等、機械学習において必要とされるほとんどの環境があらかじめ構築済みです。そのため、Google Colaboratoryを使用するユーザーにとっては、ブラウザだけ用意することになり、迅速に機械学習を行うことが可能となります。
プロジェクトメンバー内での共有が容易
Google Colaboratoryは、Googleが提供しているサービスのため、Google Driveとの連携も可能です。さらにソースコードをクラウド上で管理することができ、さらにGoogle Driveで保存することもできることから、プロジェクトメンバー内での情報共有も容易です。元からのGoogle Driveユーザーであるならば、Google Colaboratoryのノートブックに関しては、直感的な操作によって共有可能であるため、権限管理等も然り、セキュリティ面でも安全に使用できるでしょう。
GPUを含め無料で使用可能
Google Colaboratoryでは、Nvidia社のTesra K80 GPUを無料で利用することが可能です。人工知能(AI)開発における機械学習では、膨大なデータを使用し、高負荷の計算及び処理を実行するため、通常のPCでは、動作が重くなってしまったり、時間がかかり過ぎてしまったりといったことが少なくありませんが、Tesra K80 GPUを利用することで、これらの問題を解決することが可能です。
Google Colaboratoryのデメリット
Google Colaboratoryには、メリットだけでなくデメリットも存在します。代表的な次の2点のデメリットについて解説致します。
- 特殊な処理方法を覚える必要がある
- Google Driveの容量で15GB以上は課金が必要となる
特殊な処理方法を覚える必要がある
Google Colaboratoryでは、ローカルPC上で利用していたデータセット等を読み込む際、Google Drive APIやPyDriveのwrapper等を介する必要があるため、慣れない内は手間となってしまいます。
Google Driveの容量で15GB以上は課金が必要となる
Google Colaboratoryは、基本的に無料で使用することが可能ですが、Google Driveの容量で15GB以上使用する場合には、課金を行う必要が出てきてしまいます。しかし、Googleアカウントを複数作成して、Google Driveの容量を確保するといった対策を講じることは可能です。
Google Colaboratoryのインストール方法
Google Colaboratoryをインストールするためには、まずはじめにGoogleアカウントを作成する必要があります。Googleアカウントを持っていないという方は、Google公式サイト(https://accounts.google.com/signup/v2/webcreateaccount?continue=https%3A%2F%2Faccounts.google.com%2FManageAccount%3Fnc%3D1&hl=ja&flowName=GlifWebSignIn&flowEntry=SignUp)にアクセスし、画面に従ってGoogleアカウントを作成して下さい。
Googleアカウントを作成したら、Google Drive(https://www.google.com/intl/ja_jp/drive/)にアクセスし、トップページの「ドライブに移動」をクリックします。次の画面で左上の「新規」をクリックし、表示されたダイアログの中から「その他」→「アプリを追加」をクリックし、画面上部の検索欄に「Colaboratory」と入力し、検索します。その後「インストール」をクリックし、「インストールの準備」という画面で「続行」をクリックし、次の画面で「OK」とクリックし、最後に「完了」をクリックしてインストールが完了となります。
Google Colaboratoryを開く
Google Driveのトップページに戻り、先ほどと同様「新規」をクリックし、ダイアログの中に追加された「Google Colaboratory」をクリックし、Google Colaboratoryを開きます。
Google Colaboratoryのファイル名の変更
Google Colaboratoryの初期ファイル名は「Untitled0」となっているので、任意でわかりやすい名称に変更しましょう。
動作確認を行う
Google Colaboratory上で、コード入力欄に任意のprintコードを入力します。※今回は「Good morning!」と入力しています。
print(‘Good morning!’) |
コード入力後左側の「▷」ボタン(実行)をクリックし、下に「Good morning!」と表示されれば問題なく動作しています。
Pythonのバージョン確認を行う
次にプログラミング言語であるPythonのバージョンを確認するために、コード入力欄に下記コードを入力してみましょう。
!python –version |
コード入力後左側の「▷」ボタン(実行)をクリックし、下に表示される「Python ○.○.○」がバージョンとなります。
Google ColaboratoryでPyTorch開発環境を構築する方法
Google ColaboratoryでPyTorch開発環境を構築するために、先ほど説明したAnacondaと同じようにPyTorchをインストールし、テストコードの実行まで進みます。
PyTorchをインストールする
Anacondaの手順を参考に自身のPC及び環境に合わせた設定した後「Run this Command:」という項目に、設定に準じたコマンドが表示されますので、コピーし、Google Colaboratoryのコード入力欄に先頭に「!」を追記した上で貼り付けをし、左側の「▷」ボタン(実行)をクリックするとPyTorchをインストールすることが可能です。
テストコードの実行をする
PyTorchをインストールしたら、コード入力欄に下記のコードを入力します。
import torch x = torch.rand(5,3) x |
コード入力後、左側の「▷」ボタン(実行)をクリックして、下に「tensor()」が表示されることを確認します。
Googleドライブと連携する
Google Colaboratoryのコード入力欄左側にある「ファイル」をクリックし「ドライブをマウント」をクリックし、表示されるダイアログ内の「Google ドライブに接続」をクリックすることで、Google Driveとの連携が完了します。
まとめ
Pythonの開発環境についてということで、本記事では、AnacondaとGoogle Colaboratoryそれぞれを使用してPythonの開発環境を構築する方法及びPyTorchを活用する方法について、解説致しました。
人工知能(AI)開発において欠かすことのできない機械学習を効率的に実施するためには、本記事でご紹介したPyTorch等のライブラリを活用することが近道となります。人工知能(AI)開発において人気のプログラミング言語であるPythonの開発環境を構築し、様々な機械学習に生かしてみて下さい。