AI – ぷるーふおぶこんせぷと

前回、前々回から引き続き、植物の写真から病気を判別するサイト(http://www.plant-check.jp/)を作ったときのまとめ。今回はWEBサイトを構築したときのまとめ。

WEBサイトの概要

リンクにあるとおり、WEBサイトはシンプルな作りとなっている。大きなユースケースは下記の2つ。そしてやることはほとんど同じ。

ユーザがサイトの「写真を撮影」ボタンを押すと、自分のスマホから写真を撮ることが出来る。次に「病気をチェック」ボタンを押すと、取った写真の植物が病気か判定される。
ユーザがサイトの「写真を選択」ボタンを押すと、自分のPC/スマホから写真を選択することが出来る。次に「病気をチェック」ボタンを押すと、選んだ写真の植物が病気か判定される。

HTML部分

スマホ経由で写真を取らせるにはcapture=”camera”を使えばOK。

 <input type="file" accept="image/*" capture="camera" id="camera" style="display:none;" name="upload" />

それ以外の部分として、labelタグを使ってボタンを隠したり、若干JavaScriptでボタンの活性・非活性を切り替えたりしているが特殊なことはやっていない。

サーバ部分

サーバ部分の構成は次の通りで、こちらも特殊な構成ではない。

sakuraのVPS（ubuntu 16.04 LTS）
Docker
nginx
uwsgi
Pythonのアプリ
- bottleを利用してモデル部分（keras + tensorflow）とWEBアプリ部分をつなげた。

uwsgiとnginxのつなぎはSocketを使用した。（nginx側 uwsgi_pass unix:/path_to/uwsgi.sock、uwsgi側 socket = /path_to/uwsgi.sock ）良くわからない場合は、公式サイトのサンプルを見ながら書くのが一番だった記憶がある。
Pythonのアプリ部分はbottleを用いて書いた。毎回毎回モデルをロードするアプローチはさすがに富豪過ぎるので、起動時に判別モデル（植物か否か、病気か否か）をロードしてそれを使いまわすようにしている。
一点はまった点としてuwsgi.confでthreads = 1、enable-threads = falseとしないと動作しなかった。当時forumを確認した感じではkerasのpredict処理がマルチスレッドに対応していないのが原因だったと記憶している（が、モデル読み込み時にフリーズしたような記憶もある）。それと、bottleの制約のようだが、巨大ファイルをアップロードされた場合の対策（chunkごとに読みこんで、一定以上のサイズの場合は処理を停止）を自分で書かないといけないのが面倒だった。

まとめ

モデル構築部分のコード行数は約100行（×2）、サーバ部分のコード行数は約200行だった。「AI（人工知能）が病気を診断！」というサイトがこの程度の行数で書けてしまうのは、便利なライブラリが整備されたおかげで、作者に感謝である。もっとも、モデル構築部分はノウハウ含めて自動化されていくはずで、大手各社もAutoML、Azure Machine Learning、・・・と言った名前でそのような環境をリリースしている。
AIやら人工知能やら何やらの主戦場は、結局何するの？という方向か、ほんまに使えるの？という方向になる気がしていて、クロスバリデーションベースのモデル精度を競っても無意味な時代になりつつあるんだろうなーと思う。（ということで私は自動化大歓迎、その他の思いはその他へ）
今後、情熱が復活すれば他の病気への対応を行う予定。もう少し実験したいことがあるので、コードを公開するのはその後になる見込み。
“WEBアプリ構築（keras+uwsgi+bottle）編＋まとめ＆AI構築の悩み（3/3）” の続きを読む

開発環境の準備

開発環境としてDockerを利用したコンテナを2つ＋リリース用のコンテナを1つ作成した。

GPUを用いた学習用としてtensorflow + kerasが動作するコンテナ

ホストとなるUbuntu 16.04にnVidia公式ドライバをインストールした後、nvidia-dockerを導入して構築。
安定版のgcr.io/tensorflow/tensorflow:latest-gpuをベースにしてkerasを追加で入れた。
（困ったときは公式サイトを見るのが一番だった。）

学習したモデルを用いたWEBアプリを開発するためのコンテナ

ホストは1.と同じ。pipからkeras, tensorflow, bottle, uwsgiを入れた。
開発用なのでjupyterも導入。

WEBアプリをリリースする環境のためのコンテナ

2.との違いはjupyterなど余計なソフトウェアを省いている点だけ。

データの準備

本件で作成したモデルの概要とモデル構築に利用するデータは次のとおり。

植物の葉かそれ以外かを判別する2値分類モデル

バラの葉の画像データを正例、SUN Database（http://groups.csail.mit.edu/vision/SUN/）の植物以外のカテゴリを負例とする2値分類モデル。
Imagenetで学習したInception V3（keras付属）を利用。
前半250層を固定。Inception V3の後に判別層を追加する形でネットワークを構成（詳細は次回記載）、学習させた。
いわゆる転移学習とかfine tuningとか呼ばれる手法。
使ったデータは約16000枚。（data augmentation前）

植物の葉が病気か否かを判別する多値分類モデル

バラの葉の画像データを「健康」「黒星病」「うどん粉病」「その他カビ系の病気」の4カテゴリに分類する多値分類モデル。カテゴリ分けは自分でとったバラの写真・動画（画像に一定フレームごとに画像として切り出し）をハンドラベリングした。
利用した学習手法は1.と同様。
使ったデータは約1800枚。（data augmentation前）

バラの葉の画像データは夏休みに都内の公園をめぐって自分で撮影した。モデルに投入していないデータ（バラ以外、対象病気以外）も含めて3000枚以上撮影。機械学習のコード書くより大変だった（が良い経験になった（詳しくは次回））
続きを読む

タグ: AI

WEBアプリ構築（keras+uwsgi+bottle）編＋まとめ＆AI構築の悩み（3/3）

WEBサイトの概要

HTML部分

サーバ部分

まとめ

植物の病気をDeep Learningで判別　概要＋準備編（1/3）

開発環境の準備

データの準備