Webマガジン
「<オージス総研をとりまく>人工知能技術の過去と現在(6)」
株式会社オージス総研

2017年09月号
  • 「<オージス総研をとりまく>人工知能技術の過去と現在(6)」
株式会社オージス総研   乾 昌弘

1.はじめに

(1)7月号で、ニューラルネットワーク(Back Propagation)を紹介しましたが、ノードとリンクという単純な要素でネットワークが構成され、複雑な事象が学習できます。
(2)特定分野で機械学習をする場合に、それに適したネットワークが準備されていると便利です。ここでは「教師あり学習」ディープラーニングの代表格であるCNN(Convolutional Neural Network)について説明します。

2.CNN(Convolutional Neural Network)

2-1.CNNについて

(1)通常、画像入力する時は、予めデータが得やすいようにConvolution(畳み込み演算)を実施してSmoothing、ノイズ除去、エッジ検出などを行う。
(2)CNNは、Convolutionをも組み込んだニューラルネットワークである。Poolingによる画像圧縮とペアになっており、繰り返すことによって画像内のパーツを抽出する。なお、Pooling層は画像の位置的なずれを補正する働きもある。
(3)1979年大阪大学福島邦彦教授が提案した「ネオコグニトロン」が原型である。

2-2.畳込層Pooling層におけるBack Propagation

(1)わかりやすいために、入力画像:4Pixels(モノクロ)、フィルタ:2×1、Pooling:3ノードMax Poolingとして説明する。(Max Poolingは Poolingの中でよく使われている)図1参照。
(2)Pooling層のノードは、他のノードとは違い活性化関数も持たず、入力=出力である。Pooling層と畳込層のリンクの値は1か0である。従って誤差の影響をまともに受けるか、まったく受けないか、はっきりしている。
なお、それより入力側の値がBack Propagationによって変化していくので、どのノードの値が最大値になるかも変化しうる。
(3)入力層のi番目の出力をIiとすると、畳込層のj番目の入力Cjは、
Cj = f1×Ii + f2×I(i+1)
で表現できる。一般的なニューラルネットワークと比べるとリンクが少なく、f1, f2ごとに重み付けを(平均化するなどして)等価に変更する。
Back Propagationによって、重み付けが変化するためフィルタの値も変化する。

簡単化したCNN
図1.簡単化したCNN

2-3.一般化

(1)入力画像:カラー画像、フィルタ:5×5×3(RGB)×N枚、Pooling:K×K×N枚が一般的であると考えられる。
(2)N、Kは変化して繰り返す。
(3)この出力値(パーツあるいは特徴量)を7月号で説明したFully Connectedのニューラルネットワークの入力値とする。
(4)入力層に近いほど、より一般的な結びつき(重み付け)になる。出力層に近いほど、アプリよりの結びつき(重み付け)になる。

一般化のフロー
図2.一般化のフロー

一般化したCNN
図3.一般化したCNN

2-4.考察

(1)ニューラルネットワークのノードの出力に用いられる活性化関数に、シグモイド関数ではなくRectified Linear Unitsを採用したのも、Back Propagationによるディープラーニングが可能になった一因である。
(2)クラウド上で、既に重み付けのされたCNNが公開されているので、入力層に近いリンクはそのまま利用することで、効率よく機械学習をさせることができる。
(3)学生時代に聴いた話によると「人間は情報の70%~90%を目から得ている。」従って、CNNの果たす役割も大きいと思う。
(4)将棋で29連勝した藤井棋士は「直観像記憶」を持っているらしい。映像をバッチリ記憶しており、詳細まで再現できるらしい。α碁もCNNを用いて、パターン認識及び判断をしているようである。(次号で説明予定)
(5)以前はIT分野でのニューラルネットワークと、人間の神経回路網はかなり違っていたので、別々に研究が行われていたが、最近は両方研究する人が増えているらしい。
(6)時系列データを扱うRNN(Recurrent Neural Network)など目的、領域に応じたネットワークが増えると実用に供するようになる。
(7)動画をCNNとRNNで学習させて時系列的な変化を捉えたり、声紋をCNNとRNNで学習させて音声認識させたりする例があります。それぞれのタイプのネットワーク技術が発展すると、いろいろな組合せも可能で、応用が一機に広まると思います。

活性化関数
図4.活性化関数

3.ビジネスに活用する時の注意点

人工知能、特にディープラーニングなどをビジネスに活用する時の注意点について述べる。

3-1.目的の明確化

(1)目的をはっきりさせることが非常に重要である。AIを目的化するのはよくない。technology-orientedではうまくいかない。
(2)ITベンダから提案されたら、AIという言葉(等)を消してみて、具体的にどういう技術を使っているか見極めることが必要である。

3-2.対象データ

(1)目的を達成するために、必要なデータは揃っているか?塩漬けされたデータは存在しないか?データがない場合、どのように収集するか?を検討する必要がある。
(2)オープンデータを活用することも重要である。

3-3.データ分析

(1)統計解析、ディープラーニング、数理計画法など、どの手法が適切かを選択していく。簡単な手法で適切な結果が出ることがベストである。必要以上に高度なテクニックを使う必要はない。(統計解析、数理計画法は、下記URL参考)
http://www.ogis-ri.co.jp/rad/webmaga/rwm20140902.html
(2)Excelでできるか、特定のツールが必要なのか。クラウドを使うのか、On Premiseでやるのかなどの検討も必要となる。
(3)データ入力の際には、クレンジング(欠損値、異常値処理など)も重要な作業になる。

3-4.人材確保

(1)大阪ガスビジネスアナリシスセンター長の河本氏が「新KKD」を提唱している。(「参考文献」1)従来のKKDは「勘 経験 度胸」、新KKDは「勘 経験 データ分析」。日本はボトムアップ型で現場が強いため、現場の視点とデータ分析を合体させることが重要である。そのためには、現場の技術者を巻き込めるかが重要になってくる。
蛇足であるがKKの部分は、第2次AIブームの時にエキスパートシステムという形でシステム化が図られたが、うまくいかなかった。
(2)ビジネスモデルに組み込んで事業化していくためには、継続してオペレーションできる人材が必要となる。

データ分析の手順
図5.データ分析の手順

「参考文献」

1. 「第一人者が本音を激白」データサイエンティスト(河本薫氏)日経ストラテジーAugust 2017, P32-P33
2. 乾昌弘「人工知能の概要と現状について」社内資料(2016年)

「余談」

1. セミナーなどに出席すると、第2次AIブームを経験してきた(私を含む)年配の人々が元気になったような気がする。
2. これからは、人とマシン、人と人工知能とのコミュニケーションが重要になると言われている。

*本Webマガジンの内容は執筆者個人の見解に基づいており、株式会社オージス総研およびさくら情報システム株式会社、株式会社宇部情報システムのいずれの見解を示すものでもありません。

同一テーマ 記事一覧
乾 昌弘  記事一覧



2017年09月号のコンテンツ



『Webマガジン』に関しては 弊社の「個人情報の取り扱いについて」に同意の上、
下記よりお気軽にお問い合わせください。

ページトップへ戻る