DXトレンド⑧ ― 機械学習 ―
テク仁(えんまん七福仁 IT技術担当)のつぶやき – その8
EnMan社にてCTOを勤めさせて頂いている石井慎一郎です。
EnMan社が、一流IT企業との開発・PMO連携、サービス事業提供、更なるアジア圏ビジネス隆盛を目指す中で、その背景にある昨今のIT技術やシステム動向について徒然なるままに認めます。
今回のDXトレンドのコラムも最終回を迎えました。
前回、データ分析を採り上げましたが、データ分析の結果によって判別を機械学習によって行う、所謂AIについて解説します。
■まずは特徴量
特徴量とは、対象の特徴が数値化されたもののことを指します。
人間の顔認識を行う際の特徴量を表すイメージとして、顔に蜘蛛の巣のようなメッシュがかかったようなものをご覧になることがあると思います。その中で、目の間隔などが特徴量の1つになるわけです。この特徴量の項目が多くなればなるほど、認識精度が上がることになるのです。また、日本人に向けた顔認識のエンジンをそのまま外国に持っていっても、日本人と同様の精度が出るとは限りません。その人種に応じた顔の特徴量なども取り込まないと、高い精度を実現できないわけです。
■データ分析による判別とは?
データ分析の成果は、つきつめると、(Xi、Yi : i=1,2,3,・・・n)というデータに対して、
→ 回帰:できる限り全ての点を通るk次曲線を見つける…予測
→ 判別:データをk個のグループに分ける超平面を見つける…グループ判別
を行うことにあります。
右図の例でいくと、①や②は、境界Aでも境界Bでも正しくグループを判定できますが、③では境界によって属するグループが異なってしまいます。
つまり、膨大なデータに対して、如何にこのk次曲線、または超平面を設定するかを機械学習を通じて行うわけです。
■改めて、機械学習とは?
機械学習とは、システムがデータから学習することを可能にするAIの形式です。
判別を判断するアルゴリズムがトレーニングデータを取込んで、そのデータを基にしてさらに正確な判別を行うことを学習します。その結果、機械学習によって獲得された判別機能(関数)に入力すると、出力としての判別結果が得られることになるのです。
先ほどの判別の例を、写真による顔認識で考えてみましょう。①が顔の輪郭の内部、②が顔の輪郭の外と考えた場合、③が丁度境界の際に当たるわけです。もしも写真がピンボケだった場合には、ますます、③が顔の輪郭の内外なのかの判断が難しくなります。これは人間の目による判別でも同様ですよね。よって、トレーニングデータについても、この境界がはっきりしている物であること、並びに大量であることが、精度向上には求められることになります。
このトレーニングを通じて、上図のように例え防止が少し欠けたテク仁の撮影画像であっても、正しくテク仁として判別できるようになるわけです。
■機械学習の1つであるディープラーニング
ディープラーニング(Deep Learning)では、特徴量を自動で学習する点にあります。そのためディープラーニングは、複雑な非構造データを用いる際に利用されることが多く、「音声認識」「画像認識」「自然言語処理」などの分野に適用されています。
ディープラーニングは、元々人間の脳を模したニューラルネットワークから議論が始まっており、特に2006年にネットワークの多層化、そして層と層の間の変換における重みづけの調整などの実現により、現在に至っています。
この「ディープ」という言葉は、ニューラルネットワークの隠れ層の数について言及しています。
ディープラーニングでよく使われているのは、畳み込みニューラルネットワーク(CNN)というものです。畳み込みニューラルネットワークでは学習された特徴を入力データと一緒に2次元の形で畳み込みんで、複数の隠れ層により、1つの対象(例えば画像)に含まれる数々の特徴を学習していきます。層が右に行く・進むにつれて、より複雑な特徴を学習することになります。例えば、最初の隠れ層では境界検出や色など単純な特徴を、より最後の層では認識したい物体の形状の学習を行ったりするわけです。 元々は、人間が特徴量となる内容を機械学習では与える必要があったわけですが、ディープラーニングで個々の判別対象の特徴を隠れ層に抽出して、かつ大量のデータの学習によって、判別の際の特徴のプライオリティ付けまで行えるようになったことにより、人間が与えられる特徴を超えたというわけです。
■最後に
データ分析、ディープラーニングに関する研究開発、並びに実用化は、まさに現在、産学含めて百花繚乱の状況になっています。例えば、現在の株の売買に関しても、実際のトレーダーによる取引ではなく、AIによる株価予想に基づいたシステムによる取引も行われてきているのはよく知られています。
さて、皆さんは今後、DXをどのように活用されたいと思うでしょうか。今後、ビジネスへの活用もますます広がると思われますが、自分自身では密かに、自分自身を客観的に捉えるために使ってみたいと考えたりしています。
日進月歩の技術革新が続いています。また、お会いできる機会を楽しみにしています。
この記事の執筆者
石井 慎一郎
1984年 東京大学卒、日本電気㈱入社
ソフトウェア開発研究部門 配属(18年) 、金融システム開発、SI部門(13年)、グローバルビジネス推進部門(CTO)(3年)
時代の最新ソフトウェア・アーキテクチャの研究開発経験を礎に、ビジネスの最前線への適用、大規模SIでの顧客対応、最新技術プロダクトのグローバル展開を行った貴重な経験を持つ。
2018年末 日本電気㈱退職。個人事業主にてIT領域で企画・開発支援等、幅広く活動。
2020年7月~ EnMan Corporation 取締役CTO