Categories: 書籍

ディープラーニング最前線(ディープラーニング研究会)

中国、アメリカに大きく水をあけられているAI技術。基本を知ることから。

ディープラーニングという言葉が機械学習という言葉と共に日常耳にするようになった。

定義上は、AI(特化型人工知能)>機械学習>ディープラーニング が一般的。

では、機械学習とディープラーニングの違いは何か?最大の違いは、特徴量の見つけ方。機械学習は、人間が定義した特徴量を情報として蓄積していくことで精度を上げていく手法。一方、ディープラーニングは、更に膨大なデータをニューラルネットワークの中で何度も処理をしながら、AI自ら特徴量を定めていくことができる。人間がルールを決められないことも見つけだすことができるが、時に思わぬ方向にいくので、注意が必要な手法。

機械学習、ディープラーニングを行う際に、データは大量にあればあるほど良いと言われることがあるが、実は、多すぎると「次元の呪い」という、表現できる組み合わせがやたらに多くなりすぎ、効果の割に、大きなコスト発生だけでなく学習効果が得られないという致命的な問題が発生する。この場合は、「次元削減」で低次元にしていく必要がある。

そういった問題はあるものの、ビッグデータは必要となる。そのビッグデータの中で、データとデータ間の有用な関係性、特徴量を見つけ出すのをデータマイニングといい、AIと共に耳にする言葉である。

今後、10年経つと、AIに関係するビジネスは急激に増え、切っても切り離せない存在になることは明白である。そのために、今、AIに触れ、理解することは非常に重要である。ディープラーニングを導入するためには、開発に必要な機能やライブラリを集めた「フレームワーク」がいくつか存在する。そこから適切なものを選定する。ハードウェアも必ずしもハイスペックである必要はない。使う手法も、「回帰」「分類」「ランキング学習」「Seq2Seq」などから適切なものを選ぶ必要がある。ビッグデータが揃えることが非常に大変なのだが、集まらない場合は、「水増し(Data Augmentation)」と「転移学習(Transfer Learning)」の方法が一般的。

これらを実際に操っていく職業として、AI・機械学習エンジニア、AI・機械学習ジェネラリスト、データサイエンティストがある。いくつかの団体が教育の場を設けたり、検定などを行い、この分野の技術力、環境を揃えようとしている。

アメリカ、中国などの他国に比べ、日本は、投資額も圧倒的に少なく、5年以上遅れているとも言われています。しかし、日本が得意としているハードとこのAIをうまく融合するビジネスを見付ければ、今後逆転をする余地は残っているそうです。

Ohtani Hisao

1967年生まれ。高校卒業まで大阪→名古屋→福岡→島根で生活。今は、神奈川県逗子市に在中。都内の会社に勤め、同居は、妻と子供2人(2020年時点 大学生)。無理をしない程度に、読書、映画、美術鑑賞、スポーツを楽しんでいます。特に2019年春からSUP(Standup Paddle Surfin)に奮闘中です。ブログで奮闘ぶり更新中です。