ディープラーニングとは?少しでも理解してみたい

近年は人工知能という言葉がもはや当たり前になっていますよね。ディープラーニングなんていう言葉もよく聞きます。でも、それって一体なんなんでしょう。この記事では、ディープラーニングとは?ということについて紹介していきたいと思います。

ディープなラーニングだろ

ディープラーニングとは何か?

最近、テレビでもネットでもよく耳にするディープラーニング。日本語では「深層学習」などとも訳されますが、一体何のことなのでしょうか。

ディープラーニングの位置づけ

ディープラーニングとは、マシンラーニングと呼ばれる分野の中の一分野です。よく聞くAI(=人工知能)を大枠とすれば、その中にマシンラーニング(=機械学習)があり、その中のさらに細かい区分としてディープラーニングがあります。
つまり、AIに関係した特殊な一分野ということをひとまず押さえておけば良いでしょう。

ディープラーニングの特徴づけ

ディープラーニングは、複数のレイヤーから構成されるニューラルネットワークと呼ばれるネットワークを用いるところに特徴があります。
私たちに直接見えるのはデータを入力するレイヤーと、データが出力されてくるレイヤーのみですが、その間には「隠れ層」と呼ばれるたくさんレイヤーがあり、その隠れ層によって、複雑な問題を解くことが可能になっています。

なぜ「ラーニング」と呼ばれるのか

どうしてディープラーニングはそのような複雑な問題を解くことが可能なのかというと、トレーニングデータと呼ばれるデータをたくさん与えることによって、いわばAIを学習させ、鍛え上げることができるからなのです。
私たち人間と同じように、AIも学んでゆくのです。「ラーニング(=学習)」というふうに言われるのも、そのためです。

ディープラーニングブームを理解するための三つの重要コンセプト

それではどうして、現代においてディープラーニングはここまで順風に進んでいるのでしょうか。これにはいくつかの別の概念が関係しています。ここでは特に重要なキーコンセプトを3つほど紹介していきます。

ビッグ・データ

1つ目のキーは、「ビッグ・データ」です。これは最近ではニュースなどでもよく使われるので、新聞やテレビで目にしたことがある方も多くいらっしゃるのではないでしょうか。ただし、その厳密な意味合いを真剣に考える機会は少ないかもしれません。

ビッグ・データという言葉が人口に膾炙する背景となったのは、私たちの生活が常にインターネットのネットワークに接続された状態になりつつある現代の状況があります。

たとえば、私たちはスマートフォンによって常にオンラインとつながり、位置情報や行動履歴、どのようなネット探索をしたかなどの情報を、望むと望まないとにかかわらずインターネット上に残しています。それらを収集すると、すごい量のデータが集積されることになります。

2010年代初頭、アメリカ合衆国の科学記述政策局が、こうした大量のデータについての研究、およびその想定される発展などについて発表したことによって、大きく注目を集めることになったのです。これは世界中に影響を与え、日本の総務省も、2017年をビッグ・データ利活用元年と名づけています。

私たちがこの記事で問題にしているディープラーニングを行うためには、人工知能に与えるための大量のトレーニングデータが必要です。ビッグデータは、まさにこのトレーニングデータとしてぴったりなのです。これがディープラーニングブームのひとつの追い風となっているわけです。

グラフィックス・プロセシング・ユニット(GPU)

2つ目のキーは、「グラフィックス・プロセシング・ユニット」と呼ばれる概念です。以下GPUと略します。これは、CPUとの対比で使われることが多い概念なので、その比較で説明を進めてゆきます。

CPUは中央演算処理装置とも言われますが、比喩的に言えば私たちが使うコンピュータの頭脳の部分を担当するものです。さて、このCPUとGPUのちがいなのですが、まず、複雑な計算をするケースでは、CPUの方が向いています。

一方で、単純な計算をたくさんする場合には、GPUのほうに軍配が上がります。たとえば、三次元のグラフィックなどの画像を処理する場合には、単純な計算を数えきれないほどたくさん処理しなければなりません。そのような場合には、GPUが大活躍するというわけです。

ところで、この記事で問題になっているディープラーニングでも、実は似たような処理を行う必要がある、ということに科学者たちが気づきました。GPUが得意とする画像処理の場合も、ディープラーニングに必要な大量の計算も、どちらの場合もたくさんの行列(と呼ばれる数学の概念)の掛け算と足し算を行うという共通項があり、前者を後者に応用できるということなのです。そこで、今やGPUは、ディープラーニング研究に深く関わる存在となり、これもまた追い風となっています。

深層ニューラルネットワーク

3つ目のキーは、「深層ニューラルネットワーク」と呼ばれる概念です。DNNとも略されます。これは、ヒトやその他の動物の持っている脳の神経回路をモデルとしてつくられたアルゴリズムを、多層構造にしたものです。

要は、人間の神経のつながり方に見立てたネットワークをたくさん準備し、それをいくつも重ね合わせてつくられたもので、これをもとに人工知能は学習を進めます。この深層ニューラルネットワークを二次元データに対応させると、畳み込みニューラルネットワークになり、時間に応じて変化するような連続的データに対応させると、再帰型ニューラルネットワークと呼ばれます。

場合によっては、この深層ニューラルネットワークをディープラーニングとほとんど同じ意味で用いる場合もありますが、厳密には異なる別の概念として理解したほうがよいでしょう。いずれにせよ、この深層ニューラルネットワークのおかげで、ディープラーニング研究は成立していると言えます。

ディープラーニングによる画像認識

さて、それではディープラーニングの具体的な応用例を見てゆきましょう。ディープラーニングが真価を発揮するのは、画像認識です。どういうことでしょうか。

「何が写っているか」の判断

私たちの経験と比較してみましょう。たとえば、私たちが写真を見るとき、「猫の写真」「パリのエッフェル塔の写真」などと、何が写っているのかを判断することができます。一方で、通常コンピュータはそうしたことができないと考えられてきました。ところが、ディープラーニングによって、完全にそれではないにしても、それに近い判断を行わせることができるようになったのです。

ディープラーニングによる画像認識のメリット

さて、それでは、画像認識をディープラーニングによって行うことは、これまでの研究方法と比べてどのような利点があるのでしょうか。一番大きい利点は、一旦データをコンピュータに与えてしまえば、人の手がかからないという点です。従来の画像認識では、認識に必要な情報を手作業でコンピュータに与えていました。その膨大な作業が軽減されることは、大きな進歩になると期待されています。

ディープラーニングによる画像認識の具体的研究

最後に少しだけ、画像認識の具体的な研究にも触れておきましょう。

物体を認識する

ディープラーニングによる画像認識では、画像に写っているものを識別し、分類する研究が進められています。犬や猫などの一般名詞が返ってくるケース、製品名や固有名詞が返ってくるケース、いずれもあります。

物体を検出する

そのものが、写真のどこに写っているのかということまで特定する研究も進められています。ただし、たとえば人体の写真でいうと、ポージングによってもそのパターンは無数に考えられます。したがって、これには大量のデータが必要とされることが指摘されています。

画像認識のがどんなものに使われているのかは以下の記事を見てみると、何と無くイメージがつくかと思います。

画像認識・解析に活用した人工知能(AI)の導入事例・実績 ... - ブレインパッド

これからはディープラーニングでいろんな事が判断できてしまいそうだ。
おすすめの記事