第30回 サイバー攻撃に使われだすAI技術③

情報セキュリティ連載

〜知識をもったコンピュータの誕生〜

今回は人工知能で重要なポイントとなるディープラーニングという技術についてスポットを当てます。知識を持ったコンピュータの誕生とも言える重要な出来事です。

1 翻訳精度を急激に上げるGoogle翻訳

普段様々なシーンで利用されるようになったGoogle翻訳ですが、数年前のものとは全く違うレベルになっています。

数年前までは翻訳の際の中間言語を英語にしていました。例えば日本語から中国語に翻訳する場合、日本語➡英語➡中国語という順で翻訳されていました。

人工知能が搭載されると日本語➡人工知能独自の言葉➡中国語という順で翻訳されるようになりました。

この人工知能独自の言葉はプログラマーが開発したものではなく人工知能が勝手に作り出した言葉のようなものです。この技術はニューラル機械翻訳と言われTOEIC900点以上の精度を可能にするまでに成長しています。

2 シンボルグラウンディング問題

ディープラーニング技術の誕生にあたりまず問題になったのがコンピュータに「りんご」「車」といった記号(言葉)とその意味を結びつけることが難しいということです。

言い換えると人が理解している「物事の概念」をコンピュータに理解させるのが難しいという問題です。これをシンボルグラウンディング問題といいます。

例えば、人はシマシマ模様の意味もウマの意味も理解しています。この2つを概念、シマシマ模様であれば白と黒の線が交互にある模様であったり、4本足で首が長くたてがみがある生き物がウマという概念を人それぞれですが理解しています。

この前提条件でシマウマを見たことがない人がシマウマを見た場合、「シマシマのウマだから、これがシマウマかな?」という推測から認識することができます。

これに対して、シマとウマという記号しか教えていないコンピュータの場合、シマもウマも単なる記号であり、シマウマを見せてもシマウマと判断することは出来ません。

上記のことからもコンピュータには全ての事柄をルールとして教えこまなければなりませんが、全てのルールを教えることは不可能です。このことからコンピュータが知識を得ることは難しいとされました。

このことを知識のボトルネックと言います。このボトルネックを解決しない限り知識を持つコンピュータの誕生はありえません。

3 知識を持つコンピュータの誕生

では、冒頭でお話しましたTOEIC900点台のレベルの翻訳をできるようになったGoogle翻訳のようなコンピュータはどのように生み出されたのでしょうか。

人は物事の概念を理解することで新しい物事の理解をし、そこから予測などを行えるようになります。これは物事に特徴があることを理解しているためできるのです。

例えば、天気が「くもり」の場合、カサを持って出かけた方が良いかなと予測することが出来ます。「くもり」だと雨が降る可能性があるということを知っているからです。

このように物事には因果関係や相関関係が存在し、データを集計することでより明確な特徴があることが分かるようになります。この特徴を量的に表したものを特徴量と呼びます。

この特徴量を元に判断をすることができるプログラムをコンピュータに教え込むと、特徴から精度の高い予測や画像判断をすることができるようになります。これが人工知能のディープラーニングという技術です。

しかしながら、最初から特徴量をコンピュータ自ら抽出が出来たわけではなく、最初は人間が特徴量をコンピュータに教え込んでいました。ただ誰もができることではなく、データサイエンティストという高度の技術を持った人でないと難しい作業でした。そこで、コンピュータが自ら特徴量を抽出できるようにプログラムをビルのように複数の階層を持たせ、下の階層の計算結果を上に反映させながら特徴量を抽出するようにしたところ、精度の高い特徴量を抽出できるディープラーニング技術が確立されたのです。

ディープラーニング(深層学習)とはプログラムが何層にも構造を持つことから名付けられています。

このディープラーニング技術を搭載したGoogle翻訳は相対する英文と和訳文を大量に読み込み、様々な文脈から特徴量を自ら抽出します。これが冒頭の「人工知能独自の言葉」を生み出す元になりました。

2020年1月、Google傘下のディープマインド社が英国科学雑誌「ネイチャー」に発表した論文にはディープラーニング技術による学習過程と人間の脳の学習過程に深い関係があることが発表され、現在の人工知能研究が人間の脳の学習過程に近い過程を踏んでいることを実証しているのではないかとされています。

このことから、ディープラーニングを搭載したコンピュータは知識を持ったコンピュータの誕生と捉えることができます。人間の知識を超える可能性が現実味を帯びてきており、研究次第では人間の驚異にもなりかねない技術です。この技術はがん治療に必要なゲノム解析など先進的な分野で活用されだしている一方で、現在驚異を増してる新しいサイバー攻撃の元になっているのも事実です。今後、正しい理解と注視が必要な技術だと思われます。

次回はこのディープラーニング技術を使った研究分野について触れていきたいと思います。

《参考文献》

ディープラーニングG検定公式テキスト丸山俊一著『AI以後変貌するテクノロジーの危機と希望』斉藤康己著『アルファ碁はなぜ人間に勝てたのか』

お問い合わせ

神奈川県川崎市で税理士・社会保険労務士をお探しなら

LR小川会計グループ

経営者のパートナーとして中小企業の皆さまをサポートします