第67回 チャットGPTについての包括的なレビュー⑩

AI

情報セキュリティ連載
試される人工知能「チャットGPT」の実力

前回までは、生成AIをコントロールする上で最も重要となるプロンプトの構成についてお話させていただきました。出力内容や制限事項を生成AIに正確に伝えることで、生成AIから意図した答えを出力させることができます。

今回からは人間と同様、もしくはそれ以上の理論的判断を伴う作業が行える汎用型生成AIについて触れていきますが、汎用型生成AIを理解する上で前提となる自立型エージェントという生成AIについて触れさせていただきます。自立型エージェントAIを説明する上でマルチモーダルAIというAIの説明が必要になります。

1 マルチモーダルAIについて

ChatGPT-4やGoogleBardのような生成AIに画像を取込みその画像データに対する回答ができるようになってきました。これをマルチモーダルAIといいます。

前回も少しこのマルチモーダルについて触れさせていただきましたが、このマルチモーダルのマルチとは複数という意味を指し、文章以外の画像や音声など複数の形式のデータを読み込み、そこからデータを解析することができるAIをマルチモーダルAIといいます。

マルチモーダルAIのポイントは、人間の視覚や聴覚を得た点にあります。画像データや音声データを読み込み、そこからプロンプトの指示に従い必要な答えを導き出すことができるようになりました。

人間がパソコンへデータ入力する場合、紙等の視覚情報から必要なデータを抽出しパソコンへデータを入力していきます。

2 マルチモーダルAIの実力

ここで、マルチモーダルAIが文章以外のデータも正確に判断している例を挙げたいと思います。

上記の画像は小学校高学年の算数の問題です。

この画像を生成AIに読み込ませ問題の回答を求めるよう指示します。

問題は2問ありますが、メインは②の辺の長さの答えについてです。

②の答えは1:2ですが、GoogleBardにこの画像を投げ、答えとその回答の経緯を答えるよう指示しました。

下記がGoogleBardの答えです。

⑴ ① 次の三角形アイウを2倍に拡大した三角形カキクをかきましょう。
三角形アイウの辺の長さは、辺アウが4cm、辺イウが4cmです。
拡大図では、各辺の長さが2倍になります。したがって、三角形カキクの辺の長さは、辺カクが8cm、辺キクが8cmになります。

⑴ ② 辺アウと辺カクの長さの比を求めます。
辺アウと辺カクの長さの比は、
アウ / カク = 4cm / 8cm = 1 / 2
となります。したがって、辺アウと辺カクの長さの比は1:2です。

回答の経緯

⑴ ① の解答は、三角形の拡大図の基本的な考え方に基づいて行いました。拡大図では、各辺の長さが同じ比率で変化します。したがって、三角形アイウの辺の長さが2倍になるということは、三角形カキクの辺の長さも2倍になるということです。

⑴ ② の解答は、比の定義に基づいて行いました。比とは、2つの数を等しい割合で表したものです。したがって、辺アウと辺カクの長さの比は、辺アウの長さを辺カクの長さで割ったものになります。

ここまでがGoogleBardの回答です。

どうでしょうか。画像から文章以外のデータ、三角形の各辺の長さを認識し、そこから問題の回答をしています。

問題自体はさほど難しくないですが、ここで重要となるのは、文字データ以外のデータを把握できるかというところにあります。ちゃんと認識していることがわかります。

3 生成AIの弱点

従来、生成AIは言語モデルという英語や日本語といった言語の文字データをベースとするモデルから回答を得る仕組みを取っており、数学の理論的な回答は得意ではありません。したがって、上記のような算数の問題も文章を複雑にすると、簡単に間違えます。

4 生成AIの弱点を克服するQ(キュースター)

この理論的な回答をできるようになっているのがChatGPTを開発する米オープンAIが開発する「Q(キュースター)」というプロジェクトといわれています。このQ*の取り扱いでオープンAI社のCEO、サム・アルトマン氏が一時解任されるという騒動にまで発展したといわれています。正確な内容は公表されていませんが、理論的思考を苦手とする生成AIが論理的思考ができるようになり、その取扱で揉めたとされています。

いずれにせよ、データ入力作業の分野においては、マルチモーダルAIの力で大方代替できる状況になってきています。レシート画像や給与明細などの画像をアップし画像の内容を答えさせると、レシートについては取引内容、給与明細については総支給額や源泉や社保の種類から預り額であり、仕訳の場合どう仕訳をするかまで回答してきます。

5 自立型エージェントの出現

そして、このマルチモーダルAIは細かなプロンプトを書かなくても欲しい答えを生成するようになってきています。これが自立型エージェントと呼ばれるものです。画像と欲しい答えのみで必要な回答をするというものです。冒頭で汎用型人工知能のお話をしましたが、汎用型人工知能の前に自立型エージェントが普及してくるでしょう。人が行っている従来の業務に大きく影響を与えてくると思います。

次回はこのマルチモーダルAIのもう少し細かい内容から、自立型エージェントの内容に触れていきたいと思います。

《参考文献》

『「万能AI」進む研究開発オープンAIの新計画浮上自律的に学習、数百万の課題処理人類脅かす可能性も』2023年12月1日付 日本経済新聞

『生成AI時代、危うい幕開けオープンAIアルトマン氏復帰あるべき経営「解」見えず』
2023年11月24日付 日本経済新聞

 




お問い合わせ

神奈川県川崎市で税理士・社会保険労務士をお探しなら

LR小川会計グループ

経営者のパートナーとして中小企業の皆さまをサポートします