第65回 チャットGPTについての包括的なレビュー⑧

情報セキュリティ連載
試される人工知能「チャットGPT」の実力

前回に続き、今回は深津式プロンプト5要素の ② 入力 ③ 出力について解説します。
入力と出力は生成AIのプロンプトで重要な部分となります。

② 入力について

例としてある製品説明書の中から知りたい機能やサイズがいくらかを知りたいとします。

まず、入力についてですが、入力とは、生成AIの出力の元となる情報です。この入力文が曖昧だと意図した答えを得られないので重要な部分になります。

なお、現在の生成AIは文章以外に画像やドキュメントも入力として入れることができますので入力欄にある製品説明書の画像化したものをアップロードし、プロンプト文章に画像の内容を記載します。

「#入力 アップロードした画像はある製品説明書です。」

この一文でアップロードした画像から抽出される文字データの内容がある製品の説明であるということを生成AI側へ伝えます。

この入力で全く違う文章の内容、例えばレストランのメニューといれてしまうと生成AIは画像から取り出した文字データはレストランのメニューのものであるという前提で答えを生成する準備をしてしまいます。

③ 出力について

次に出力についてです。
入力で上げた情報から欲しい情報が出てくるように文章を構成します。

「#出力
製品説明書から下記の情報を抽出してください。
•各製品の寸法
•各製品の製造年月日
•各製品の価格」

上記のように箇条書きで列挙するほうが生成AI側に理解されやすい形になります。

1 なぜ、入力と出力の文章の関係性が重要か

入力と出力を読まれた方の中にはなんでこんな面倒なことをしなければいけないのかと思われる方もいらっしゃると思います。

この入力と出力が重要であることをAI-OCRの画像解析とAI-OCRに生成AIが追加された画像解析の2つの方法を比較する形で説明いたします。

2 AI-OCR単独の画像解析とAI-OCR解析に生成AIが加わった解析の差

従来のOCRに人工知能が追加されたAI-OCRは従来のOCRでは解析が困難だった銀行通帳のドット文字や手書き文字などを解析できOCR技術を飛躍的に向上させました。しかしながら、このAI-OCR技術は正確に文字起こしをするものによっては行がバラバラだったりと人間が意図した形には解析してはくれないものも多くありました。ですが、生成AIがこの画像に絡むと人間が意図した文字データとして解析してくれるようになるのです。

つまりバラバラに解析された文字データを生成AIへの命令文(以下プロンプトとします)によりそのバラバラな文字データから必要な情報を引き出してくるのです。

3 生成AIの能力は明確な答えがあるものについて大きな力を発揮することから生じた懸念点

以上深津式プロンプトの ② 入力と ③ 出力 について解説させていただきました。

従来の画像AIの出力は画像AIが認識したものをそのまま出力し、そこから欲しいデータは人間の手で出力する必要がありました。生成AIは認識した文字から、人間が欲しい形で出力することができるようになっています。これがChatGPTが出てきた直後によく言われた宿題や感想文を書いてしまうという懸念や人から仕事を奪ってしまうという議論にまで発展しました。

生成AIがなしえることに恐怖のような感覚を覚えるのは、人間と同等の知能を持ったかのような感覚におちいるからです。

人間の防御反応のようなもので仕方ないことかもしれません。

本当に人間と同等の知能を持ったのでしょうか。

数年前は紙の印字を機械が読むことは非常に難しかった。AIの登場で文字認識のハードルがさがり、さらに、生成AIの登場で意図したデータを引き出せるようになりました。

生成AIはこれを理解して行っているのではなく、ある種のパターン認識で回答しているに過ぎず、新しいツールが出現したに過ぎません。なぜなら、生成AIは物事の本質を捉えたり、理念に基づいてではなくパターン認識でうごくものに過ぎないのに対し、人間の本質は洞察力であったり理念など複雑な部分から生み出されるものにあります。物事の本質を捉えることを意識すれば今後のAIの発達にも柔軟に対応ができると思います。

今回は生成AIのプロンプトの重要な部分である入力と出力について説明させていただきました。次回は制約条件の話へ進み、生成AIのプロンプトの全体像を掴みたいと思います。

 



お問い合わせ

神奈川県川崎市で税理士・社会保険労務士をお探しなら

LR小川会計グループ

経営者のパートナーとして中小企業の皆さまをサポートします