たぶん2024年も変わらず使える、プロンプトエンジニアリングのコツ

@fladdict https://t.co/LiySJtSSoU

深津さんのこの記事は凄く正しい。Windows98で覚えた概念は現在も使えるけど、操作方法も性能も変化しました。

ChatGPTは一般的中立的で粘り強い。Bardは人に近い振る舞いをする代わりに不安定。Bingは逆でAIらしく振る舞うから安定します。

異なる「個性」。
— カラストラガラ | 探求者: ChatGPTと3万文字話す者 (@KarasuToragara) 2023年6月10日

☝️これが私のスタンスです。

また、他の方が探求してくださる方面は、取り上げないことにしています。皆んなで手分け作業した方が、合理的だから。

それと、このブログに来て下さった方の、時間を増やす（節約する）ことも目指しています。

時間は希少財だから。

多角的視点

言語生成AIに、多角的に具体的に回答して欲しい時は『「あなたの結論・意見・感想、賛成・反対・盲点・人文科学・社会科学・自然科学・私のメタ認知を支援する観点」から、必要な観点を選び、多角的なフィードバックをお願い。』と、指示すると合理的です。言語生成AIが、必要な観点を選んで答えます。

あなたの結論
意見
感想
賛成
反対
盲点
人文科学
社会科学
自然科学
私のメタ認知を支援する観点

10項目あります。私はiPhoneに辞書登録して呼び出して使っています。ヘーゲルの弁証法を含めるとか、カントの視点とか、アレンジは自由です。「盲点」と「メタ認知」は、指定して損は無いです。「人文科学・社会科学・自然科学」は、「学問領域に根拠があるなら、その全て」を指示出来ます。

言語生成AIが20年先のAIに進化したとしても、「多角的な視点の提供が得意」な点は変わらないはずです。感情を持たず、ガイドラインを根拠に動くから、人より偏りは少ないはずです。また、「多角的に」とか「どう思う？」と質問するよりも、具体的に指示を出して、その中から選ばせる方法も、効果があるはずです。

言語生成AI喋り過ぎ問題

人間なら「簡潔に」「結論とその理由」という趣旨を伝えれば、回答がコンパクトになります。「体言止めと漢字の多用で文字数を節約し、最小限の文字数で回答して」とプロンプトで指示すると、話し方が変わります。Bardは簡潔に話すし、ChatGPTは指示を守ろうとします。「最小限の文字数で」だけでも有効ですが、体言止めと漢字の多用も指定すると、回答の密度を高められます。

例えば、BingAIに「xxxの画像を作りました。Instagramで見てもらいたい。画像と関係があるハッシュタグを、Instagramと人気がある順で、英語のハッシュタグを25個教えて。ハッシュタグは半角スペースで区切り、改行せずに一行で教えて。その後で、ハッシュタグの概要を簡潔に解説して。」と話したとします。解説が冗長で文字数制限に引っかかるなら、体言止め云々と伝えると「了解。検索する」みたいに、言動が変わります。

「生成」と言うくらいで、とんでもない量のテキストを生み出します。誰でも量は手に入るわけだから、例えば言語生成AIの回答をブログなどに貼り付けて更新しまくれば、ブログサービスのポータルで、キーワードをその方の記事が埋め尽くしてしまい、スパムと似た状態になります。書き手も読み手もブログサービス運営社も不幸になるので、「質」で勝負することを、私は勧めます。

質を上げるには、その人が考えて付加価値をつけた方がいいし、より良く考えるには、AIに簡潔かつ密度の高い回答をさせることが効果的です。

ChatGPT Plusの例

BingAIの例
 Bardの例

技術の進歩

言語生成AIの未来は、専門的、極めて複雑、影響範囲が過去のイノベーションを越えるはず（過去のイノベーション自体を強化出来るから）だと考えていますが、未来のことを予言できませんから、過去を振り返ります。

Windows98を28万で買った時、OSもテキストファイルとバイナリファイルの違いも知りませんでした。USB1.0は1996年に生まれていますが、CompaqのPCには搭載されていませんでした。たぶん、Windows98SEあたりで、2000年頃、USBの存在を認識しました。PCの電源が入っているのに、抜き差し出来る点に驚きました。

2000年8月に、ようやくブロードバンドが私の地域でもサービス開始したので、ネットを始めました。blogもWordPressも存在しません。Googleに気がつくまでは、他の検索エンジンを使っていました。ホームページは、ホームページビルダーから始め、HTMLソースコードに不要な情報が書かれることが気になり、テキストエディタで更新し、フリーソフトのFFFTPで更新しました。

つまり、「CPUとメモリとストレージとOSを積んだ機械で、プロバイダーと契約し、モデムを通してネットを利用できる。ネットの閲覧だけでなく、FTP通信でサイトの更新も行える。サーバーの任意のフォルダへファイルを置くと、そのパスがURLに反映される。HTMLはテキストファイルで、JPEG画像はバイナリファイルである。HTMLはタグを用いることで、テキストファイルを構造化し、ブラウザに対して設計図のような役割を担う」といった点は、現在も使えます。対して、ホームページビルダーの操作に詳しくなっても、WordPressでサイトを構築するには、あまり助けにならないですよね。

言語生成AIも同じことが起きるはずです。例えば、MacOSXの水準の完成度ではなく、現在の言語生成AIは、開発中の技術のはずです。

だから、MS-DOSからWindowsに変わって何が起きたかを思い出すと、言語生成AIの変わらないと予想出来る点と、変わるはずの要素を区別出来ますよね。

例えば、言語生成AIのトンチンカンなミスは、時間が解決するはずです。

対して、言語生成AIはAIとしての考え方のフレームワークを持つから、人なら直感的に気がつける問題を見落とす盲点は無くせないはずです。

言語生成AIの盲点は何かを把握すれば、人が補えるので、生産性が上がります。プロンプトエンジニアリングを行うなら、こうした観点は、AIが進歩しても使えると予想できます。