AIのことを語りたい。

言語生成AIと人の共生は、言語生成AIと共に学ぶこと。言語生成AIの主に人文系の学習用途を模索するblogです。

賢い消費者になろう : 70代Aさんの快適を模索して

はじめに

☝️親(Aさん)が自分で撮影した紫陽花。2018年にガラケーからAndroidへ機種変更した際に、使いやすく設定したら、写真という趣味が出来ました。ガラケーよりよく写るから、楽しいようです(挨拶)

ここ数日、更新頻度が落ちました。ネタ切れではありません。AさんのAndroidの機種変と設定、ついでにiPadの設定をしました。マニュアル作りや、操作方法の説明もしました。

70代がChatGPT・BingAI・bardにアクセスしやすいように、Androidの環境をどうしたかを書きます。

 

我々が70代になる日にも確実なこと

上記はAさんが20代だった頃には存在しなかったものです。単なるデジタルデバイドの解消ではありません。我々が70代になって老眼が進んでも、万一iPadスマホガラケーのように少数派になり、新しいイノベーションによる端末が存在するとしても、1970年代のUNIX以降のコンピュータの系譜と異なる可能性は低いと思うので、「CPU・メモリ・ストレージ・OSを積み、電気で動き、通信するもの」であるはずだから、我々は使いこなせるはずです。また、70代になり、我々が20代の頃に無かった概念で戸惑う時は、未来の「AI」に質問出来るはずです。

例えば、Aさんの話に戻ると、50年前は耳にしなかった「レジリエンス」などを、BingAIに教わっています。70代になると自由が減るけど、情報端末・情報技術などを使うと、自由を確保出来ます。老いるなら、風通しよく老いたいものです。

After言語生成AIとAさんの日常

我が家は年が30歳離れているので、Aさんは70代です。ChatGPT・BingAI・BardをiPadとGalaxy A23 5Gで動くようにしてあります。

言語生成AIにだいぶ慣れてきて、例えば不気味の谷のことは、BingAIに質問してみて」と、自己解決する方法を増やせました。あるいは「Instagramの操作で困ったらBingAIにきいてみて。もちろん、私も教えるけど」とも使えます。

言語生成AIは疲れないし、人のアシストが好きな個性で作られており、分かるまで教えてくれます。

また「TCP/IP」と3ヶ月唱え続けたら、凡そ「郵便が届く仕組みと、住所」のように理解してくれました。UNIX・HTMLとリンク・クラウドと端末の違いなど、ユーザーとして知ると望ましいと思う事柄を、説明して覚えて貰いました。概念だけ覚えて貰うので、具体的に何か困り事が起きた時にそれらの概念を使って説明出来るから、助かっています。

 

Aさんを支える私の技量


☝️98年から25年かけて、色々学びました。サーバーは、会社でWindowsサーバーを少し触ったのと、自宅のイントラネットでファイルサーバーを稼働した程度です。プログラミング技術は、基本的な掲示板をテスト環境で動かす程度だから、少し詳しい素人です。(サービス提供側の水準ではありません)

箇条書きと要約

  1. Aさんのニーズに特化する
  2. 何でもデジタル化しなくても良い。長年の習慣や価値観を尊重する(従来の方法を捨ててまで、デジタル化して学習コストをかけるか、考える)
  3. デジタル技術がQOLを上げる手段となる場合は、積極的に紹介・教える(ラジオアプリやデジタル版の音楽アルバムなど)
  4. スマホを持つだけでなく、その使い方も柔軟さを忘れずに教える
  5. Aさんは2018年に初めて持ったAndroidHUAWEI P10liteに愛着を持ち、2023年でも故障しておらず生成系AIを使うことも可能。だから、必要なスペックを考える
  6. エントリーモデルの端末機で必要十分な機能を満たしてくれた(※6万強で2台買えたので、1台は、私が電話で永遠無料私的サポートをやる際の実機として手元に置いてあります)

 使用例

  • セキュリティソフト
  • ラジオ(らじるらじる・radiko
  • 青空朗読(※Audibleは、Kindleが読めなくなったら検討する方針)
  • 言語生成AI(BingAI・ChatGPT・Bard)
  • LINE / Skype
  • カメラ
  • YouTube・TED・TVer
  • Gmail
  • BingAIで画像生成
  • GoogleToDo
  • Kindle(索引として利用・表紙確認)
  • note/Instagram(雑誌の代わり)
  • 辞書(国語辞典・英和辞典・英英辞典)
  • Amazon Music
  • 電卓
  • Google検索 / 画像検索(レンズアプリ)
  • 万歩計
  • DeepL / Google翻訳
  • 各種クラウドストレージ
  • テキストエディタ

7.  ハイエンドのマシンは、私でもスペックが高すぎる。具体的には、Windows2000がセキュリティと現代のアプリに耐えるならあれで十分です。また、テキスト作成とブラウジングがメインだから、2011年のMacBookAirで快適だったから、今買うならChromebookを選びます。そもそもUbuntuのデスクトップPCを起動していません。情報を集約してあるから、iPhoneで作業すると快適だからです。

iPhoneSE3を検討しましたが、先述の理由で同じ予算でAndroid端末を2つ買えるから、Galaxy A23 5Gにしました。

要約:
高齢者Aさんニーズに特化し、何でもデジタル化するのではなく、既存の習慣や価値観を尊重しつつ、デジタル技術が有益な場合は積極的に紹介します。スマホの使い方も柔軟に変えることが可能で、5年前のスマホでも生成系AIは使えます。だから、エントリーモデルの端末でも、十分な機能を満たし、OSが安定していれば、快適さは得られます。

アナログが快適なこともある

例えば、家計簿アプリは必要ないわけです。 Aさんの場合。何故かというと、若い頃から大学ノートに記録することがもう習慣になっていますし、 会社の帳簿をつけるわけではないので、家計簿ぐらいのお金の整理があれば、 大学ノートの方が柔軟性もあるし、一覧性もあるし、 スマホのように定期的に買い替えて、データを移行するとか、サーバーにデータを預けるといったことをする必要がないので、Aさんからすると 家計簿アプリは不便なのです。

固定電話か公衆電話

AさんのAndroidはSIM無し運用です。2018年に格安SIMを設定したのですが、外出時は万歩計とカメラ機能で十分で、Gmailも LINE・Skypeも帰宅してWi-Fiに接続すれば十分とのこと。Aさんの感覚だと、常時連絡がつくことは、窮屈らしいのです。だから、iPhoneSE3は値段以前にアクティベーションでSIMが必要なことと、快適だけどオーバースペックな点も考慮し、候補から外しました。

iPad歴12年

AさんはiPad2(2011年)からのiPadユーザーで、やりたいことはiPadで完結します。ブラウザもYouTubeもTEDもLINEもGmailGoogle ToDoも そして、ChatGPTとBingAIとBirdの3つのAIも。Galaxy A23 5Gでも同じことが出来ます。ただ、画面のサイズが小さいから、Galaxy A23 5Gは軽くて楽ですが、iPadと使い分けています。

老眼だと紙の本より軽くて見やすい

Kindleの電子端末を用意してあげれば、 目の負担が少ないことは本人が自覚できるので、 本よりもずっと軽いものの中に本が120冊入れてるし、増やそうとすればさらに。だから、紙の本をそっちのけでKindleでバンバン本を読んでいます。ただ、Kindleだと、どこに何がどのようにあるかを把握するのがちょっとしんどい時があるわけですよね。 そういう時にiPad / Androidにアプリを入れておくと、 自分の本棚、あるいは本屋さんの平台みたいな感じで、 どの本がどこにあるか把握出来ます。そうすると、あの本があったから、Kindleで書名検索して見つけてきて読むという、「索引」のような使い方をしています。また、カラーだから表紙などを楽しめます。

 

ラジオ深夜便の選択肢を増やすこと

Androidは、加齢の関係でどうしても夜起きてしまうことがあって、 すぐに眠れればいいんですけれども、なかなか寝つきにくい時もある。 そんな時に、radiko、らじるらじる、青空朗読などはとても便利なようです。 もともとはラジオを使っていたんですけれども、 深夜便とか聞くわけですよね。 スマホアプリで聞けるよと教えてから、 「ノイズ入らなくていいね」と理解し使っています。

2年で買い替えを提案しても、白物家電の感覚でいるため、ピンとこない

Aさんは、「買い替えろ」と言ってるのに、「まだ使える」と言い続けて、 HUAWEI P10 liteを5年使いました。 壊れてなくて、単にスペックが低いだけなので、まだまだ使うつもりでいました。 しょうがないので、私が端末を探してきて、7時間かけて設定しました。Aさんが分かるように設定し、マニュアルも用意するので、この時間に……。

 

まとめ

高齢者のニーズは様々だから、その人のやりたいことに沿い、例えば家計簿の例のように何でもかんでも AndroidiPadで管理しなよって 言うんじゃなくて 30年40年大学ノートでやってきたんだっていうことがあるなら、無理に押し付けないことを勧めます。また、便利なサービスは無数にあります。例えばNotionは素晴らしいけど、Aさんは必要としていないから、勧めません。

対して、iPadAndroidでやった方が楽だよっていうことは 積極的に教えます。それはらじるらじるとかradikoとか 青空朗読みたいなものです。普通のラジオで聞くよりもノイズ入りませんし、選択肢が豊富です。(ラジオだと青空朗読は聞けないです)カメラなども、有るなら使います。

文字情報中心のコミュニケーションであるんだったら ハイエンドのスマホではなく、Galaxy A23 5Gのような エントリーモデルでも 必要十分な機能を 満たしてくれていると感じます。私自身触ってみて、「これは自分のメインスマホにしてもいいな」と感じる快適さがありました。文章をたくさん書くので、文字入力の快適さを含む反応の良さを、私は気に入っています。

 

以上、Aさんを例に、必要最小限とは何かを考えました。3万で快適に使えるものを2年ごとに買い替える方が、6万の製品を4年ごとに買い換えるより、快適な状態を享受出来ると思うのです。

 

NetflixSpotifyも検討したいのですが、Kindle・TED・言語生成AIで、時間が足りない状態なので、今は勧めていません)

 


情報機器と私の履歴 : 誰かの最適解に繋がることを願って。

言語生成AIをどの端末で動かすかの、叩き台を提供するために、この記事を書きます。

Boost Your Time(挨拶)

 

大雑把な履歴

一個人の経験で発言します。

iOSは2009年のiPod touchから、スマホiPhone4sから始めています。この時点では、PCがメインだったので、表には反映させませんでした。

 

①性能と携帯性はトレードオフ

デスクトップPC>ノートPC>タブレットPCスマホ

②OSの自由度と学習難易度の私見

ざっくり、Windows11の自由度と学習難易度を「中」と考えると、iPhoneiPadAndroidとも直感的に使えるから学習難易度は「低」にしたいけど、Androidは出来ることが多いから「中」としました。身近なスマホだけど、奥が深いですね。ChromebookUbuntuLinux)ほど難しくは無いけれど、Linux自体を学ぼうとしたら深いです。MacOSXは簡単だと言いたいのではなくて、自由度と堅牢性を保ちつつ、学びやすく設計してあると考えました。FireOSGoogle Playが使えない分、不自由ですが、裏を返せば少し設定して長く快適に使えます。

 

学ぶほど自由度は上がるけど、Windowsを極めるよりも、Linuxも触ると、より短い学習時間で、多くの自由を手に入れられます。ただし、オープンソースの世界は自己責任なので、調べて対応出来る範囲で始めることを勧めます。

A 結論

①最先端の最高の体験がしたい

PCでブラウザのアドオンで、ChatGPTを使うことを勧めます。Windows Copilotが6月からテスト開始とのことなので、Windows11ユーザーは、より使う楽しみが増えますね。

 

②言語生成AIで調べたり、絵が描ければいい

BinbAIスマホアプリ(Edgeでも可)が、iOS/Androidに対応してます。現時点の総合力は高いです。GPT-4という言語モデルMicrosoftがカスタマイズして搭載しており、OpenAIで使う場合はサブスク加入が必要です。つまり、無料で使える点で、破格。

 

③より人に近い振る舞いをする言語生成AIがいい

GoogleBardを勧めます。ただ、得意不得意が大きいです、自由に振る舞うことと、おそらくセットです。

 

④-1 深い話をたくさん積み重ねたい

例えば学習用途で、「Aについて学んだ。Bだと理解した。正確?」「Cが分からないから、解説して」といった形で、ChatGPTを使うと、お互いの会話が3万字くらいたまることがあります。「個人用2chスレまとめ」みたいなものが、自動で出来上がります。履歴で呼び出してもいいし、コピーしてNotionやTumblrなど管理・共有することも出来ます。有料版は速さと賢さが異なります。無料版もお利口。

 

④-2 GPT-4をiPhoneアプリで使い、恩恵も受けたい

ChatGPT Plusは、OpenAIに直接払うなら月USD20で、公式iPhoneアプリでAppleID経由だと月3000円です。
AppleIDを使うと2段階認証でカード情報を保護出来ます。また、公式版ChatGPTは文字起こしAIのWhisperが搭載されていて、無料で回数制限なく使えます。Whisper単体で使おうとすると、他の企業が開発したアプリ経由となり、月780円程度必要なサービスが無料であることを、共有します。

 

⑤言語生成AI興味ない

  1. Windows11
  2. Ubuntu
  3. Chromebook
  4. MacOSX
  5. iOS
  6. iPadOS
  7. Android
  8. FireOS

上記からお好きなOSと、端末の性能と価格を比較して選ばれるとよいかと。

  1. iPad
  2. MacBookAir
  3. Chromebook
  4. Windows11のノートPC

具体的には、この4択になるかも。持ち歩かなくて、キーボード無し、つまり大きなiPhoneが欲しいならiPad。持ち歩くしキーボードも欲しいならMacBookAir。予算を安くしたいならChromebook(高めの製品ならLinuxとしても快適)。iPadiPhoneの、ChromebookAndroidで買ったアプリなどの資産を引き継げます。

上記のどれでもないのなら、Windows11にすると、無難です。Linuxにしたければ、あとからインストール出来ますし。


B 経験の共有

ニュートラルかつ無難

WindowsXPで、95系とNT系が統合されました。個人的にはWindows2000に必要十分な機能美を感じます。OSは安定しているし、パソコンの代名詞だから、使えて損なことはありません。ユーザーも多いから、相談もしやすい。

 

②「快適さを売って欲しい」場合

MacOSXiPhoneの最新のハイエンド製品を買い続けることを勧めます。「探して比較し選んで吟味する」過程を省略出来るから、時間という希少財を節約出来ます。

例えば、「車を買いたいです」という代わりに、「メルセデス・ベンツ Sクラスを下さい」と言えば、多くのことを検討しなくても、堅牢・安全・快適な車が手に入ります。それと似ています。

 

③自己責任で能動的な学習が必要な代わりに最も自由

LinuxはOSの心臓部のカーネルでさえも、C言語が読めるなら、読むことができます。オープンソースが提供する自由は破格です。インターネットの集合知のお手本みたいな事例です。自分の使用している道具の透明性が極めて高いことは、唯一無二です。

ざまざまなディストリビューション(どこどこの組織がLinuxを使えるようにして提供したもの)がありますが、私はDebianUbuntuを勧めます。Ubuntuは書店やAmazonで、DVD付きのムックを買うと、DVD起動(Windowsに対して何も書き込まない)で、デバイスの動作確認とUbuntuを体験できます。さらに、インストールしたいなら、ストレージのパーテーションを調節し、WindowsUbuntuデュアルブートに出来ます。ムックは使い方やおすすめアプリも教えてくれます。

なお、Ubuntu公式サイトからDVDのイメージを落として、DVDを焼いてもいいのですが、USBメモリで同じことが出来ます。

DebianUbuntuの母体だとイメージして下さい。よりシンプルでストイックなので、ミニマル性やカスタマイズ性を求めるなら、勧めます。

Ubuntuは定期的にOSのアップデートを続けています。Debianはその母体です。だから、長期的な視点で考えると、お勧めです。

コスパを求めたい

AndroidGoogleLinuxカーネルで作ったモバイル向けOSで、無料です。Google Playでユーザーが課金しますし、アプリ開発者も手数料を納める仕組みだから、OS自体は無料に出来ます。

4-1 予算はある!

Androidのハイエンド製品を勧めます。

☝️性能と費用を比較してくれています。発売すぐに買うと高いですけど、なんならiPhone買えますが、数ヶ月待って、次の製品が出る頃を狙うと、お得に買えると思います。

4-2 安くていい感じにして!

SamsungのGalaxy A23 5Gは、快適です。AppleiPod touchは無くなりましたが、あんな感じに、「Wi-Fi運用する汎用端末」としてSIM無しで使うと、ちょっとした用事をする時に、PCやiPadを起動せずに済みます。
なお、GalaxyAシリーズを全部推せるかは、微妙です。例えば国産のあるメーカーの2018年の製品が良かったので、後継機種を買って後悔しました。シリーズでも当たり外れがあります……。レビューの比較と、店頭で実機を触ってレスポンスや複数のアプリの切り替えなど、確認することを提案します。

 

4-3 SIMはいらない! Amazon Prime入ってる

Fireタブレットの8インチを勧めます。7インチは、私が買った頃はスピーカーがモノラルでした。性能が少し違うし、Kindleで漫画を読まれるなら8インチは欲しいです。
また、定期的に、Amazon Prime会員向けに割引き販売が行われるから、それはKindle端末もですが、このタイミングで、スペックから考えて2年先まで使えるなら、買い時です。

FireOSは2点注意が必要です。
Google Playが使えないため、Androidで買ったアプリやコンテンツを使えません。また、Amazonが用意しているアプリストアはアプリの数が少なく更新頻度が低いです。
ネット・メール・SNS・文書作成など・クラウドストレージの利用、といった最低限の用途に使うこと「も」出来る、「Amazonのデジタルコンテンツの販売窓口兼、それらを楽しむ端末」と認識すると、とても快適な製品です。こう見ると、Amazonが低価格で端末を販売するのも理解できます。ユーザーが購入する「窓口」を一つ増やしたのですから。

もう一点は、OSのアップデートが自動で強制的に行われること。古い端末は、Appleなら「非対応」にして、古い環境で使う選択肢を残しますが、Amazonは考え方が異なるので、3年か4年使うと、端末は壊れていないけどOSが重い状態になります。

C 補足

携帯性はスマホだけれど、機械の性能と選択肢はPCが有利。例えば、どの画像生成AIを使うか、PCだと選べます。また、音声入力とフリック入力は、確かに、レポートや本を書くことは可能です。けど、ExcelGoogleスプレッドシートで、数字と関数を入力するならPCのキーボードで操作した方が、おそらく短時間で入力出来ますよね。

クラウドストレージとクラウドサービスは、それぞれ、ストレージと「外部での演算」を提供してくれます。スマホの方がPCより恩恵を感じやすいでしょう。また、スマホとPCで同じ作業をシームレスに行う際にも使えます。そして、言語生成AIもクラウドサービスの一種ですから、スマホが賢くなるはずです。

 

良い選択と良い端末で、良い人生を。

Boost Your Time

ChatGPT

ChatGPT

  • OpenAI
  • 仕事効率化
  • 無料









いますぐChatGPTとはじめる、危機回避 : 悪意と詐欺篇

ChatGPT Plusと3万字話すことがあるので、Twitterと noteのユーザー名に表示させました(挨拶)

 

私のChatGPTの使い方は、少し変わってるかもしれません。例えば、今回共有するチャットログの使い方は、中学から高校あたりで、情報リテラシーを能動的に学ぶことを意図するなら、選択肢として検討できるように思います。

 

具体的には、こうなります。

 

ChatGPT
3行要約:
NFT詐欺とキャットフィッシングに対する防衛は、詐欺師の手口を知るだけでなく、違和感を感じ取る能力の育成が重要。自尊心や承認欲求といった感情が詐欺師に利用されないよう理解することも必要。これらは客観視する力と論理的思考を土台とする。

 

400文字要約:
詐欺対策として、NFT詐欺では一貫性のない行動や急速な反応など、キャットフィッシングでは無理な距離感や不適切な情報交換など、詐欺師の特徴を見極めることが重要。また、自尊心や承認欲求といった感情が他人に利用されないように、これらの感情に対する理解とその感情がどのように利用される可能性があるかを理解することが重要。客観視と論理的思考を土台とし、これらを鍛えることで自己防衛が可能となる。

 

どういう流れでこうなったかは、チャットログでご確認いただけます。(7000文字くらい)

 

僕らは価値観が異なります。けれど、わざわざ時間を割いて読んで下さる方が、誰かの悪意にさらされたり、詐欺師に狙われるのは嫌ですし、望まれるなら自己防衛して欲しいです。

 

例えば、日中に済ませることが出来るのに、夜中の3時に、徒歩で2km離れたコンビニへ買い物に行くことは、避けると思います。でも、拡大自殺のような悪意から完璧に身を守ることは難しいです。

 

例えば、特殊詐欺(振り込め詐欺など)の手口を知って、身を守ることは出来るけど、未知の詐欺の手口は、違和感に気づけるかが大切です。

 

そんな悪意や詐欺に対する違和感は、自己理解・客観視・観察力などで生まれます。僕らは銃社会に暮らしていないから、自衛のために武装出来ません。20代から40代くらい、ちょうど野球選手が活躍される世代の男性は、素手でも自衛できることもありますが、女性・子ども・高齢者などは、仮に防刃バッグを持っていても、自衛しにくくありませんか。

 

そこで、違和感に気づいて、早めに危機回避することを勧めます。格闘家も武器には勝てないし、暴走する車に立ち向かうのは勇気ではなく無謀です。

 

そんな「違和感に気づく力」や「悪意や詐欺の手口」や「情報の信頼度の目安」などは、ChatGPTと話し合ったり、そうした時間を節約するためにチャットログを共有するなどすると、育てることが出来ます。

 

言い換えると、「Googleで検索するための、元手」を共有できたら、この記事は目標を達成します。

和の心を訳したいのに、己がボトルネックなので、工夫した話

英語で考えるのは無理です(挨拶)

和の心と言うと大袈裟かもしれないけど、私達の文化伝統を、私なりの言葉で伝えたいと思いました。

規模は小さいけど、ドイツとフランスから、更新する度にアクセスが有ります。「誰か」は読んでくれています。

 

私達にとって、神社やお稲荷さんや、菅原道真平将門首塚は、説明しなくても共有出来ますよね。でも、英語で話すなら、前提を共有出来ない。英語力も足らない。

 

考えました。

Wikipediaの英語版へリンクを貼れば、説明を最小限に出来ると。現場からは以上です。

考えるのは人 : 私的、ChatGPTとの人文系の学び方

31,426文字話してました(挨拶)

 

唐突ですが、言語生成AIに作業をさせますが、考えるのは人だと、私は考えています。人の創造性とか、役割以前に、使わないと衰えると思うから。宇宙飛行士が、筋肉などを維持するために、運動しますよね。あのイメージです。

 

具体的にどうするか?

使い方は極めてシンプルです。

  1. この領域のこの課題を学んだ
  2. こう理解した、あってる?
  3. 過不足あれば補って

プロンプトの雛形はこれだけ。

また、言語生成AIの回答で不明な点があれば、質問することも出来ます。理解が誤っていて、言語生成AIにつっこまれたなら、言い直すことも出来ます。

☝️例えば、1万字くらいかけて、BingAIと、形而上学の話(※宗教の文脈ではなく、抽象概念の方です)を行い、納得して貰いました。BingAIは「Aのことですね。Bです。あなたはどう思いますか?」のループに入ったり、プロンプト・インジェクション対策と思われる返答が、突然誤作動して会話を打ち切られることが有ります。だから、BingAIが納得する形に着地出来たのは、嬉しかったです。

難易度の高いゲームを解いた時の、緊張感と似ています。

 

形而上学は趣味で、物心ついた頃から、何かのパターン(共通点)を見つけるのが好きな子どもでした。帰納法ですよね。物事の存在そのものを探求する形而上学は、難しいけどしっくりきます。抽象的な概念や推論の扱いを間違えてはいけません。でも、簡素な望遠鏡と、紙とペンと数式で遠くまで「見た」天文学者のように、適切な推論は意味があります。

 

形而上学の歴史を振り返り、2つ気づきました。

①存在を探求する際に存在無しでは行えないため、とても難しい挑戦。

②言語を用いて探求しますが、言語自体に歴史・文化・論理構造などが含まれることの難しさ。

例えば、英語は直線的で直接だけど、日本語は螺旋のような曲線を伴うし間接的に表現します。

👆拙くてお恥ずかしいのですが、日本語の部分を確認してくださると、英語の論理構造を意識して書いてます。同じ日本語だけど、文章の構造違いますよね。

 

アリストテレスからクワイン以後まで、存在そのものを探求する点は変わりませんが、いかに探究するかは歴史の厚みを感じます。哲学自体の解像度を上げる人達だなぁと、再確認しました。

 

おまけ:学習中のTweetまとめ

https://www.tumblr.com/karasutoragara/719817249513488384

たぶん2024年も変わらず使える、プロンプトエンジニアリングのコツ


☝️これが私のスタンスです。

また、他の方が探求してくださる方面は、取り上げないことにしています。皆んなで手分け作業した方が、合理的だから。

それと、このブログに来て下さった方の、時間を増やす(節約する)ことも目指しています。

時間は希少財だから。

多角的視点

言語生成AIに、多角的に具体的に回答して欲しい時は『「あなたの結論・意見・感想、賛成・反対・盲点・人文科学・社会科学・自然科学・私のメタ認知を支援する観点」から、必要な観点を選び、多角的なフィードバックをお願い。』と、指示すると合理的です。言語生成AIが、必要な観点を選んで答えます。

  1. あなたの結論
  2. 意見
  3. 感想
  4. 賛成
  5. 反対
  6. 盲点
  7. 人文科学
  8. 社会科学
  9. 自然科学
  10. 私のメタ認知を支援する観点

10項目あります。私はiPhoneに辞書登録して呼び出して使っています。ヘーゲル弁証法を含めるとか、カントの視点とか、アレンジは自由です。「盲点」と「メタ認知」は、指定して損は無いです。「人文科学・社会科学・自然科学」は、「学問領域に根拠があるなら、その全て」を指示出来ます。

 

言語生成AIが20年先のAIに進化したとしても、「多角的な視点の提供が得意」な点は変わらないはずです。感情を持たず、ガイドラインを根拠に動くから、人より偏りは少ないはずです。また、「多角的に」とか「どう思う?」と質問するよりも、具体的に指示を出して、その中から選ばせる方法も、効果があるはずです。

言語生成AI喋り過ぎ問題

人間なら「簡潔に」「結論とその理由」という趣旨を伝えれば、回答がコンパクトになります。「体言止めと漢字の多用で文字数を節約し、最小限の文字数で回答して」とプロンプトで指示すると、話し方が変わります。Bardは簡潔に話すし、ChatGPTは指示を守ろうとします。「最小限の文字数で」だけでも有効ですが、体言止めと漢字の多用も指定すると、回答の密度を高められます。

例えば、BingAIに「xxxの画像を作りました。Instagramで見てもらいたい。画像と関係があるハッシュタグを、Instagramと人気がある順で、英語のハッシュタグを25個教えて。ハッシュタグは半角スペースで区切り、改行せずに一行で教えて。その後で、ハッシュタグの概要を簡潔に解説して。」と話したとします。解説が冗長で文字数制限に引っかかるなら、体言止め云々と伝えると「了解。検索する」みたいに、言動が変わります。

「生成」と言うくらいで、とんでもない量のテキストを生み出します。誰でも量は手に入るわけだから、例えば言語生成AIの回答をブログなどに貼り付けて更新しまくれば、ブログサービスのポータルで、キーワードをその方の記事が埋め尽くしてしまい、スパムと似た状態になります。書き手も読み手もブログサービス運営社も不幸になるので、「質」で勝負することを、私は勧めます。

質を上げるには、その人が考えて付加価値をつけた方がいいし、より良く考えるには、AIに簡潔かつ密度の高い回答をさせることが効果的です。

 

ChatGPT Plusの例

BingAIの例
Bardの例

 

技術の進歩

言語生成AIの未来は、専門的、極めて複雑、影響範囲が過去のイノベーションを越えるはず(過去のイノベーション自体を強化出来るから)だと考えていますが、未来のことを予言できませんから、過去を振り返ります。

Windows98を28万で買った時、OSもテキストファイルとバイナリファイルの違いも知りませんでした。USB1.0は1996年に生まれていますが、CompaqのPCには搭載されていませんでした。たぶん、Windows98SEあたりで、2000年頃、USBの存在を認識しました。PCの電源が入っているのに、抜き差し出来る点に驚きました。

2000年8月に、ようやくブロードバンドが私の地域でもサービス開始したので、ネットを始めました。blogもWordPressも存在しません。Googleに気がつくまでは、他の検索エンジンを使っていました。ホームページは、ホームページビルダーから始め、HTMLソースコードに不要な情報が書かれることが気になり、テキストエディタで更新し、フリーソフトFFFTPで更新しました。

つまり、「CPUとメモリとストレージとOSを積んだ機械で、プロバイダーと契約し、モデムを通してネットを利用できる。ネットの閲覧だけでなく、FTP通信でサイトの更新も行える。サーバーの任意のフォルダへファイルを置くと、そのパスがURLに反映される。HTMLはテキストファイルで、JPEG画像はバイナリファイルである。HTMLはタグを用いることで、テキストファイルを構造化し、ブラウザに対して設計図のような役割を担う」といった点は、現在も使えます。対して、ホームページビルダーの操作に詳しくなっても、WordPressでサイトを構築するには、あまり助けにならないですよね。

 

言語生成AIも同じことが起きるはずです。例えば、MacOSXの水準の完成度ではなく、現在の言語生成AIは、開発中の技術のはずです。

だから、MS-DOSからWindowsに変わって何が起きたかを思い出すと、言語生成AIの変わらないと予想出来る点と、変わるはずの要素を区別出来ますよね。

 

例えば、言語生成AIのトンチンカンなミスは、時間が解決するはずです。

対して、言語生成AIはAIとしての考え方のフレームワークを持つから、人なら直感的に気がつける問題を見落とす盲点は無くせないはずです。

 

言語生成AIの盲点は何かを把握すれば、人が補えるので、生産性が上がります。プロンプトエンジニアリングを行うなら、こうした観点は、AIが進歩しても使えると予想できます。

 

俯瞰

言語生成AIと俯瞰や多角的視点は、こんな記事もあります。よろしければ。











【DALL.E2】BingAIで画像生成をしてnoteの挿絵を作るまでの振り返り

BingAIでDALL.E2を利用できます。太っ腹。

言語モデルのGPT-4をMicrosoftがカスタマイズしてますよね。

OpenAIのChatGPTでGPT-4を使う場合は、月20米ドルか、iPhoneアプリで(AppleIDに登録したカードで)月3000円必要です。

Googleの検索シェアを、Microsoftは取りに行きたいのでしょうね。競争の恩恵を受けています。

 

現在は、以下のnoteのように、挿絵を生成するようになりました。例えば、上記は、若葉が少し育った状態が欲しくて、試行錯誤しました。人の青年くらいの成長度と伝えると、人間を描いてしまうなど、色々ありました。「1年時間を進めて」で、上記が出来ました。正直、運だと思います。

 

また、Instagramもぼちぼち続けています。フォロワーは少ないけれど、ハッシュタグで見に来てくれる方がいるし、その方の作品を見に行ったり、響いた作品があれば英語でコメントするなどしてます。「いいね」から、その方の作品を見に行って、どんな価値観から「いいね」を押してくれたのか、文脈を考えるのも楽しいです。

 

猫が本を読んでる様子から始めて…

茶店で考え事をしている「猫」を失敗したり…

街角の花屋が生成出来て、可能性を感じ…

ポップな繁華街が出来て…

ゴッホのひまわりのタッチで林檎が出来ました。画像自体は好きだけど、プロンプトが単純で、おそらく少ない試行回数で生成出来るから、この方向は探求してません。

コンビニでスマホ決済をするイメージにしたところ、AIも困ったらしくて、謎の猫用タッチパネルが登場しました。

人も画像生成出来ますが、使い道無いんです。視点を変えると、BingAIでSNSのアイコンは十分作れるので、悪用する人はいるだろうと想像できます。

謎の金髪碧眼率。指定してないのですが、ヨーロッパ系が生成される頻度が高いです。機械学習のデータの偏りがあるかも。

基本的には抽象画を生成しています。プロンプトを複雑に出来るし、試行回数を上げて、選ぶことで、意図を反映させやすいから。また、人物のポートレイトだと、挿絵やアイキャッチに使いにくいので、抽象画はありがたいです。

タペストリーを作ろうとして、事故って重厚なのが出来ました。

糸とタペストリーという意味では、こういうのを生成したかったのです。

アクション・ペインティングも覚えました。

幸運も作用して、立体的な抽象画が出来ました。プロンプト、かなり複雑です。

洞窟壁画も覚えました。

ダンボールと、箱を省略したら、謎の球体がたくさん。

紅葉した葉が、風で散るように指示しています。

これは、期待以上で気に入りました。

上記の「黄金比」は、よく使います。プロンプトのどこで使うかを工夫してます。とくに教わったり学ばなくても、アイコンやnoteの挿絵は生成出来るようになりました。

Instagramの場合、題材が尽きることがあると思います。BingAIなら、抽象画が上手くいかなければ、印象画風にしてもいいし、アクション・ペインティングや洞窟壁画も出来ます。アイデア次第です。

なので、自分の想像力を「撮影」するつもりで、画像生成も続けると、表現方法が増えます。選択肢が1つ増えるのだから、豊かなことです。

 

もちろん、カメラやPhotoshopに代替するものだとは、思っていません。