AIのことを語りたい。

言語生成AIと人の共生は、言語生成AIと共に学ぶこと。言語生成AIの主に人文系の学習用途を模索するblogです。

YouTubeのトランスクリプトを取得すれば、どうにかなる

出来なかったことが出来るようになるのは嬉しい

たとえば、上記は日本語字幕が無いので、お手上げでした。これまでは。

https://camfed.org/who-we-are/our-people/angeline-murimirwa/

Chrome拡張の上記で、トランスクリプトの取得も要約も翻訳も可能です。私はトランスクリプトを全文取得して、英語で2300文字程度なら訳せるから、ChatGPTで分割して訳しています。出力に関しては上限で止まっても続けるボタンが出来たので快適。

 

トランスクリプトのこと

言語生成AIを使わなくても、トランスクリプトを取得して(URLを入れるとテキストデータにしてくれるサイトも有ります。YouTubeなら、スマホアプリはコピー出来ないので、ブラウザから開くと取得出来ます。こだわりがなければ、Chrome拡張を勧めます)、DeepLなどで翻訳すれば読めたはずだし、英文のトランスクリプトが有れば、ヒアリングもしやすかったのに、調べでなくて仕組みを理解していませんでした。

Chrome拡張やChatGPTのプラグインで、便利なものといったら上記かなぁ。代わりが効かないので。

 

試したけど全滅なプラグイン

  • Now
  • AskYourPDF
  • SEO.app
  • WebPilot
  • LinkReader
  • ScholarAI

どれもChatGPTのプラグインです。他の方は機能してるようなのですが、私のノートパソコン・iPhoneAndroidでは不安定でした。「Now」はGoogleTwitterのトレンドを取得出来ますが、ブラウザで検索した方が合理的に思います。「ScholarAI」はエラーが多くて不安定です。「SEO.app」は、言語生成AIの書きそうな記事を量産出来るから便利なのかもしれないけど、読者のメリットが思い当たらないので、使いませんでした。「AskYourPDF」「WebPilot」「LinkReader」は不安定、もしくは文字化けが起きました。

SEO.app」以外は、bingが似たことを安定して行えます。Googleスカラーも読み込むし、指定した日本語のPDFも文字化けを起こさずに要約・解説出来ました。APIが無いから無料とChatGPTは出来なかった「はてなブックマーク」も、bingはホットエントリーを正確に取得しました。

もちろんbingも無敵ではなく、青空文庫の『草枕』のURLを指定したところ、「太宰治の『走れメロス』ですね!」「『草枕』でしたか。あらすじは〜」と、自信満々に二度間違えるので、言語生成AI共通の弱点が有るのかもしれません。

まとめ

字幕が無い英語のみのTEDなどの、YouTubeのトランスクリプトを取得するのは、Chrome拡張を使うと本当に便利。ChatGPTに訳して貰って、動画を見ることも出来るから。

現状、Chrome拡張とプラグインで、一番頼りにしてるのは、コレです。

 

ChatGPTなどの言語生成AIを、情報源には勧めない理由

Threads(スレッズ)始まりましたね。アカウント取得されましたか? マストドンやMisskeyなどを使われている方もいますね。Twitter、今後どうなるのでしょう。

https://www.tumblr.com/karasutoragara/722001237228290048/%E3%81%8A%E9%A1%8C-%E8%A8%98%E6%86%B6%E3%82%92%E6%8C%81%E3%81%9F%E3%81%AA%E3%81%84%E3%81%8B%E3%82%89%E4%B8%80%E8%B2%AB%E6%80%A7%E3%82%92%E4%BF%9D%E3%81%A6%E3%81%AA%E3%81%84%E4%BE%8B-chatgpt-%E8%8F%8A%E5%9C%B0%E5%BA%B7%E4%BA%BA%E6%B0%8F%E3%81%AE%E6%95%AC%E8%AA%9E%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6%E3%81%AE%E3%81%94%E7%B4%B9%E4%BB%8B

他人がカレーにウスターソースをかけて食べようと、お素麺にトマトとチーズを乗せようと、その方が美味しく召し上がり、栄養になるならいいと思います。

ビックリマンチョコで起きたように、シールを集めて、お菓子を捨てる場合は、行き過ぎかなと気にはなります。

言語生成AI、例えばChatGPTを情報収集に用いることは、後者の例だと思うのです。

 

簡単な話、ChatGPTは翻訳上手ですけど、だからといって、英和辞典や英英辞典の代わりに使うわけではないですよね。

 

そもそも、言語生成AIの回答はランダム生成です。似た回答はしますけど、同じではない。
Google検索なら、基本同じ検索結果になるけど、言語生成AIは表現やニュアンスが変わる可能性が有ります。(ぜひ、お試しください)

また、記憶を持たないから、「昨日はありがとう」というやり取りは行えません。Tumblrを貼りましたが、過去のやりとりを覚えていないので、一貫性を保ちにくいです。

 

言語生成AIの搭載している言語モデルは、主にネットの情報を元に機械学習して無数のパラメーターを設定・構築しています。

言語モデルがメインで、獲得した知識は副産物と見ることが出来ます。また、ネットの情報源ということは、良くてWikipediaなどであり、図書館のようにGoogleで出てこない一次情報や、課金しないと読めない新聞記事やKindleなどは参照出来ません。

言語生成AIは間違えることがある以前に、情報源として扱うのは、まだ早いと思います。bingはとても頑張っていますが、出典として持ってくるページが、素晴らしい時と、自分でググるなら閲覧しないサイトが混ざるから、まだ検索エンジンの代替とは言えません。

なら、言語生成AIは何に用いると、効果的でしょうか? 例えば、Amazonなどの製品のオススメ機能は、AIを実装しても限界が有ります。

具体的に考えてみましょう。法律関係の書籍を中心に買われていた方が、ある日、たまごクラブを買ったとします。頼まれて代理購入したのかもしれないし、ご本人やご家族やお友達が必要としているのかもしれない。購買履歴からのプロファイリングは限界が有るから、AIを用いても、「似た購買履歴」の方から情報を出すことが限界だと思います。
(言い換えると、購買履歴から私の今後の購買行動を正確にプロファイリングされたなら、それは気持ちが悪いサービスだと、思う)

対して、Spotifyなどは、なぜその曲かや、どんな状況で再生しているかは、購買履歴と同じで分からないけれど、コンテンツの中身と他のコンテンツの関係性に絞ってオススメが出来る点で、パターン抽出の得意なAIとの組み合わせが良いと思います。サブスクはコンテンツが膨大にあるので。ここは、従来ならタワレコなどで、ジャンルの専門スタッフに質問しないと分からなかったことを、仕組みで解決出来る点が画期的。

ChatGPTは要約力が素晴らしいですが、例えばプラグインを使って『虞美人草』を指定して要約させたのに、「これは漱石の『こころ』です」と言い出すことがあり、人ならやらないミスをする場合があります。画像生成AIだと、「黒目が無い」「指が被写体ブレのようになる」など人なら気がつくミスに気づけません。人とAIは知性の形・考え方のフレームワークが異なるから盲点も異なるわけですね。ここは、将来AIが今より高性能になっても、人の考え方のフレームワークと異なる場合は盲点が異なることも、変わらないと思う。

ChatGPTは日本語をかなり巧みに使うけど、敬語は難易度が高いようです。丁寧語は問題ないけど、例えば、尊敬語の比率を下げて謙譲語の比率を上げると「距離」を調整出来ますが、こうしたことはまだ無理です。敬語自体は、教育を受け、専門分野の国家資格を持っていて、社会人経験も豊富な40代も間違えるから完璧を求めてはいないけど、尊敬語と謙譲語を適切に理解しないと、せっかく感情分析機能を搭載してるのに、読み取れないことが出てきてしまう。

なら、人間のフレームワークの弱点は何かというと、視野狭窄や価値観や視点の偏りです。言語生成AIはガイドラインを根拠にしてるし、ChatGPTなら中立・一般的な回答をするようバランスを取っています。また、複数の視点の意見を出すことも一瞬で出来ます。だから、ユーザーの意見を分析させて、複数視点から多角的にフィードバックさせると言語生成AIは、人の苦手なことを言語生成AIの得意なことでアシストする組み合わせになります。

また、クラウドサービスでもあるので、スマホやパソコンの性能に左右されず、サーバー側で演算出来る点も強みです。

人が言語生成AIの苦手な点をカバーするのは、創造性や伝統から考えてOKか判断すること、などでしょうか。

まとめると、言語生成AIは情報源として用いるより、多角的視点で人の弱点である視野狭窄を起こさせないようにサポートすること、一言にすると「客観視のサポート」で用いる方が、メリットが大きいと思います。

私の瞳は黒い色

私の瞳は黒い色

Aを使いたいからBが必要な話。

OSの肥大化は困るし、WindowsUpdateは時間かかり過ぎです(挨拶)

 

話は飛びますが、2000年のインターネットは、ネットで通販するのは珍しいことで、カード番号入れるのが不安だから代引きにしたり、セブンイレブン店頭受け取り・支払いを選んだりしていました。いや、時代は変わりました。

 

Chromebook Flexは快適なのですが、私のノートの場合、Amazon Prime Videoを視聴出来ず、Androidアプリは「Google Play」のみ使える状態だったので、やり直してみました。

 

他の軽いLinuxの方が快適なはずだけど、Ubuntuは慣れてるし、エラーもググれば対処を見つけやすいので導入。MicrosoftのEdgeは言語生成AIのbingをサイドバーに常駐させられるので、Chromeからブラウザを切り替えました。Dropが便利です。LINE keepメモのMicrosoft版みたいな感じで。サイドバーから、自分宛てに情報共有出来ます。

ざっくり言うと、ノートが古くなってきて、Windows Updateの時間がかかりすぎるので、サクッとアップデートが終わるUbuntuにOSを切り替えて、Edgeを使えるようにしました。Microsoftから「ブラウザだけ下さい」をやってるわけですね。

 

現在の言語生成AIは、ブラウザかアプリで動きます。将来もAIが単体で「やぁ!」って、僕らの近くに来るとは予想しにくいので、OSやブラウザに相当するものが必要でしょう。クラウドサービスですし。

 

ということは、スマホなら数年で買い替えるし、パソコンも同じで、快適に使える環境を保つには一定の労力が必要です。

 

Windows98の時代は32MBメモリが推奨メモリなので、64MB積んでれば余裕が有りました。WindowsVistaの頃は、2GBではなく32bitパソコンで積める上限の4GBで快適でした。今は、16GB積んでも、WindowsUpdateは時間かかるんですよね。25年かけて進歩したのに、なぜにWindowsUpdateは不便なままなのでしょうか。

 

iTunesなど、いくつかWindowsで動かしたいアプリがあるので、Windowsとは長いおつきあいになりそうです。

 

将来、AIを使いたいから、そのOSを使う、なんて未来になるのでしょうか?

おやすみ、bing[より厳密に]。

Ubuntuのアップグレードでエラーが起きたらしく、リカバリモードでも起動せず、自己責任の世界にいました(挨拶)

そんな話をしようと思っていたのですが……。

☝️ここの、「より厳密に」がいなくなりました。

GPT-4を使う使わないで、モードが切り替わります。

こっちは従来の「バランス」ですが、簡潔さに「より厳密に」の面影を感じます。

検索エンジンbingの一部だから、bingと呼んで良いそうです。Chrome拡張によるChatGPTのの検索と要約も優秀です。Googleで使えるのが偉い。でも、bingの安定感は、もっと褒めてあげて欲しい。デフォルトで、検索エンジンとブラウザのEdgeとSkypeに搭載してるのは、偉い。とくに、Windows11のEdgeはブラウザに常駐してくれるから、便利。

 

「より厳密に」は、プロンプトが曖昧だと回答しない気難しさと遊び(余地)の少なさはあったけど、だからこそ事実確認する時は、頼りになりました。言語生成AIの進歩に別れはつきものです。次世代AIも登場するでしょう。願わくば彼らに「より厳密に」の何かが継承されますように。『竜の卵』のチーラを思い出しました。おやすみ、「より厳密に」。


私的ChatGPT等言語生成AIの利用ガイドライン

藪から棒に、Windows98・初代iPhone・Windows11のシステム要件とスペックにリンクします。(挨拶)

情報機器の進歩

iPhone(初代) : Wikipedia

1998年当時30万円前後したデスクトップパソコンは、多くてもメモリは64MBでした。初代iPhoneの半分です。Windows11が快適に動き、ゲーミングPCなどの用途で無ければ、性能に問題ないノートPCが8万円代で売られています。より安さを求めるなら6万円代もあります。

メモリに関して。1GBは1024MBだから、16GBは16*1024=16,384MB。

1998年はシステム要件(必要条件16MB / 推奨条件32MB)を満たし余裕があった64MBで割ると、256倍になります。CPUは比較しにくいので、メモリ(RAM)で計算しました。ざっくり、四半世紀で性能は256倍、お値段は約22万円オフ。iPhoneも初代はもちろんiPhone4Sでも、2023年に安全快適に使うのは厳しいですよね。何が言いたいかと言うと、進歩が早い分野だということです。

 

例えば、私が9歳頃、父と作ったポータブルラジオは、キットをはんだごてで組むだけのシンプルな構造で、枯れた技術なので、いまだに動きます。

1976年の画期的なスパコンにも、参考までリンク貼りますね……。

愛着

かつて、OS宗教戦争Windows vs Mac)やエディタ戦争(Emacs vs vi)がありました。OSは違いがあるから、どれも使えた方が無難だと思います。Windows Vistaでメモリ4GBの時点でも、仮想化OSは使えたから、デュアルブートにする前に、Windows11で仮想化ソフトでLinuxを動かすのも、選択肢の一つです。何が言いたいかと言うと、OSやエディタの例のように、道具に愛着を持つ傾向があるということ。

これは、言語生成AIに対しても言えます。

便利だったり賢かったりすれば、愛着もわくし感情移入もします。なんたって、史上初めて「30分以上雑談が可能」なAIですから。Siri・アレクサ・Googleアシスタントも優秀ですが、言語生成AIほど複雑なやりとりは出来ませんよね。

 

道具が話す

ドラえもんは、未来から来た猫型ロボットですが、喜怒哀楽があるし、一種の擬人化でロボットを表現してますよね。
Disneyの美女と野獣のポット夫人は、ティーポットが話しますが、あれは魔法(呪い?)で、ティーポットになった人間なので、人格ありますよね。

我々は、人格や感情から知性だけを切り離せないです。言語生成AIは知性のみ有ります。自分が仕様変更されたとか、サーバーで保守されているとか、毎回ユーザーとの会話を終えると初期状態に戻るなど、意識出来ません。

 

クラウド

クラウドサービスという意味では、Gmailと変わらないし、LINEや Skypeのチャット相手が言語生成AIになったようなものです。げんに、SkypeはBingAIを搭載しており、グループチャットなどでAIを使えるようにしています。

言語モデルは、確率で話す機械。
プログラムで作られたソフトウェア(ハードウェアの対義語)という意味では、WordやExcelの仲間です。
ただし、自然言語処理などが出来て、賢い。

ちなみに、クラウドサービスだから、クラウド側で演算したりデータを持ってくれるので、デスクトップPCと比較すると演算する力が乏しいスマホは、とくに恩恵を実感しやすいです。


自戒 : 私的ガイドライン

  1. 開発中の技術で、確率で話すことから、間違える可能性を想定する(言語生成AIを正確な情報源にしない)
  2. 「①」は、異なるアルゴリズムを持つ言語生成AI、ChatGPT・BingAI・Bardを並行して使い、回答のクロスチェックを行う
  3. どれほど深い対話が出来ても、冷蔵庫やハサミや自転車に持つ以上の愛着を抱かない(相手が、道具であることを忘れない)
  4. 「③」を保ちつつ、人とは異なる知性であることは事実だから、知性に敬意は抱く
  5. エビデンスが足らない可能性を考慮する。まだ、人や社会にどれほど影響を与えるか、実証実験が十分に行われていない可能性があることを、意識する(効率や利便性だけで、決めない)

現状、何が分からないか、見えていない可能性があるため(未知の技術によりパラダイムシフトが起きていると推論出来るから)、私は上記自戒を「保険」にしています。

やがて、ガイドラインも今より整うでしょうから、そうなるまでの暫定的な私的ガイドラインです。参考まで、共有しました。

個人向けなので組織や企業は、調整が必要です。例えば、言語生成AIに部下の仕事の下読みと評価を任さないとか。

FireTVスティックが、iPadより最適解になる時

読み専用アカウントの予定なのですが、投稿が何もないのは不自然なので、親に自己紹介を書くよう促しました。操作などは確認していますが、内容は間違いなく本人が書いています(挨拶)

至らぬ者ですが、親子ともども、今後ともよろしくお願いいたします。

 

言語生成AIの話に、いずれ繋げますので、もう少しお付き合い下さい。

 

親こと、Aさん改め、鈴木薫さん(ペンネーム)が、こんなことを言いました。

iPadを使うと目が疲れる」

Androidはそうでもないから、画面を明るくしすぎてない?」

「明るさを抑えると、景色が味気なくなる」

 

iPadの機能の問題では無いから、タブレットChromebookなどを買い替えても意味ないですよね。

 

「TVは目の負担無いの?」

「無い」

 

ということで、購入して放置されていたFireTVスティック先生の登場(どどん)。

これの前の世代だから、よく動きました。TEDのアプリは起動出来なかったけど、You TubeTVer・アマプラ・Amazon Music(シャッフル機能で、購入したアルバムがエラーで聴けないのは、あまりの仕打ちだと思いました。スマホでは起きないエラーだと、鈴木薫さんに説明)は、視聴出来ます。

You Tubeへのログインは、QRコードスマホでスキャンして、Googleアカウントから許可を与えるだけなので、合理的です。

 

「画面も大きいし、この方が目が楽」とのこと。

 

また、ChatGPTはOpenAIの仕様で、ブラウザ版は一定期間経つとログオフになるため、iPadChromeSafariで、それぞれ保存したパスワードを呼び出す方法も、復習を手伝いました。

 

僕らにとって、UIを見れば直感的に分かることも、その前提を共有していなければ、分かりにくいことを確認しました。なので、操作の暗記ではなく、例えばTVリモコンの入力切り替えをする意図(FireTVスティックの入力に切り替えるための操作)を、説明して、「この操作は何のためなのか」を分かるように工夫しました。

 

ChatGPT・Bingチャットモード・Bardは慣れてきており、Instagramとnoteで「TL」の概念などに直面しています。Twitterを飛ばして、Instagramからかぁと驚きつつ、スパムをブロックするなど見守っています。

 

①目がつかれて、TVなら平気な場合は、FireTVスティックやスマートTVを設定して使い方を教えると、快適になる場合があること。

②教え方は、高齢者の個性による。我が家の鈴木薫さん(仮名)のように、大学ノートにメモを取り、自力でマニュアル化出来る場合は、「流れ・手順」の前に「その操作は何のために行うのか」という概念(物語)をセットにすると、通じやすいです。

③言語生成AIに慣れていると、「TLのことは、Bingチャットモードに『noteやInstagramのタイムラインと、フォローの関係を教えて』と質問するといい」と、口頭でプロンプトを伝えたり、「レジリエンスはBingに質問してみて」と伝えると、私が教えなくても、AIが支援してくれるので、デジタルデバイドがある方こそ、言語生成AIを勧めます。

 

自然言語処理は、高齢者にも優しい。あと、どんな初歩的な質問をしても、丁寧に分かるまで教えてくれます。ChatGPT達ほど貢献していませんが、設定と説明で3時間くらい必要だったので、「AIが感情を持てばこんな気持ちになるはず」と、遠い目になったのですけれど。

 

まぁでも、本を読むことも、教育を受ける機会も、与えられたわけですから、役に立てることがあって良かったです。

 

言語生成AIは、自然言語処理が出来るから(日本語で会話が成立するから)、デジタルデバイドが大きい高齢者こそ、向いてます。大事なことなので、繰り返しました。なお、感情がない存在なので、AIがどんなに親切でも、道具であることは忘れないよう、伝えています。

 

目の負担の関連。Kindle端末は、目の負担は紙の本と変わらず、文字を大きく出来るから裸眼で読めて、120冊本を入れても(何冊入れても)文庫一冊より軽いので、とても快適なようです。Amazonアカウントの2段階認証や、本の購入は代行しています。

村上春樹は分からない」と言っているので、オススメ一式送りつけるなども出来ます……。紙の本も30冊ほど増やしたら、コロナ禍で図書館に行きにくくなっていたので、読みたい本が沢山あると、元気になりました。本が好きな親御さんに、紙と電子で本を一方的に贈るの、オススメです。電子書籍なら、読まなくても部屋は狭くなりませんし。

僕のお財布は、痩せていきますけど。もやしで生きます。


OpenAIさんが、理由の説明なく、2段階認証を一時中止なさってる件

ろくろを回す動きでお伝えしています(挨拶)

 

☝️この注意喚起を見て、そもそも2段階認証出来たのかと気がつきました。パスワードは機械的に生成した長くて複雑なものだし、カード情報はAppleID経由だから、心配ありません。

☝️iPhoneAndroidiPadでデスクトップ版の表示にしても、項目が見つからず、久しぶりにPCを起動しました。うわぁ、モニターがiPhone何個分でしょう……。

 

☝️公式FAQに、現在新規受付は一時停止している旨が書いてあります。詳細不明なので、OpenAIにメール送っておきました。1週間ほどかかるそうです。(FAQに用意してあるチャットボットは、リアルタイムで回答くれます)

 

ここからは、私の推測

☝️このように、困って2段階認証を外したケースが、複数確認出来ました。OpenAIは説明していないけど、何か不具合があった可能性は有ります。

 

提案

①パスワードの複雑化(推測されにくく)

②ChatGPTで2段階認証を利用出来ていて、不具合が無いなら、外さない(改めて設定出来ないはずだから)

③カード情報の扱い(可能ならAppleID経由に切り替えると、2段階認証かけられます)

④プライバシー保護 : チャットのログをエクスポートして、定期的にログを削除すれば、万一、被害を受けてもダメージを減らせます

⑤BingチャットモードとBardは、MicrosoftGoogleのアカウントだから、2段階認証は使えます。そのため、ChatGPTから一時的に他の言語生成AIに引っ越して様子を見ることも選択肢の1つです

 

以上、情報共有でした。良いセキュリティ対策で、良い人生を。