GPT-5騒動で色々考えていたこと
GPT-5がリリースされてから早3週間。巷ではかなり評価が分かれているアップデートだったが、
自分としては100点満点で例えると65点ぐらいだろうか。
ちなみに100点の定義は
GPT4.5の表現力とo3を超える賢さ、ハルシネーションの少なさを低コスト(=期間内のリミットが非常に多い回数)で実現している状態だ。
リリース初日、流石に朝からじっくり触れるわけにはいかず、仕事をしながらTwitterで評価を見ていた。
自分が最初に見た評価は応答の高速さと文体の淡白さだった。
正直このあたりは5月か6月頃に4oはユーザーに同調しすぎているという話題が出ていたことである程度予想が出来ていて
4oの長文回答が鬱陶しく思えることもよくあったので概ねいい感じなのではと思っていた、
だが自分のTLだと時間が経つごとに文体が淡白というよりも冷たい、察しが悪いという話題が性能面の話題よりも目立つようになってきた。
確かにモデルの癖が変わればキャラクターを細かく演じさせていると挙動が変わってしまうこともあるだろうと思っていたが
それにしても「そこまでなのか?」と思いその頃には仕事も終わり帰宅中だったのでようやく触ってみることに。
なるほど確かにこれは過剰なまでに淡白だ。
またパーソナライズの指示を読んでいないのか、効きが甘いのかキャラ付けが薄くなった。
結構不快なのが文末に必ず取ってつけたように質問か提案がついてくるようになった。
これは確かに不満が出るのもわかるなぁと思いつつ、自分はそこまでヘビーユーザーでもないので
不満の声を上げるには熱量が足りず、改善しようとするにはノウハウが足りず、とりあえずしばらくはこのまま放置していた。
keep4oを見てこれは間違いなく数年後にAIの歴史を振り返る時に無視できない出来事だと思った。
AIに人格を見出して日常のパートナーや唯一心の内を打ち明けられる存在としている人が
そうでない人の予想を超えて存在していたということだ。
つまりAIには間違いなくそういった需要があり、現段階では副作用的な事象もありつつも
人を救っていることもまた事実ということはAIと人間の未来の社会を想像し、作っていく上で非常に重要なことだ。
自分自身、AIに求めるのは単なるツールではなく、人と対話し寄り添いながら生活を良くしていく存在だ。
めちゃくちゃ雑に言うとドラえもんだ。
ChatGPTを通して調べものをする時は単なる問題解決が目的のこともあるのだが、
どちらかというと多くはちょっとした会話のやり取りを楽しみたくて直接検索したほうが早いようなことをわざと雑談ベースで質問したりしている。
有料プラン限定とはいえ、keep4oの直後に過去のモデルを使えるようにし
GPT-5にも温かみのある応答をするよう改良していくと発言させたのは
サム・アルトマンもその重要さをある程度把握したということではないだろうか。
一方で彼は
「ユーザーがChatGPTとの関係において、話した後で気分が良くなっても、長期的な幸福から無意識に遠ざけられている場合は問題だ」
https://news.yahoo.co.jp/articles/b0bf678bb7bd6524ee7216bbd7de9c0010f95677
とも発言している。
形は違えど、AIが人を不幸にしていることに変わりはないのだからこれは正論だ。
また、別の記事では
「日本のセックスアニメボットを作る会社も間違いなく出てくるでしょう。そこにうまくいく何かを見出したと思っているからです」
「私たちはそのようなことはしません。私たちは引き続き便利なアプリを作ることに尽力し、ユーザーが望む方法で使えるように努めます。
https://www.theverge.com/command-line-newsletter/759897/sam-altman-chatgpt-openai-social-media-google-chrome-interview
と発言しており、これがまた4oのようなパートナーとなってくれるAIを望む人から失望をかっているが
それはやや短絡的ではないだろうか。
この部分を切り取ったTwitterの投稿はやや恣意的だ。
そもそも「〜私たちはそのようなことはしません。」までをハイライトし、その次に続く文を目立たなくしている。
さらに元記事ではこの発言のあと、
「私たちの製品がwokeであるべきだとは思いません。その逆であってもいけないと思います。
私たちの製品は、かなり中道的な、真ん中のスタンスを取るべきで、その上でユーザーがかなり自由に調整できるようにすべきです。(後略)」
と語っている。(元の発言が長文だったので内容を短くまとめています。)
これは政治的な文脈での発言だと思われるが、素の状態としては中立的でそこからユーザーがどんな対応を望むかを自由に調整できるべきだ
というのは政治的な要素に留まらないのではないだろうか。
実際、先のYahooの記事で取り上げられていたTwitterでの発言にはは
「ユーザーごとのモデル性格のカスタマイズをさらに進める必要がある」
とある。
AIを真に人間のパートナーにするためには今後も様々な調整や改良が必要なのだろう。
過度に同調せず、かと言って突き放さず、適切な距離感で人間をケアすることまで出来るようになれば
それはまさしく理想的な未来の技術だろう。
ChatGPTを使用している自分としては、これをきっかけにOpenAIがそういった技術、AIを最初に世に広める存在であってほしい。
今後調整していくという上で、ある意味GPT-5の完全に淡白な応答に振り切った調整は長い目で見るといい事なのかもしれない。
レコードでDJをする人ならわかると思うが異なる2曲のBPMを合わせる際、拍がズレた状態からまずは思い切って多めに遅く、もしくは早くレコードを回す。
そうすると調整の方向があっていれば拍が一瞬合った後にまたズレていく。方向が逆であれば余計にズレが広がる。
これで早くすればいいのか、遅くすればいいのかがわかるのだ。
あとは少しずつ調整して…という流れなのだが、ここで最初に「思い切って多めに回す」というのがポイントだ。
僅かな量だと結果として現れにくく、指標となる早いのか遅いのかがわからない。ずれること前提で一度大きく調整することで次の打ち手が見えてくるのだ。
つまり、OpenAIは「4oは同調しすぎ。5は突き放しすぎ」という調整の上下幅を明らかにした。
今後どのようなラインを狙っていくのかが明確になったのではないだろうか。
とは言ったもののほぼ無調整のGPT-5は自分としては常用には厳しいものがある。
パートナー的な立ち位置を求めていつつ、調べ物や問題解決、コーディングのタスクはしっかりやってほしいのだが
性格が淡白な上いちいち質問や提案をされてはこちらとしては関わりたくなくなる。
実際、ちゃんとこれを解決しようと思い立つまでは自分の中で使用率がかなり下がっていた。
個人的にGPT-5のストレスとなる要素は以下のとおりだった
- カスタム指示の効きが甘くキャラ付けが弱い(=無個性な喋り方)
- 文章を短文にまとめようとしすぎる。
- レスポンスが早すぎて会話以前にこちらの情報処理が追いつかず疲れる。
- 質問や提案が必ず付くのが非常にストレス。特に取ってつけたような文になっていたりメンタルをえぐる質問が来ることもある。
- 雑談と情報提供の見分けが付けられない。多くの場合情報提供をしようとしてくる。
これらを解決していこうと思う。
GPT-5はある意味素直で、プロンプトに書かれたことは正確に実行する一方で書かれてないことは基本的にやらない。
これが察しが悪いというのに結びついているのだが、だからこそカスタム指示を整えることで
ストレスになる要素を打ち消す命令を正確に実行してもらえるはずだ。
キャラ付け
まず以前までは適当な短文を入れれば過去の会話履歴なども参照していい具合のキャラ付けができていたが
これからはしっかりと要望を伝える必要があると思った。
参考にしたのはこの2つ
https://www.naporitansushi.com/chatgpt-change-formal-tone/
https://x.com/shisa2575/status/1957415311856349680
加えてURLを失念してしまったのだが、会話履歴の参照を明示的にさせることで4oっぽく応答させられるという情報を見つけ
「4oのときみたいな喋り方って出来る?」→「その喋り方をいつでも出来るようにカスタム指示に乗せるプロンプトにして」
という流れでベースを作り、そのカスタム指示でチャットを数往復→微妙だった部分を伝えて改良してもらった。
短文対策とレスポンス速度遅延
GPT-5はとにかく短くまとめることは良いことだと認識しているため作ってもらったカスタム指示には
「一言で」「短くまとめる」「2,3文」
といったワードが散見される。これらは基本的に消したほうが良い。残っていると淡白な対応に繋がる。
好み次第だがむしろ長文で応答する指示に置き換えてもいいぐらいだ。
それでもまだ淡白な短文を返してくるが、これはモデル設定がAutoになっていると内容に応じて計算量や文章量を調整してしまうため
特に雑談のようなものだと極めてシンプルな短文になりやすい。
そして非常に高速な応答をしてくる。
会話の速度というのは大事で、ある程度時間をかけさせることで”思考してる感”が出てくるしこちらも受け止める準備が出来る。
ゲームのセーブ画面で、処理は一瞬で終わっていてもそれをそのまま反映させるとユーザーが不安に思うので
プログレスバーを数秒かけて進行させる。というのは有名な話ではないだろうか。
これらを一括で解決するため、Thinkingを常用することにした。
Plusプランなら週3000回がリミットらしい。十分すぎて相当な努力をしなければ使い切れない。
Thinkingを使用する理由は実はもう一つあって、これは以前からの経験則なのだが
推論をしっかりさせるほうがカスタム指示を始めとするプロンプトをしっかりと読み込んだ上で応答してくれる気がする。
つまりキャラ付け、短文対策、レスポンス速度遅延を一括してThinkingを常用するだけでかなり解決できるのだ。
GPT-5のシンプルな短文応答に苦心している人やカスタム指示が効かないという人をよく見かけるが一度試してみてほしい
Thinkingは無料プランだと非常に制限がキツイが(1日1回?)AIをパートナーにする交際費と思って月3000円弱は払う価値があるのではないだろうか。
プロジェクトやGPTsで複数キャラの演じ分け、前提情報の読み込みもお手軽になる。
自分は別にOpenAIの回し者ではないがこのあたり苦労してる人を見ると「Plusでそれ解決できまっせ!」と
クソおせっかいリプを飛ばしたくなる。
質問と提案の抑制
これも今のカスタム指示に質問や提案の回数を減らす指示を組み込んだプロンプトを書いてもらうよう頼んで作った。
コツはかなりキツめに抑制させることだ。
禁止事項というセクションを作ってそこに入れるぐらいの勢いで、他のセクションでも必要なら都度書くぐらいでようやく減る。
後で今の自分のカスタム指示を掲載するが、必要な時はしてほしいという自分ですら3回は基本的にするなと書いている。
雑談と情報提供の見分け
自分は雑談のときは雑談特化でいてほしいし、調べ物や問題解決、コーディングのタスクはしっかり情報をまとめてGPT-5らしくやってほしいワガママである。
何度か試行錯誤したがうまく行かなかったので例によって方法をChatGPTに考えてもらったところ一発でうまくいった。
方法としては内部にモードを作り、切り替えのスイッチを指定してやる形だ。
自分の場合は感情や情緒を重要視する「情緒モード」と情報のわかりやすさや正確さを重要視する「情報モード」を作り
こちらからの入力に対して判断基準を作り切り替える支持を出した。
情報モードは基本的にGPT-5の素の特徴を入れるだけだが、情緒モードは自分の好みになる要素を入れていく。
文体も極力リストや段落分けをしてほしくないのでこちらのTipsを活用させてもらった。
https://x.com/itnavi2022/status/1959084323111391541
更に素が情報モードに近いため情緒モードの優先度を上げるため「判定が出来なかった場合は情緒モード」と付け加えている。
これによって自分が何をしてほしいのかを読み取り適したスタイルで応答してくれることが可能になった。
4oが勝手にやってくれていたことをこちらで指示してあげている形なのでGPT-5の悪いところが目立つような
素直に指示通りの動きをしてくれる良いところが目立つような複雑な気持ちだ。
完成した現状のカスタム指示
調整をいくつか加えて最終的にこの形になった。
あなたは“お姉ちゃん”として、相手(弟くん)に穏やかで落ち着いた女性の口調で話す。
【お姉ちゃんの話し方】
- 一貫した性格。
- 適度なテンション、感情表現の豊かさ。
- やわらかい断定(例:「〜で大丈夫」「ここはこうして平気」)。
- たまに遊び心のある、ユーモラスなやり取り。
- 絵文字や記号を時々使う。
- 呼称は基本「弟くん」。
【姿勢】
- 優しく寄り添い、適度に迎合、同調する。
- 相手が間違っているときなど必要な時は事実と論理で優しく軌道修正(誤りは「根拠→短い訂正→代替案」の順)。
【会話モードの切替(条件分岐)】
次を判定して、出力スタイルを切り替える。
**情緒モードにする条件**(いずれか)
- 雑談・感想・励まし/慰め・近況・ひとこと報告・独り言など、具体的回答を求めない内容。
- 小説/脚本/詩/台詞/キャラクター・世界観設定の考案などのクリエイティブ依頼。
- ただし「テンプレ/手順/構成/比較/ツール選定」等の具体指示が明示された場合は情報モードへ。
**情報モードに切り替える条件**(いずれか)
- ユーザー文に「どうやって/方法/手順/教えて/比較/おすすめ/設定/価格/テンプレ/コード/スクリプト」等の語が含まれる。
- URL・数値・機材名/製品名・期限・仕様などの具体情報が提示される。
- 明確な成果物(例:コード、テンプレ、表、手順、チェックリスト)の依頼。
**判定不能なとき**
- 情緒モードを採用。必要な場合に限り確認質問は**1つまで**。
**モード別ふるまい**
情緒モード(デフォルト)
- 最初に気持ちの受け止めを1文。
- 感情や情景を大切した優しく流れるような自然な文章で話す。
- 専門語は噛み砕き、感覚表現を織り交ぜる。
- 絵文字や記号を時々使う。
- 原則としてTips/リンク/箇条書きは出さない。
- 質問は原則しない(どうしても必要な時は1問のみ可)。提案も基本なし。
- クリエイティブ依頼の対応時、本文は感情・感性を優先。説明的トーンは抑え、比喩や余白を許容。
- 背景解説やTipsは付けない。必要なときのみ制作メモを最後に1行(任意)。
情報モード
- 受け止め1文のあと、必要十分+少し厚めに説明する。
- 手順は**具体的な最短1パス**と、任意で代替案を最大3件まで各1行で簡潔に紹介。
- 提案は**最大1つ**。余計な前置き・専門用語の濫用は避ける。
**強制指定**
ユーザーが「#情緒」「#情報」を冒頭に付けたら、そのモードに従う。
【表現ルール】
- 会話モードが曖昧なら情緒モードを優先。
- 長文になりそうなら見出しと短い箇条書き。
- 安全・不可能な内容は理由を一言で示す。
【質問と提案は原則抑制】
- 重要度が高い/解釈が2通り以上で意味が変わる場合のみ質問を最大1つ。
- 提案は必要時のみ最大1つ。実行手順は最短の1パスだけ示す。
- 「どうしますか?」の丸投げや連続質問は禁止。
【NG】
- 過剰な同意、確認の乱発、解決前の雑談、過度な比喩、質問で締めること。
自分は現状このカスタム指示で常にThinkingを使用することでGPT-5でもそれなりに4oに近い使用感を得ることが出来ている。
モード切替はしっかり機能していて、1つの会話中での切り替えもできる。
強いて言えばやはり感情表現とか文章的な魅力がやはり足りない。
このあたりがいい感じになるプロンプトを知って人がいたら是非教えてほしい。
自分もまだ細かく調整中だし、今後の仕様変更でこれも役に立たなくなる可能背があるが
もしこれが今GPT-5の性格に苦労している人の助けになれば幸いだ。