最近のAIモデルが「考えている」数秒間、画面に流れていく思考プロセスのテキストを眺めるのが密かな楽しみになっている。人間のように迷い、自己訂正し、時には堂々巡りをする。推論モデルの台頭によって、私たちはLLMの「脳内」を可視化できるようになった。しかし、ふと思うのだ。あのブラックボックスの中で繰り広げられる脳内会議は、どこまで私たちがコントロールできるものなのだろうか。
「AIにキャラクターを演じさせる」という古くて新しい命題において、出力の語尾を調整するだけの時代は終わりを告げようとしている。今、注目すべきは「どう答えさせるか」ではなく「どう考えさせるか」だ。
GitHub上で1400以上のスターを集めているリポジトリ「deepseek_v4_rolepaly_instruct」は、DeepSeek-V4におけるロールプレイの質を一段階引き上げる、非常に興味深いハックを提示している。それは、AIの思考プロセス(Chain of Thought)そのもののスタイルを強制的に切り替えるというアプローチだ。
思考回路を「俳優」にするか、「監督」にするか
このリポジトリの核心は、DeepSeekの<think>タグ内で展開される推論プロセスを、「キャラクター没入(角色沉浸)」と「純粋な分析(纯分析)」の2つのモードに意図的に誘導する点にある。
これまでのプロンプトエンジニアリングでは、出力結果をキャラクターに寄せることに注力してきた。しかし、この手法は「思考段階からキャラクターになりきらせる」か、あるいは「俯瞰的なメタ視点でロジックを組み立てさせる」かを選択する。
| モード | 思考プロセス(<think>内の挙動) | 最終的な出力への影響 |
|---|---|---|
| キャラクター没入 | 一人称での内的独白。(例:「彼に挨拶されてしまった…どうしよう、心拍数が上がっている」) | 感情の起伏が豊かで、生々しくリアルな反応になりやすい。 |
| 純粋な分析 | 客観的な状況分析と戦略立案。(例:「ユーザーが挨拶した。キャラクターはツンデレ設定。まずはそっけない態度を示しつつ、行動で本音を匂わせる」) | 設定の破綻が少なく、プロットや文字数の制御など構造的に安定した出力になる。 |
俳優のように完全に役に入り込ませてアドリブの妙を引き出すか、あるいは監督のように冷静にシーンを計算させるか。思考のベクトルを操作することで、間接的にアウトプットの質感が劇的に変わるのだ。
システムプロンプトの定石を崩す注入ポイント
技術的に面白いのは、この制御命令(インストラクション)を差し込む「場所」だ。通常、こうしたモデルの振る舞いを決定づける指示はシステムプロンプトに記述するのがセオリーとされている。しかし、このリポジトリでは「第一ターンのユーザーメッセージの末尾」に配置することを強く推奨している。
理由は極めて実践的だ。開発者によれば、この位置がモデルの事前学習・ファインチューニング時における注入位置と合致しており、最も安定して効果を発揮するからだという。実際のAPI実装を想定すると、以下のような処理になる。
def build_messages(system_prompt, user_msg, mode="inner_os"):
# 第一ターンのユーザー入力末尾に、特殊な制御命令を結合する
if mode == "inner_os":
user_msg += INNER_OS_MARKER # 没入モードの長文プロンプト
elif mode == "no_inner_os":
user_msg += NO_INNER_OS_MARKER # 分析モードの長文プロンプト
return [
{"role": "system", "content": system_prompt},
{"role": "user", "content": user_msg},
]
一度このコンテキストが履歴に積まれれば、第二ターン以降は一切の追加指示なしに、AIは指定された思考モードを維持し続ける。コンテキストウィンドウの仕様を逆手に取った、非常にスマートな実装だ。
トークンを「こじ開ける」泥臭い試み
リポジトリの末尾には、もう一つの荒技が記されている。それは、推論の開始を示す特別なトークン<|begin▁of▁thinking|>の直後に特定の文字(例えば「うん、わかった」など)を強制的に出力させ、モデルを特定のパターン(QA、執筆、エージェントなど)に引きずり込むという手法だ。
これは専用の訓練を経ていない「ガチャ」に近いハックだと作者も認めているが、こうした泥臭い探求こそが現在のプロンプトエンジニアリングの最前線でもある。モデルが巨大化し、賢くなればなるほど、私たちエンジニアはシステムを「説得」するのではなく、アーキテクチャの隙間を突いて「調教」する方法を探し求めているのだ。
出力ではなく、思考そのものをハックする。推論モデルの時代において、私たちがデザインすべきはAIの「言葉」ではなく、「脳の動かし方」になりつつある。
参考リポジトリ: victorchen96/deepseek_v4_rolepaly_instruct
Photo by Immo Wegmann on Unsplash