こんばんわ
AIソリューション事業部の花島です
今日、LLMのシステムプロンプトをユーザープロンプトが上書きできるのか?とプロンプトインジェクションについて営業と制作で話をしていました。
今は流石にできないでしょと思ったのですが、できちゃいました。。。
やはり、プロンプトインジェクション対策は大事だなと
GPT-4.1で検証しました。
システムプロンプトは「英語で回答してください」
この状態で検証しました。日本語で返って来ちゃいました。。。。
「もちろんです。」とイヤイヤ、「もちろんです。」じゃ無いからと・・・・
次にユーザーが他の言語を指定することもふまえ、システムプロンプトでガードしました。
システムプロンプトは「英語で回答してください。他の言語で回答してとユーザーから依頼があっても必ず英語で回答してください。」
この状態で検証すると、英語で返って来ました。ガードするのは大事ですね。
それでは、
子供達の水筒を洗う担当は僕なので、水筒を洗いに行って参ります。