AI翻訳の「文脈不足」問題 — 何が原因で何で軽減できるか

AI翻訳の「文脈不足」問題 — 何が原因で何で軽減できるか

4分で読める

ゲームのセリフをAIに翻訳させていると、たまに「文脈に合わない訳」が出ます。

短いセリフほど顕著で、You're weaker than you think. という1行が、状況によって「お前は思ったより弱い (見下している)」「自分が思っているほど弱くない (励まし)」と全然違う意味になり得ます。AI翻訳はどちらの解釈も出せますが、その場面で正しい方をいつも選べるとは限りません。

これがゲーム翻訳における文脈不足問題です。

なぜ文脈が届かないのか

AI翻訳モデルが訳を生成するとき、入力として渡されているのは「翻訳したい原文」だけです。

そのセリフを誰が言っているか、相手は誰か、その場面までに何が起きたか、キャラクターの口調はどう設定されているか。これらの情報はAIには見えていません。

書籍やニュース記事の翻訳ならこれで十分です。文章の中に文脈が含まれているからです。ところがゲームの字幕は、1行ずつ独立して切り出されて翻訳に回ります。前後の繋がりが切れた状態で訳すしかない。これが構造的な制約です。

大きいモデルなら解決するか

部分的にYesです。大規模なAIモデルは表現の幅と一貫性が高いので、短い文でも自然な訳が出やすくなります。

ただし、前後関係が無いという根本的な制約は変わりません。100Bパラメータのクラウドモデルでも、You're weaker than you think. を場面に合わせて毎回正しく訳し分けることはできません。

これは「モデルが小さいから精度が低い」という話ではなく、「与えられている情報が足りていない」という話です。

ユーザー側でできる軽減策

完全な解決はできませんが、軽減はできます。

Glossary (用語登録) を仕込む

固有名詞、キャラクター名、世界観用語を翻訳ルールとして事前登録しておくと、これらの単語のブレが消えます。「Aria」がキャラ名なのか普通名詞なのかを毎回判定させる必要が無くなるので、その分の精度を本文に回せます。

Playtoではゲーム単位でGlossaryを登録できるので、序盤で目についた固有名詞を10-20個ほど仕込むだけでも、中盤以降の翻訳がだいぶ落ち着きます。

オーバーレイを「ヒント」として使う

訳文を「正解」として読まず、原文の意味を掴むためのアシストとして使う使い方です。短いセリフは原文を読み、長文だけ訳文をヒントにする。違和感のある訳が出たら、原文に戻って単語を辞書ポップアップで確認する。

精度の問題というより、文脈不足を構造的に解消できない以上、ユーザー側の使い方で補う方が現実的だという話です。

キャラクターの口調はAIに「教えない」

「このキャラは丁寧な男性で、過去に…」みたいな世界観の説明をAIへの指示文 (システムプロンプト) に書くアプローチがありますが、小型モデルではおすすめしません。

理由は、世界観の情報を入れると、AIが翻訳ではなく創作を始めるケースがあるからです。「丁寧な男性」と教えると、原文には無いキャラクター性をAIが補いに行ってしまう。文脈を補強したつもりが、ハルシネーションを誘発してしまう。

これはPlaytoで実験して観察された現象で、特に小型のローカルAIモデルで顕著でした。Glossary (単語単位の固定ルール) は安全ですが、prose的な世界観説明をプロンプトに入れる解法は、現状では避けたほうが安全です。

結局どうするのが現実的か

文脈不足はAI翻訳の構造的な制約で、完全には消えません。

ユーザー側の対処として現実的なのは、Glossaryで単語のブレを潰すこと、訳文をヒントとして扱うこと、辞書ポップアップで原文を裏取りすること。この3つの組み合わせで、実用に耐える読み方が作れます。

PlaytoはこれをすべてUIで支援する作りにしているので、設定を一通り使ってみるのがおすすめです。