ゲームジャンルと翻訳ツールの相性 — どんなゲームでOCRが効くか
画面のテキストを読み取って翻訳するツール (Playtoを含む) は、どのゲームでも同じように効くわけではありません。テキストの量、画面の動き、フォントの種類、字幕の表示時間。これらの組み合わせが、ジャンル別の相性を決めます。
Playtoの開発と並行していろんなジャンルを試してきたのですが、「余裕で読める」「ちょっと工夫が要る」「これは厳しい」という傾向がだいぶ見えてきたので、今回はその整理をします。
画面OCRが刺さりやすい3条件
ざっくり言うと、画面OCRが効きやすいゲームには3つの傾向があります。
1つ目は、画面が止まる時間があること。テキスト表示中はゲームが進行を待つか、進んでもゆっくり、というタイプです。2つ目は、テキストが出る位置が固定されていること。ダイアログボックス、字幕領域、UIパネルのように、画面のどこに出るかが決まっていると、定点キャプチャがそのまま使えます。3つ目は、フォントが標準的な活字体であること。装飾フォントや手書き風だとOCRエンジンが苦戦しやすい。
このうち2つ以上満たすと、翻訳ツール側でできることはかなり広がります。逆に3つ全部を外すゲーム (たとえば高速アクション中に独自書体の字幕が1秒だけ出る、みたいなケース) は、ツール側でできることがどうしても限られます。
ジャンル別の傾向
ノベルゲーム / ビジュアルノベル
相性は最高。テキストを読むことそのものがゲーム体験の中核なので、OCRには理想的な土俵です。字幕は固定位置、画面は止まる、フォントも素直。3条件すべて揃うので、翻訳ツールを試すならまずここから始めるのがおすすめです。詳しくは ノベルゲームを別言語で読む で書きました。
ターン制RPG / メニュー重視ゲーム
戦闘とメニューで画面が止まるタイミングが多いので、OCRが安定して読めるジャンルです。装備・スキル・地名のような固有名詞が大量に出るので、Glossary登録 (用語辞書) の効果が一番出やすいのもこのカテゴリ。詳しくは ターン制RPGの翻訳 で書きました。
オープンワールド / アクションRPG
字幕の流量が多く、表示時間も短め。マウスを当てに行くカーソル追従より、字幕領域を固定で押さえる方が向きます。長文翻訳の精度の限界もこのジャンルで一番見えやすいので、「翻訳ツールってこんなものか」と判断してしまうのを避けるなら、最初の試遊には選ばない方が無難です。詳しくは オープンワールドの大量字幕 で書きました。
インディーナラティブ系
テキスト量が多く、商業ローカライズが入りにくいジャンルです。「公式翻訳が無い名作を遊びたい」という用途とそのまま噛み合うので、翻訳ツールが一番刺さるカテゴリの1つ。詳しくは 翻訳されないインディー名作 で書きました。
マルチプレイFPS / MOBA / 対戦格闘
そもそもテキスト量が少ないジャンルです。チャット欄や試合後のスタッツ画面に多少出るくらいで、ゲーム体験の主要部分は翻訳ツールでカバーできるものではありません。このジャンルにはあまり翻訳ツールは要らないかな、と思います。
レトロ / ピクセルフォントゲーム
ピクセルフォントや独自書体は、OCRエンジンによって読める / 読めないが結構分かれます。Playtoの場合は画像認識モード (Image mode) に切り替えると拾えるケースが増えますが、レイテンシが上がるトレードオフがあります。OCRで足りなければImageモードへ、という運用が現実的です。
ツールの設定もジャンルで変わる
「翻訳ツール」と一括りに語られがちですが、向き不向きはジャンル単位で結構違ってきます。遊びたいゲームのジャンル特性 (画面の動き、テキストの位置、フォント) を一度確認してから、ツールの設定を選ぶのがおすすめです。
翻訳ツールを最初に試すときは「画面が止まる + テキスト位置が固定」のジャンル (VNやターン制RPG) から始めるのがおすすめです。順番を間違えると「OCRが弱いツールだ」と判断しかねないので、最初の触り方は結構大事です。