M
masaki.work

AIは「正しそうな嘘」を描く — 画像編集で検証プロセスが必要な理由

ai image-editing workflow

この記事の全文をコピーして、AIに「この通りに設定をガイドして」と渡すと便利です

📊この記事の図解版があります。内容を視覚的にまとめたページで、全体像をサッと把握できます

図解を見る

AIは「正しそうな嘘」を描く — 画像編集で検証プロセスが必要な理由

はじめに — 「高架道路だけ消して」と頼んだら駅舎ごと消えた

「右端の高架道路を消してほしい」。AI画像生成API(Gemini 3.1 Flash Image)にそう指示した。

結果は一見、成功に見えた。高架道路は消えていた。しかし、右端にあるはずのモノレール駅舎(東京モノレール・天王洲アイル駅)も一緒に消えていた。

v1: 高架道路は消えたが、右端のモノレール駅舎も消失している

画像を見た直後は気づかなかった。「きれいに消えた」と思った。見慣れない場所の写真であれば、そのまま使っていたかもしれない。

この体験から、AIによる画像編集には必ず「実物との照合」が必要だという結論に至った。今回はその理由と、具体的な検証プロセスを紹介する。


連鎖除去とは何か — AIが接続した構造物を一体として認識する問題

連鎖除去とは、除去対象に隣接・接続する構造物が巻き込まれて消失してしまう現象だ。

対象はシーフォートスクエア(天王洲アイル、東京・品川区)。3棟のオフィスビル(東京フロントテラス 20F、センタービル 23F、JTBビル 20F)がアーチ型エントランスで接続された複合施設だ。

天王洲アイル駅は、モノレールの高架軌道と一体化した構造を持つ駅舎だ。高架と駅舎は物理的に接続しており、視覚的にも一体の構造物として見える。AIはこの「つながり」から、「高架を消す」という指示を「高架に接続した構造物をまとめて消す」と判断した。

人間の感覚では「高架道路」と「駅舎」は別物だ。しかしAIは、視覚的な連続性と構造的なつながりを手掛かりに除去範囲を決定する。駅舎が高架と繋がっているなら、AIにとってそれは「同一の除去対象」になりうる。

問題はここにある。AIが生成した結果は、見た目として「完成している」。 除去後の背景は自然に補完され、不自然な痕跡が残らない。だから気づきにくい。消えるべきでないものが消えていても、画像は「もっともらしく」仕上がる。


検証プロセス — Web検索で実物を調べ、生成画像と照合する

「完成している」という見た目を信用してはいけない。 検証のステップは3つある。

Step 1: Web検索で実物の情報を収集する

建物名・場所名で検索し、対象の構成を把握する。シーフォートスクエアの場合は「シーフォートスクエア 天王洲アイル」で検索し、Google マップのストリートビューや写真投稿を確認した。

確認すべき情報は以下だ。

  • 建物は何棟あるか、どう配置されているか
  • 各棟の高さ・外観の特徴(色、素材、意匠)
  • 隣接する構造物(駅舎、歩道橋、高架など)の有無と位置

Step 2: 生成画像と照合する

実物の情報を手元に置いた状態で、生成画像を改めて見る。以下の観点でチェックする。

  • 建物の数・配置・高さの比率は正しいか
  • 存在しない建物が捏造されていないか
  • 除去対象と接続していた構造物が巻き込まれて消えていないか(連鎖除去)
  • 外壁の色・素材・特徴的な意匠(アーチ、ドーム等)は正しいか

シーフォートスクエアの検証では、この照合によって「右端に駅舎があるべきなのに存在しない」と気づくことができた。生成画像単体を眺めていたままでは、問題に気づけなかった。

Step 3: 問題があればプロンプトを修正して再生成する

照合で問題が見つかったら、プロンプトに「残すべき構造物」を明記して再試行する。次のセクションで詳しく説明する。


解決策 — 「消すもの」だけでなく「残すもの」を明示する

AIへの指示は「除去対象」だけを書けばいい、と思いがちだ。しかし実在する建物を扱う場合、「保護対象」も同時に指定する必要がある。

失敗時のプロンプトは「右端の高架道路を除去してください」という指示だった。この指示には「何を残すか」の情報がない。AIは除去対象の範囲を自分で判断し、接続構造物を含めて消した。

成功したのは、次の一文を加えた時だった。

IMPORTANT: Preserve the monorail station building on the right side —
this is the Tennozu Isle Station and must NOT be removed.

日本語で書く場合は以下のように指示する。

重要: 右端のモノレール駅舎は残してください。
これは天王洲アイル駅であり、除去対象ではありません。

結果は明確に変わった。高架道路は消え、駅舎は正しく残った。

v2: 保護指示を追加した結果、高架道路は消え、駅舎は正しく残った

保護指示の書き方には基本パターンがある。

IMPORTANT: Preserve the [建物・構造物の名称] on the [位置] —
this is [何であるかの説明] and must NOT be removed.

「IMPORTANT」という強調、「何であるか」の説明の2点が効果的だ。AIは文脈を理解する。「これは駅舎だ、消すな」と伝えることで、除去範囲の誤認識を防ぐことができる。筆者の経験上、英語での指示のほうが精度が高い傾向があるが、日本語でも基本的な保護指示は機能する。


まとめ — AIは「もっともらしい嘘」を描く

今回の体験を整理すると、以下の3点に集約される。

  1. 連鎖除去は接続構造物があれば起きうる。高架・橋・歩道橋など、物理的に繋がった構造物を除去する際、隣接するものが巻き込まれる
  2. Web検索で実物と照合する。生成画像は「完成している」見た目なので、検証なしには問題に気づけない。1〜2分の検索が唯一の防御手段だ
  3. 「残すもの」を明示する。除去指示だけでなく保護指示をセットで書くことが基本の作法だ

AIが生成した画像は、説得力がある。色合いも、質感も、構図も、もっともらしく仕上がる。だからこそ、実在する被写体を扱う場合は「正しそうに見えること」を信用してはいけない。正しいかどうかは、実物と照合して初めてわかる。

次にAI画像編集を使うとき、保護指示のテンプレートを1回試してみてほしい。結果が変わるはずだ。


関連記事