デジタル写真技術におけるAI処理

川村信人(HRCG理事:元北海道大学理学部:札幌市清田区在住)

はじめに

 最初にお断りしておくと,ここで紹介する画像編集ソフトにおける各種の機能・処理が,実際に本来の AI (artificial intelligence) によって実現されているかどうかは,もちろん私にはまったく分かりません.そもそも,なにが AI の定義かもよく分かっていませんし.そういうわけで,以下ではそのへんを正確に区別していません.AI とはなんの関係もないものが含まれている可能性がありますのでご容赦.


AI 塗り潰し

 画像編集ソフトにおける『塗り潰し(fill)』というのは普通,一定の領域を特定の色やパターン・グラデーションで塗り潰すことを意味します.
 しかし,Adobe Photoshop などの最近の画像編集ソフトには,欠損した画像の一部を補完したり,画像中の特定の部分を置換する機能が備えられています.Photoshop の場合は “contents-aware fill”(画像内容に応じた塗り潰し) が定番ですが,最近になって AI による『generative fill』(画像生成塗り潰し)という機能が追加されました.後者は,最近色々話題となっている生成系 AI の一種と考えて良いようです.
 これらの機能は,地質写真においても一定程度有効なものです.この項では,それらについて応用例を上げて紹介します.


 まず第一の応用例は,欠損部を埋めるというものです.これがよく使われるのは,パノラマ写真です.パノラマ合成結果の画像には,既にご紹介したように,上下左右に多かれ少なかれ『欠損部』があります.通常はそこをトリミングするわけですが,合成結果によっては欠損部をすべてトリミングすると必要な部分まで失われてしまう場合があります.そこで,欠損部を Photoshop などの “contents-aware/generative fill” 機能を使って埋めてやるという手を使うことになります.


 その例は左のようなものです.
 そう言われてみると確かになにか不自然な気もしてきますが,なにも言われなければ,そこが『フェイク画像で埋められた』部分とはおそらく気付かないでしょう.
 この例では,埋められた部分が科学的・地質的には何の意味もない単なるヤブの部分なので,こういうことをしても何も問題はないように思われます.


露頭部分の欠損を埋めた例.Contents-aware fill の設定を変えた二つの結果を示す.

 しかし,右のような例ではどうでしょうか? これも言われなければそれと気づかないような自然な結果ですが,埋められた欠損部分は露頭の一部なので,厳密に言えば『データの変造』に相当するでしょう.

 仮にこの写真を論文に使ったとして,論文の主旨に関係ないならば,データの捏造にはあたりません.しかし,科学論文ではそんなことはしない方が賢明でしょう.世の中には “Photoshop 警察” という方々がいて,論文の図写真に変造の跡が無いかを日夜チェックしているそうですから.
 もちろん,個人ウェブサイトでの単なる exhibition ならば,それがバレても何も問題はないわけですが.


 次の応用例は,写真から “不要部分” を除去するというものです(下写真).左の例では,露頭の前に立っている人物を除去しています.もちろん,写っている人物は共同調査者の方でなおかつ露頭のスケール代わりになっているのですから,『不要』というのは単に画像処理の例ではということです(蛇足).右の例では,露頭の上にかかっている邪魔くさい木の枝(蔓?)を除去しています.ストロボ撮影なのでその影も出ています.もちろん撮影時によけておけばよかったのですが,後の祭り.
 どちらの例も,『なにが除去されているのか』はこうやって before/after で示さない限り(“Photoshop警察” を除けば)誰にも分からないと思います.


不要物除去の結果をアニメーションで示したもの.

 下の組み写真は,除去の方法による差異をクロップで示したものです.左列が元の写真.中央列が Photoshop の contents-aware fill によるもの,右列が同じく Photoshop に ver. 25.0 (2024) から新たに導入された generative fill によるものです.



上の例の除去分部の拡大.左:オリジナル.中:contents-aware fill による.右:generative fill による.

 この二つの手法の違いは,単なる私の想像ですが,前者が『その画像自身の一部分を使用して変形・適合したパターンで塗り潰す』のに対して,後者は『 AI がクラウドベースで外部から持ってきた画像を adapt して塗り潰す』というところにあると思われます.もしかしたら後者は前者のような “イメージ内” 画像も使っているのかもしれませんが,詳しいところはもちろん分かりません.
 Generative fill は,AI に対してキーワードを送ることによって画像内に存在しないオブジェクトやパターンを生成できます.例えば水田に三羽の白鳥を泳がせその反射が水田に映っているとか.キーワード指定が無ければその画像自身に適合したものだけになるようですが,未確認です.
 二つの手法を比べると,詳しいことはあえて書きませんが,generative fill の方がパターンの “使い回し” が無い分,なんとなく自然な結果になっています.


※ 世の中うまい話だけじゃない...この generative fill は一度で生成する画像の長辺が 1024 ピクセル(2048 ピクセルという情報もあるが未確認)までという制限があるようです.また,Adobe の subscription ごとにその生成数に制限があり,私の Photography Plan では1か月に 250 画像(・回?)までとなっているようです.上のピクセル数制限を回避するために小分けにして fill するという裏技がありますが,その場合回数制限がネックとなります.
これらの制限の意味するところは,新しい技術である AI 演算のいろいろなコストをユーザが負担しなくてはいけないという当然のことのようです.


 こういった例で分かるように,現在の画像処理ソフトの『不要部分除去技術』は,完全に実用可能なレベルに達しています.あとは『こういうことをして良いのかダメなのか?』という “倫理的な” 問題(後述)だけです.


ジオメトリ変換とAI 塗り潰し

 ここでは,画像の geometry 変換と generative-fill による非常に強力なAI塗り潰しとの『合わせ技』の例をあげておきます.

 地質屋なら誰にも経験があるのではないかと思いますが,露頭の形と言うか向きが私達の都合とは大きくかけ離れているケースはよくあります.もちろん現実がそうなのでしょうがないわけですが,学術論文ならいざ知らず,ウェブ掲載ではやっぱり見栄えをよくしたい...右写真はその例です.
 海岸にピサの斜塔のように立っている露頭ですが,そのまま撮ると右上と左下が空いていて,おまけに味気ない曇り空の空白が気になる.カメラを傾けて撮っておけばよかったのですが,後の祭り.

 そこで,こうすることにしました.①まず地層の層理がほぼ水平になるように反時計回りに 45 度程度回転する.②露頭面に垂直に撮っていないためパースが付いているので,水平方向のシフトをかけて露頭面をストレートにする(下図).いずれも,Adobe Photoshop と Camera RAW によるものです.



 その結果ですが(上写真右),元々四角形しかない写真を変形したのですから,上下左右に “写真の外側” 領域ができてしまいます.グレーの部分が回転で生じた部分で,市松模様部がシフト変形で生じた部分です.その部分を除去するために,③余計な部分を(この場合,空の部分が見えなくなるまで)トリミングします.
 その結果はどうなるでしょう? 当然ですが,どうやっても左図上のように空白が残ってしまいます.空白が無くなるようにトリミングすることもできますが,ほとんど写真の中央部だけになってしまいます.

 そこで,④トリミング空白を contents-aware/generative fill で塗り潰してやる,ということになります(左図下).


Adobe Photoshop によるコンテンツ塗り潰し例.上:contents-aware fill.下:generative fill.マウスオーバーで他の fill option による塗り潰し例を表示する.

 その結果ですが...

 まず non-AI の contents-aware fill です(右写真上).古い機能なのになかなか健闘しています.よほどこういう画像処理に敏感な人でない限り,そう言われなければ気づかないでしょう.しかしよく見ると,同じパターンが繰り返していたり(左上隅),不自然なボカシっぽい処理も見られます(右下隅).

 次に最新の AI による generative fill です(右写真下).結果は素晴らしいもので,そう言われてもどこが塗り潰されているのか(自分でも)分からないほどです.特に右下隅の棚状になっている部分などは,一体どうやってこんなものを生成したんだろうと...元画像を 1:1 ピクセルでよく見ると塗り潰し部で解像度が少し落ちているので分かる人もいるかもしれませんが.
 Generative fill は,三つの生成パターンを選択できます.右の例では塗り潰し部が3カ所ありますので,3 x 3 の計9パターンが可能ですが.その中から露頭の隅が写っているように見えるものがマウスオーバーで表示されます.まあ不自然なんですが,そういう選択も可能なんだという例示です.

 下にも書きましたが,こういう生成塗り潰しは,学術論文では捏造・変造ということで即アウトでしょう.個人ウェブサイトで写真の見栄えを良くするという限定した使い道だけが許されるという性質のものと思います.


AI sky-replacement

 ほとんどお遊びの範疇ですが,こういった塗り潰しのバリエーションの一つとして "sky-replacement" があります.最近は,ほとんどの画像編集ソフトでこの機能が必須となっています.

 右写真は,Photoshop で sky-replacement をやってみた例です.写真撮影時が暗い曇り空だったので,空の部分は明るいグレー一色になってしまい構図上クロップもできないので,なんとも空虚・陰鬱な感じがします.そこで sky-replacement の出番です.『空の部分を選択する』という作業を手動で行うことはこの例では簡単ですが,空の部分が一様ではなかったり,林や木の枝があったりすると非常に面倒なことになります.そのような面倒な作業は sky-replacement は自動でほとんど一瞬でやってくれますし,空の画像はいくつか用意されているものから選択する(自前でも用意できますが)だけなので,非常に簡単なものです.
 山体上部にはうっすらと霧がかかっていますので,さすがに山体のエッジ部分と空部分とのライティングの不自然さがあります.多少の調整はできますし,そう言われて見るとというレベルのものなので,ほとんど問題は無いでしょう.


AI 顔復元

 地質写真とはあまり関係のないような話ですが...なにかというと,AI 写真画像処理の大きなテーマの一つである『顔復元(facial recovery)』です.右の写真がその例です.素材は,非常に古い(1930年代)低解像度写真から取ったもので,写っている方はおそらく肖像権は消滅しています.それを Topaz Photo AI というソフトを使って解像度と共に顔復元を施したものです.スライダーを動かして確認して欲しいのですが,正直驚くべきものです.

 この結果を『さすが AI,グッジョブ!』と見るか『だから所詮フェイクなんだよね』と見るかは,人それぞれです.私はと言うと,そのどちらでもありません...というか,その両方です.使い方とその TPO さえ間違わなければ明確に,これしかないというすごい復元ツールになると思います.

 上に “地質とは関係ない” と書きましたが,少なくとも地質学史には関係大ありかもしれません.大昔(1930年代とか)のモノクロ低解像度人物(・集合)写真にこの AI 顔復元をかけると,フェイクもどきと知りつつも,その時代や人が眼前に蘇ったような錯覚が起き,かなり深く感動してしまいます.その復元例は,このページ などにいくつか使用しています.


最後に-AI 画像処理って...

 このアーティクルでは,AI を用いた最新の画像処理結果についていくつかの例を示しました.ブレ補正・ノイズ除去・画像リサイズ・塗り潰し・顔復元...非常に素晴らしいものです.しかし,これらの AI 処理については懸念される点が当然あります.それについて,蛇足ですがここで付記しておきたいと思います.

 このような AI 補正というのを,“フェイク”(= AI モデルで適当に補完・創出されたもの)であるという見方も当然できるでしょう.実際には写っていないディテールを AI モデルを使って『多分こうなってるだろう』とそれらしく画像を作り出しただけであると.場合によっては,写ってもいないものが “復元” される.懐疑的に言えば所詮『嘘』ではないかと...そうなのかもしれません.でもそれはエンドユーザにとってはある意味どうでもいいことで,補正結果が自分でこうだと思っている形になったら,それで 100% 良いわけです.AI 処理が実際データ処理としてどういうものかも,エンドユーザには知る由もありません.そういう意味で私は,結果がとにかく素晴らしければ『知らぬが花』と思っています.デジタル写真そのものが所詮センサーデータから色補間によって生み出されたウソ画像(!)で,既に “フェイク” みたいなものですから(50% ジョーク).

 しかし,論文等で『科学的写真』として掲載する際にはそうもいきません.科学的写真に限らず,写真コンテストとか一般の写真でもいろいろと微妙な “フェイク騒動” を起こしています.
 AI 処理は,行き過ぎたレタッチや HDR 処理と同じく,どう見てもデータの変造です.それが『データの意味を変更するための意図を持った悪意の変造』であれば,“データの捏造” =犯罪行為です.とはいえ,その境界というか “しきい値” は果てしなく曖昧模糊としています.“Photoshopping” なんて言葉も既にありますが,写ってるものに足したりそれから引いたりはダメだけど,明度コントラストは修正してもよい.それじゃダスト除去は? ノイズ除去は? ブレ補正は? 解像度復元は...??

 こういった点については,まだ十分な社会的コンセンサスがないと思われます.もし論文掲載写真では一切のピクセル編集が許されないとすると,ノイズ除去もシャープニングも NG になってしまいます.デジタル写真(の大部分)はそもそもモノクロの RAW センサーデータから色補間によって生み出され,ノイズ除去もシャープニングもステルスで適用されているものですから,それは『現実』そのままなのでしょうか?
 どこにデジタル処理と変造との境界があるのか,画像中で処理してはいけない部分とそうでない部分との境界はどこにあるのか?...『そんな境界はない』というスタンスを取ることも可能ですが,まだどこにもその点についてのガイドラインはないと思われます.つまり,科学論文における伝習的なルールが技術の発達に追いついていないということに.

 私は既にそう言った科学論文の世界から離れてしまった人間なので,どうでもいいと言えばそうなんですが,最近の生成系 AI の発達・普及を見ると,文章だけではなく画像・写真についても,早急なガイドラインの作成が喫緊の課題なのでは?と思えてしまいます.


 ちなみに...最近話題の画像生成系AIですが,Bing で無料で使える DALL·E 3 というエンジンに “Delta formation on Mars(火星におけるデルタ形成)” というプロンプトを入れて生成してみたら,右のような画像が...Youtube でジェゼロ・クレーターのデルタ形成とそのフォアセット層に感動したので試してみたわけですが,“デルタ形成” がSFゲーっぽい『デルタ陣形』になってしまい,背景はどう見ても火星には見えない.

まあ,AIへのプロンプトの入れ方が初心者過ぎるんでしょうけど...要するにいくらAIでも基になるデータベースにモノが入っていないとどうにもならないという当たり前のことを実感してしまいました.今のところは,科学的使用に耐えるものでは全然ないようです.


(ページ分離:2023/01/24 追記:2023/10/13)