THE長文日記

長文とか短文とかのクレームは一切受け付けません

できそうなことはだいたい出来る、「ある意味で汎用???」ニューラル・ネット、pix2pix登場

 この世界の進歩は超早い。

 Google一社だけでも手に負えないっつうのに、次から次へと新手が出て来る。


 今度はできそうなことはだいたいできてしまう、pix2pixというのが発表された(https://github.com/phillipi/pix2pix)。

https://i.gyazo.com/bc562d66f9c01f38e89b97d6eac42c0e.png


 なにを言ってるのかというと、このpix2pixは、たとえばラベルだけを指定した画像を入力すると、それっぽい道路の写真を生成したり(左上)、衛星写真を入力するとそれっぽい地図画像を生成したり(左下)、「ここが窓でえ、ここが壁でえ、ここが扉でえ」と、一軒家を建てる時のハイテンションなお母さんの妄想のようなラベル画像を入力すると写真を生成したり(中央上)、昼間の情景を入力すると夜景に変換したり(中央下)、白黒画像をカラーに変換したり(右上)、輪郭線から実際の写真を生成したり(右下)、およそ一対一で画像が対応するものならなんでもできてしまうのである。単一のニューラル・ネットワークで!


 もうやだ。


https://i.gyazo.com/a00907a11aff629e62cbf3300efc4586.png


 どのように作るのかというと、これは最近すっかり定番になった敵対的生成学習(GAN)を使用する。

 通常のGANは、本物か偽物かを見分けるだけだが、今回のGANは本物のペアか偽物のペアかを見極める点が違う。・・・って違いはそれだけかよ。


https://i.gyazo.com/75be198a3a72754f0153e51e4cd551c1.png


 さらに、エンコーダーデコーダーかU-Netか選ぶことが出来る。といってもU-Netはミラーレイヤーが後段に追加されるだけ。


https://i.gyazo.com/d6d776579a2440c3911673c662e9b034.png


 航空写真から地図を生成できるのと同様に、地図から航空写真を生成できる。


https://i.gyazo.com/a0a1314bab8f4594438880b9bbc84a94.png


 昼間の写真から夜の写真を生成できる


https://i.gyazo.com/47d0bd21bd2e88485108be22346079d0.png


 なんとなく輪郭を描くとカバンの画像が生成される。


https://i.gyazo.com/4e082ec723f449c3b6fcbf1d4f6a4234.png


 もはや絵として間違っていても、それっぽく塗られる。すごい!


 GANの威力恐るべし



 まあ白黒画像からカラー画像を生成するのがあんなに簡単にいけるんだったら他のタスクも行けそう、とは思ったけど、ここまでとは・・・