THE長文日記

長文とか短文とかのクレームは一切受け付けません

【深層学習】写真を見るだけでいろいろわかってしまう人工知能UberNet

 一体、やつらはどんなスピードで進化をするというのか。

 今度は一枚の画像を様々に解釈する人工知能が出現した。

https://i.gyazo.com/168ea23adb77ec3ff81c6a1881c29516.png

 画像を入力すると、画像の中からオブジェクト抽出、セマンティック分割、セマンティック境界、人間のパーツ分解、面の法線(3D映像を自動的に作り出す場合などに有効だろう)、背景マスク、境界線による輪郭、スペクトラル分析の全てを一気に行う人工知能UbetNetが公開されている。


https://i.gyazo.com/f180b3955e84201222205057de1c42b8.png

 最近の深層学習の論文にしては珍しく層の構造がざっくりとしか説明されていないが、複数の畳込みを使ったかなり大規模なニューラル・ネットワークになっているみたいだ。


 誰でもオンラインで試すことができる

no title

http://cvn.ecp.fr/ubernet/


 ただし、処理はけっこう重たい


 ここまでではないけれども、一枚の画像の中にどんなものが写ってるか領域とともに判定するFaster R-CNNのChainer実装はすぐ試すことができる。

no title

https://github.com/mitmul/chainer-faster-rcnn


https://i.gyazo.com/66942005da5ad5bee7438d4eaef9f62d.png


 Caffeの実装はけっこう試すのが難しかったりするんだけど、Chainerはこういうときに安定しているし改造もしやすいからいいなあ。やっぱり。