「SIFTよりコッチ!?」=> ORB: an efficient alternative to SIFT or SURF
画像特徴量といえば, SIFT,SURF ばかりの単調な僕に李先生が教えてくれました.
「最近,うちはORBばっかりですよ」
なんですと.
Willowgarage が出している descriptor らしい.
よって,当然のようにOpenCVに入っている.
ポイントは,とにかく軽い.バイナリのdescriptor.
論文は
https://willowgarage.com/sites/default/files/orb_final.pdf
なのだが,
Read moreA Bayesian Nonparametric Approach to Image Super-resolution
arxivからの論文
http://arxiv.org/pdf/1209.5019.pdf
A Bayesian Nonparametric Approach to Image Super-resolution Gungor Polatkan, Mingyuan Zhou, Lawrence Carin, David Blei, and Ingrid Daubechies
ノンパラメトリックベイズでは有名な Bleiのグループとの共同研究といった感じでしょうか?
超解像技術(super-resolution)は低解像度画像から高解像度画像を作る技術.
全画素の組み合わせに対して,実際に観測される組み合わせは非常にスパースであることから,
パッチを組み合わせることで,高解像度画像を低解像度画像から復元することができます.
そのためには,辞書(Dictionary)を持つ必要があるのですが,
それをどのように作るかが問題となります.
筆者らは過去に
NIPSで
Non-Parametric Bayesian Dictionary Learning for Sparse Image Representations
http://books.nips.cc/papers/files/nips22/NIPS2009_0190.pdf
を発表しており,ノンパラメトリックベイズを用いて,Dictionary Learning にノンパラメトリックベイズを
応用するということをやっています.
それをsuper resolutionに応用するというのが主な筋立てです.
基本的にスパースな表現を得る場合には,L1ノルムを用いて刈り込む事が多くて,
超解像でもこれがよく用いられます.
Image Super-Resolution via Sparse Representation Jianchao Yang et al.
などが良くリファレンスされるらしいです.
これに対して,ノンパラメトリックベイズ業界(?)ではスパースな表現にする,
つまり用いない次元を作るような場合には,ベータ・ベルヌーイ分布を導入し,スイッチを作るのが定石です.
例えば,
Sharing Features among Dynamical Systems with Beta Processes
Emily B. Fox et al.
http://videolectures.net/nips09_fox_sfa/
では,HDP-HMM の各隠れ状態に対してストリーム毎にベータ・ベルヌーイのスイッチを設けて,使わない隠れ状態をオフにします.
ちなみに, @k_ishiguro? さんの,
Subset Infinite Relational Models Katsuhiko Ishiguro et al.
でも,ベータ・ベルヌーイのスイッチをつくって,汎用的な出力分布を用いる(IRMの外に吐き出してしまう)か,
通常のIRMの側に入れるかをえらぶようにしていたりします.
というわけで,
「L1刈り込みの代わりを,ノンパラベイズでやるなら,やっぱベータ・ベルヌーイっしょ!」
という,結構ストレートフォワードな適用があるわけです.
グラフィカルモデルはこんな感じ.
l と h はlow resolution と high resolutionを表している.
xl と xh が観測.
Di と Dh が辞書.
で si が係数なんですが,
zi がいわゆるベータ・ベルヌーイのスイッチで,0,1 をとる.
これによって,使う基底,使わない基底が,0,1でオン・オフされることで,
スパース表現を得るわけである.
なんとも,ストレートフォワードな論理である.
ちなみに,これだけでは綺麗にならないみたいで,最後に平滑化処理っぽいことをやる.
実験の結果は
こんなかんじなのだが,正直,よくわからない・・・.
どうも既存手法に勝てているか微妙なのだが,
なるほどな,とおもったのは, Fig.8 で
こんな図がある.
これは,辞書の要素数(もとの次元数)を大きくしていった際,BPの場合は打ち切り最大数を大きくしていった時にどうなるか
を示しているのだと思うが,
その時に,ScSR(L1ノルムでのスパースコーディング)はピークを持ってしまう.
これに対しノンパラメトリックベイズのアプローチでは,十分な 要素数があれば,良い値を推定できるので,その良さが維持される.
これは,BPのアプローチがもともと無限の状態数を前提として組まれているのに対して,
L1の正則化項は 無次元量でもなく,要素数に影響を受けてしまうからだろう.
なるほどねー.
とは思うが,計算量とか考えても,実用的にはL1で行ったほうが,楽で実用的なのかなぁ,と思った次第でございます.
本内容は,
Xian-Hua Han (韓 先花) Ph.D にご紹介いただいて (Thank you very much
http://www.iipl.is.ritsumei.ac.jp/XHHan/index.html
それを,僕が勝手に理解したものを書いたものであり,
この記事の内容に誤りがあった場合は,僕を責めてくださいませ.
知能シンポ2013 OS 「コミュニケーション場のメカニズムデザイン」 へのお誘い
昨年度に引き続き,下記の要領で,
第40回知能システムシンポジウム http://www.sice.or.jp/~i-sys/is40/ 期日:2013年3月14日(木)、15日(金) 会場:京都工芸繊維大学
においてOS「コミュニケーション場のメカニズムデザイン」を提案いたしまして,採択いただきました.
昨年度プログラムはこちら http://www.sice.or.jp/~i-sys/is39/39Program-Up.pdf
コミュニケーション場のメカニズムデザインは,人を含んだシステムを如何に設計するか,支援するかに於いて 重要な課題であると考えております.
どなたでも御発表いただけます.
是非,論文投稿と御発表いただければと思います.
関連の御発表をいただき,建設的なディスカッションに興じる事ができれば幸いに思います.
---------------------------------------------------- OS「コミュニケーション場のメカニズムデザイン」
近年,知識社会の高まりもあり,企業や大学といった公式な組織から地域やオープンネットワークといった非公式な組織において,如何に 知識共有や情報処理,発想支援や創造的活動を行うかという事が本質的に重要となってきている.
また,組織には目に見える集団としての組織のみならず,ウェブ社会の中で会ったことも無い人とのコラボレーションによって新たな知的創造を 行うオープンコラボレーション活動が注目され,リアルタイムウェブの進展と共に可能性を広げている.
このような知識社会における相互作用,記号過程を促進するために,様々な情報技術が用いられて来たが,モノとしての支援だけでは, 失敗に終わる事が多く報告されてきた.
そこで本セッションでは設計対象をモノからコミュニケーションの場やそれを支えるメカニズム(制度)などのコトに変更し, 新たな知的相互作用の支援や人間集団における情報処理のあり方,それを支える場やメカニズムについて議論したい.
キーワード
コミュニケーション支援,制度設計,会議の経済学 サイエンスコミュニケーション,予測市場,マスコラボレーション ビブリオバトル,ネットワーク科学,メディア論,知識創造支援 など
参考文献 谷口忠大,須藤秀紹 コミュニケーションのメカニズムデザイン : ビブリオバトルと発話権取引を事例として システム制御情報学会誌 55(8)339-344 .(2011) http://tanichu.com/wp-content/themes/tanichu/data/journal/cmd_kaisetsu.pdf 谷口忠大 コミュニケーション場のメカニズムデザイン - 自律性 を活かす記号過程のための制度設計 - 第39回 知能システムシンポジウム, .(2012) http://tanichu.com/wp-content/themes/tanichu/data/pdf/chino12_cmd.pdf---------------------------------------------------------------------- 第40回知能システムシンポジウム講演募集 http://www.sice.or.jp/~i-sys/is40/ システム・情報部門知能工学部会では、システムの高度知能化を目指した 様々な分野に関する研究発表の場としてシンポジウムを開催しています。 次回の第40回シンポジウムでは、個別の理論・技術とともに、それらの統 合によるシステムの高度知能化に向けて、学術的かつ産学間での交流をは かるべく、下記の要領で一般講演を募集いたします。交流の場を一層広げ るため、オーガナイズドセッションのご提案も歓迎いたします。 講演内容: 知能工学・人工知能・知能制御・学習・認知・ファジィ・ニューラルネット・ 群知能・進化計算・メタヒューリスティックス・人工生命・創発システム・ ヒューマンインターフェース・社会情報システムなど、 知能システムの科学的解明と工学的実現・応用に関する研究を広く募集します。 期日:2013年3月14日(木)、15日(金) 会場:京都工芸繊維大学 松ヶ崎キャンパス(京都市左京区松ヶ崎橋上町) 講演申込締切:2013年1月11日(金) 講演申込方法:下記のウェブページからお申し込みください。 http://www.sice.or.jp/bukai_web_appli/sindex.html 原稿送付締切:2013年2月8日(金)必着 講演原稿:A4版4または6ページ 講演時間:25分 学術奨励賞:本シンポジウムは学術奨励賞の審査対象となります。 参加費(論文集代含): 登壇参加者8,000円、会員参加者4,000円、学生会員参加者2,000円、 非会員参加者6,000円、学生非会員参加者4,000円 主催:計測自動制御学会 システム・情報部門 企画:知能工学部会 協賛:情報処理学会、システム制御情報学会、電子情報通信学会、 電気学会、日本機械学会、人工知能学会、日本知能情報ファジィ学会、 ヒューマンインタフェース学会、進化計算学会、 Japan Chapter of IEEE Control Systems Society、 Japan Chapter of the IEEE Society on Systems, Man, and Cybernetics (依頼中を含む) 問合せ先・オーガナイズドセッションの提案: 京都工芸繊維大学大学院工芸科学研究科 飯間 等 電話:(075)724-7467、Email:iima@kit.ac.jp ----------------------------------------------------------------------
ビブリオバトル首都決戦予選開催中!参加の呼びかけ!
現在ビブリオバトル首都決戦の予選が全国で開催されています.
富山,山口,岐阜などはじめ,まだまだ 予選参加者が少ないところが
おおくあります.
是非,大学生・大学院生の方は参加しましょう!
地区代表になると,東京都でのファイナルへの交通費もでて,
ほんとうに,いい経験ができます.
優勝すると結構,人生かわります.
全国の地区ブロック情報
http://shuto12.bibliobattle.jp/yosen_japan/kessen_block
また,お近くに大学生・大学院生がおられましたら,
参加を呼びかけて頂けると助かります.
参加費は無料ですし,
予選会に参加してみるだけでも,いい経験になると思います.
ビブリオバトル全般についてはこちら
何とぞよろしくお願いします.
ポスターは今年は佐藤可士和さんです.
昨年のファイナルの様子はこちらから
http://shuto12.bibliobattle.jp/shou-dou-jue-zhan-ben-zhan
ビブリオバトル首都決戦2012 予選会の募集について
ビブリオバトル首都決戦 予選会の応募を受け付けております.予選会は簡単で,4人以上の発表者を集めたらエントリー可能.予選会の開催を地区決戦主催団体と事務局に申請すれば,チャンプを地区決戦に送り込めます!
http://shuto12.bibliobattle.jp/
#bibliobattle
なので,ビブリオバトル首都決戦2012 に 出場したい! という大学生は,周りの友達やサークルメンバー,ラボメンバーを巻き込んで 自分で予選会を開催してしまうのが, 実は一番の早道なのです!
↓情報はこちらから.
http://shuto12.bibliobattle.jp/
これぞ参加型イベント!!
Shared Segmentation of Natural Scenes Using Dependent Pitman-Yor Process のメモ
一昨年くらいに,今はNAISTに言ったK君に紹介してもらった論文.
今から考えるとお恥ずかしい話なのですが,当時はGaussian Process をよくわかっておらず,
その時は意味をとることができませんでした.今なら,ワカル!!!!
ってことで NIPS ‘08 の論文です.
著者は
Erik B. Sudderth and Michael I. Jordan
でいつもながら,ジョーダン研ですね.
ホントにこのラボは凄いですね.
ちなみに,Erik B. Sudderth さんは, 僕がここ2,3年よく使っている.
E. Fox の sticky HDP-HMM の共著者というところでも,認識しています.
本論文は, Segmentation of Natural Scenes ということで,
自然画像の領域分割を扱っています.
複雑なように見えて,意外と素直なアプローチに思えたので,良いと思います.
まず,第一歩として,写真の領域を人手でくくって,名前をつけたデータに対して,
そのラベルと,生起頻度がべき乗則を満たしているということを指摘します.
このあたり,よく考えると,自然言語文の単語生起そのもので面白いですね.
ゆえに,その頻度をモデル化するのにDPよりも Pitman-Yor 過程がいいだろう.という主張になっています.
# ただ,本件については,どこまで本質的かは,私は判断つかない.
次に,画像の領域分割の生成モデルを与えます.
3章でシンプルなBags of image features モデルを導入します.
基本的には,super pixcel 毎にtexture color のカテゴリが対応して,そこから多項分布で
生成される.というモデル.
LDAのセンスそのまま.
しかしながら,このようなモデルだと,空間的な連続性を与えられない.という話が出てきます.
そこで,4章にて 裏に,GPを走らせて,空間分割をやろうという.
Spatially Dependent Pitman-Yor Process の考え方があらわれます.
どうもこのあたりのアイデアは, [24] J.A. Duan 2007 のアイデアっぽいのですが,非常にセンスが良いように感じました.
おもしろい.
まず,sticky breaking-process が[0,1] 区間の値による,棒の切れ端の切断の繰り返しだということを思い出します.
通常,その切断はBeta 分布でやるんですが,ここでは,Gauss分布を上手く使うことによって,実現します.
それは,Gauss分布の累積分布関数(CDF)を持ってきます.そこで,vという確率に達する変数をu=Φ^{-1}(v) として計算できるようにします.結局このCDFの逆関数を介せば,0 or 1 の値を出す,関数がGauss をバックに構成できるわけです.
(4)式は地味にけっこうキモ.
このアイデアと stick breaking-process をくっつけることができる.
GPは基本的には平均関数mに従うので,分散共分散関数由来の,空間的な相関性を持ちながら,
上記のようなガウス分布のかわりを成すことができる.
学習は変分法を導入しており,,これにより高速に計算できる.
わざわざ,うつさないが,パフォーマンスは極めてよいようで,
多手法を圧倒しているようにみえる.
個人的には Gaussian Process と PYPのくっつけ方が実に上手いと思った.
これは,もっと他にも応用の可能性があるのではないかとおもいます.
ちょっと,今日は眠すぎたので,説明がわからなくなってしまった・・・・.
また,気が向いたら,もう少し分かりやすく書きます.ではでは.