東京大学工学部

ENGINEERING POWER 東京大学工学部ガイド[エンジニアリングパワー] - 東京大学工学部

鈴木雄二 教授 | 工学系研究科 機械工学科

学科データを見る

Profile
情報理工学系研究科 知能機械情報学専攻 博士(工学)
中高時代はバレーボール部に所属。2001年に東京大学大学院工学系研究科機械工学専攻博士課程修了。2013年4月から現職。実世界を理解する知能情報処理とロボットシステムの研究を行っている。将来的には実世界で生じる興味深い事象を自律的に発見し、面白いと理解できる知能の実現を目指している。

ロボットに実装する知識を得る方法は人間から学ぶ

人の振る舞いを再現するには、正確な認識が重要。

人の振る舞いを再現するには、正確な認識が重要。

画像を認識させるシステムにおいて、もっとも重要なものは何だろうか?もちろんアルゴリズムも大切。だが、いちばん重要なのは知識だと原田達也教授は言う。

「海外の市場に行って、そこではじめて見る果物が食べられるのかどうかは知識がないとわかりませんよね。それと同じです。最近はインターネット上にたくさんの画像や情報が蓄積されています。そうした膨大なデータベースの中から、カメラに写る対象物が何なのかをすぐに解析していく。その精度を高め、さらに応用していこうというのが、私の研究内容です」

原田教授はそう話しながら、一枚の海辺の写真をパソコン上にあげた。すると瞬時のうちに、〝海〟〝パラソル〟〝ビーチボール〟といった単語が画像の下に現れる。驚くのは犬の種類や花の名前まで解析されている点だ。

しかし、単純に単語を認識するだけでは不十分であると原田教授は考えた。仮に〝犬〟〝人〟〝嚙む〟という単語だけでは、「犬が人を嚙んでいる」のか、「人が犬を嚙んでいる」のかわからない。そこで今では、文章も認識する試みも行っている。元画像に近い画像群を検索させ、そこに書かれている説明文をサマライズすることで適格な文章を生成する技術を開発している。

「現時点では120万枚の画像と1000の単語がマッチングできるほどになりました。この技術を利用して、私たちが住む実世界とインターネットの世界をつなぐ、かつてない知能システムをつくりたいと考えています」

大きな一歩を記したのは5年前だった。そのときに開発したのは人工知能をもったゴーグル。メガネの上にカメラが付いており、人間が見たものと同じ景色がレンズに映し出される。すると内蔵されたコンピュータがその画像を解析し、レンズに映る机上の人形の名称や花の名前などをリアルタイムに表示するというものだ。

「表示された言葉は画像と一緒にデータベースとして蓄積されます。人は、目で見たものを記憶として残す力がありますが、そこに言葉も一緒に残してしまおうというのが狙い。今ではゴーグルだけじゃなく、スマートフォンやタブレットにもアプリとして実装させています。カメラを通して、画面に映ったものを瞬時に名前で検索し、もし仮に検索できないものはその場で名前を入力し、覚えさせることもできる。今やインターネットによって世界中の情報を探すことは可能になりました。でも自分自身の経験は探せないまま。それができるようになるわけです」

必要な言葉を覚えさせることで、どんどん自分色にカスタマイズされていく。ゆくゆくは自分の脳内の辞書をつくることも可能になるかもしれないのだ。

「異常検出」機能で知識を獲得する

研究室の壁には巨大なホワイトボードが設置されており、活発な議論が交わされる。

研究室の壁には巨大なホワイトボードが設置されており、活発な議論が交わされる。

しかし、原田教授の研究はこれだけにとどまらない。

ある日、「ネット上の情報にせよ、自分で入力した情報にせよ、いずれも元を正せば、人間が自分たちの手で写真を撮ったり、文章を書いたりしたものに過ぎない」ことに気づいた。

「そうした人間のフィルター部分を取り除いていかなければ、本当に賢いシステムにはならないと思ったんです」

そこで誕生したのが、ジャーナリストロボットだ。これは、〝日常生活の中で起こっているニュースを自ら発見し、記事を生成する〞というもの。

「何をもってニュース性があるか?それを判断する機能をデファインするのは難しいですが、実際にはロボットが〝おかしいな?〞という違和感を感知する機能をもっていれば可能になります。これを私たちは「異常検出」と呼んでいます。例えば部屋の中をロボットが勝手にグルグルと動き回り、床に人が倒れていたらそこに異常があると判断する。これは過去にインプットされた部屋の映像の記憶と現在の景色を照合させ、そこに発生する差異をニュースとして認識させているわけです」

また、このジャーナリストロボットにはマイクとスピーカーの機能も装備されている。そのため、いつもの廊下の壁に、ある日突然ポスターが貼ってあるのを感知すると、近くを通る人に、「これは何ですか?」と、自動的に取材(確認)もするという。そこで得た回答(情報)は音声認識をした後にサマライズされ、自動的にツイッターなどにアップロードすることも可能だ。

異常を検出するだけではなく、能動的に異常を探しにいくという面白さ。またそこで得た新たな情報を解析し、記事として世に発信していくというオリジナリティ。これこそが、〝自らがニュースを生み出す〞という原田教授の狙いにつながっている。

「私たちはインターネットを通じて世界中のニュースを瞬時に手に入れることができます。しかし一方で、同じ建物の中にある隣の部屋では何が起こっているのかまったく知らないこともあります。そうした実世界とサイバー世界の境界の垣根をなくしていきたいというのが私のテーマ。そこにこそ人間がもつ知能の根源が詰まっていて、新たな賢いロボットをつくる鍵が眠っているのではないかと思うんです」

実世界から知識を学ぶシステムをつくる

日常にあるニュースを見つけ出すロボット

自分の力でニュースを見つけ出す「ジャーナリストロボット」。目新しさと興味の度合いを解析し、そこにニュース性があるがどうかを見極めていく。また、マイクとレコーダーを実装し、通りすがりの人に取材まで行う。

過去のDBから瞬時に画像と名称を検索

AIゴーグルをさらに発展させたタブレット・スマホ用のアプリ。カメラを花などにかざすと、過去のデータやデタベース化された画像の中から類似のものを抽出、瞬時に画面に名称や具体的な説明文を表示することができる。

対象物の解析に優れたCDマッティング技術

実世界にある物体を機械が認識するには対象物の位置や形を特定する処理が必要になる。原田研究室が行っているCDマッティングでは、色や距離などを同時に解析することで、より正確な物体領域の切り出しが可能になった。

画像内の状況を判断し自動的に文章を生成

カメラに映った対象物の名称を検索するだけでなく、類似した写真などからあらかじめ入力されている説明文を解析。そうすることで、画像の対象物がどのような状況なのかを自動的にひとつの文章として生成することがきる。

研究室学生インタビュー

世界最先端の技術を学び生活者の役に立つ製品開発に活かしていきたい

原田研究室 鎌田智恵さん Chie Kamada 東京大学大学院 情報理工学系研究科 知能機械情報学専攻 修士課程1年

原田教授のもとで、画像認識などによる異常検出の実験・開発を行っている鎌田智恵さん。研究室に入ってみての感想、普段の学校生活の様子や彼女の将来の夢についてお話をうかがいました。

今はどのような研究をされているのですか?

ここでは画像に関係する異常検出の研究をされている先輩方が多いのですが、私が行っているのは、画像以外に位置情報や周りの音の情報も使った異常検出の研究です。画像以外の情報から過去同じような状況のときに見ていたものを想起し、それと現在の様子とを比べて異常かどうかを判断することで、より人間の感覚に近い異常検出ができないかと考えています。

この研究室を選んだ理由を教えてください。魅力は何でしょうか?

オープンラボでいろんな研究室を見て回ったのですが、とくにこの研究室のデモの内容に惹かれました。機械にこんなに賢い振る舞いをさせることができるんだって。プログラミングの知識はあまりありませんでしたが、ここを選んで本当によかったなと思ってます。

実際に研究室に入ってみて感じたのは、学生の人数がそれほど多くないこともあり、先生との距離が近いということですね。原田先生は世界のトップレベルの学会で論文を発表されている方なのですが、普段から思いついたアイデアをすぐに壁のホワイトボードで説明してくれるんです。そうした、最先端のアイデアにすぐ触れられるというのは、すごく刺激的ですし、貴重な経験をさせてもらっているなと感じます。

将来の夢を教えてください。

今は画像認識や異常検出の勉強をしていますが、共通しているのは、データから何らかの法則を見つけ出し、それを使って機械に認識や予測などの賢い振る舞いをさせる技術だということです。この技術は画像に限らず、さまざまな分野で役に立っています。身近なものだと、スマートフォンに搭載されている音声の処理や認識などでしょうか。今はインターン先で音声信号処理に関連した技術の研究開発に関わらせていただいていますが、将来的にもユーザーの生活に役立てられる製品開発ができたらなと思っています。

國吉研と合同合宿。
伊豆長岡温泉へ

研究室合宿は國吉研究室と合同で伊豆長岡温泉に行きました。原田研と國吉研は’12年度までひとつの研究室だったため、今でも交流が盛んです。女性は合わせて6人います。

たくさんのぬいぐるみ。
あくまで研究用です

研究室のあちらこちらに無造作においてある有名・無名のぬいぐるみたち。特に誰かの趣味というわけでは(たぶん)ありません。これはあくまで画像認識用の実験用具なんです。

ダーツボードは......
研究用では......ありません

大きなホワイトボードのちょうど反対側に掛けてあるのがダーツボード。男性陣が研究の合間に遊んだりしています。普段はほっときますが、今日は撮影なので拍手をサービス。

軽音サークルで
バンドを組んでます

研究とは関係ないですが、軽音サークルに所属しています。写真は’12年の駒場祭のときのもの。’13年の五月祭でも女の子だけでバンドを組んでライブしました。私はベースを担当。

機械好きにはたまらない?
こんなところにも出没

こちらも研究とは直接関係ない(?)研究室のメンバーで陸上自衛隊の総合火力演習を見学したときの写真です。機械系の学科なのでこういうイベントが好きな人が多いんです。

とにかく明るい研究室です。
女子の仲間がもっと欲しい

撮影当日に来ていた原田研のメンバーとぬいぐるみに囲まれて。学生メンバーは全部で17人。そのうち女の子は2人しかいないので、ぜび女の子にも入ってきてほしいです。

機械情報工学科

人を知り、ロボットを創る。ロボットをつくり、人間に近づく。機械情報工学科では、人間と機械と情報を結ぶ理論とシステムを創造可能なグローバルな視点をもち、かつ、緻密な思考を行える次世代のリーダーや研究者を育成することを目的としています。そのために情報学だけではなく、人を知り、デザインし、形あるものを創造する機械工学も学ぶことにより、実世界に立脚した確固たる知識と経験をもつ人材を養成しています。