マルチメディア工学専攻
ビッグデータ工学講座の紹介

マルチメディア工学専攻 | 鬼塚 真

 コンピュータ将棋・しゃべってコンシェルの音声認識・IBM質問応答システムWatsonなどに代表されるように、ビッグデータを利用して人間の能力に近い情報処理をする技術が注目されてきています。ビッグデータ工学講座では、このような社会を変えるビッグデータ革命を牽引するためのIT技術の研究を行っています。

分散データ処理・グラフマイニングとその応用

 Data is the new oil(データは新しい石油である)という言葉に代表されるように、ビッグデータを処理することで知識やルールを発見して、社会的あるいは経済的なインパクトを生み出すことが期待されています。特に、ウェブやソーシャルメディアの普及などに伴って、データの単位は従来の単純な表構造データから、多様な関係を表現可能なグラフ構造へと変化しつつあり、例えば人・モノ・場所からなる大規模なグラフデータを瞬時に分析することが重要な技術課題となっています。当講座では、①大量の計算機を利用した分散データ処理技術、②高速グラフマイニングアルゴリズム、③分析結果の可視化技術に取り組んでいます。更に、開発した技術を社会に生かすため、社会的な問題になりつつある認知症患者のケアの負担を如何に減らすかという問題への適用、およびセンサやアクチュエータを活用した実世界におけるスマートショッピングへの適用などに取り組んでいます。

自然言語処理による知識抽出とその応用

 言語は人間の知性の根幹に関わるものであり、事象や思想、概念の記録、また意思伝達において非常に重要な手段です。そのため、言語化されたデータには人間の持つありとあらゆる知識が凝縮されています。当講座ではビッグデータのなかでも特に人間が生成したテキストを対象とし、解析・処理することで人間のもつ知識を大規模に抽出し、またコンピュータで利用可能なように抽象化する研究に取り組んでいます。

特に同一の事象を異なる言語表現により表す言い換え表現に注目しており、言い換え表現を大規模に抽出することで人間の言語生成能力の仕組みに迫ります。また収集した言い換え表現知識を応用して、英語学習者が書いた不完全な文を自動的に訂正する自動英文訂正技術にも取り組んでいます。

図1:グラフマイニングの分析例

図2:自然言語処理による知識抽出

PAGE TOP

©Graduate School of Information Science and Technology, Osaka University, Japan