TOP > 研究活動 > 研究者総覧「情報知」 > メディア科学専攻 > 音声映像科学講座 > 松原 茂樹

研究者総覧「情報知」

メディア科学専攻

氏 名
松原 茂樹(まつばら しげき)
講座等
音声映像科学講座
職 名
准教授
学 位
博士(工学)
研究分野
自然言語処理 / 情報検索 / デジタル図書館
松原 茂樹

研究内容

自然言語のコンピュテーションとコミュニケーション
■研究の概要■
言語情報を知識資源として活用する新しい情報基盤の実現を目指し、自然言語処理に関する研究を推進している。これまでに、構文解析、意味解析、言語生成などの基礎技術、ならびに、機械翻訳、音声対話などの応用技術を開発してきた。自然言語のデータ構造及びアルゴリズムを重視する計算言語学と大規模言語データを重視するコーパス言語学を融合したアプローチにより、人間の言語処理能力への接近をはかっている。最近では、情報の流通における言語が果たす役割に着目し、言語技術を駆使した社会システムを拓くための研究開発を行っている。
■研究テーマ■
(1) 言語情報処理
ロバストで使いやすい自然言語システムの要素技術として、言語処理の高速化に関する研究を進めている。その一手法として、漸進的な言語解析アルゴリズムを考案し、また、確率文脈自由文法、木接合文法、依存文法、有限状態オートマトンなどを用いて実装し、高速化への高い効果を実証している。この技術は同時通訳機などの高度アプリケーションの設計・開発にも応用されている。同時通訳は人間にとって極めて高度な言語行為であり、その仕組みを解明するための言語分析にも取り組んでいる。
(2) 音声言語処理
講演や講義など独話は貴重な知識資源であり、音声を蓄積し再利用できる環境を整えることは、情報化社会の高度化に大いに貢献する。音声情報を効果的に利用するには、音声の収録や文字化だけでなく、意味的に構造化することが重要である。我々は、話し言葉解析による独話音声の構造化方式を開発している。統計的手法により、高精度でかつ高速な解析が可能になる。
また、人と機械の円滑なインタフェースの実現を目指し、音声コミュニケーションの研究を展開している。ロバストな音声対話を実現するために、コーパスに基づく対話処理技術(話し言葉解析、発話意図理解、対話制御、応答生成など)を開発している。対話データを事例や統計として活用することにより、人間の振る舞いに類似した自然な対話処理が可能となる。
(3) 文書情報処理
WWWをはじめ、世の中には実に多くのデジタル文書が存在し、必要な情報を容易に参照できる環境の提供が望まれている。このような状況を鑑み、分類、変換、要約、換言などの文書加工技術、また、情報検索、情報抽出などの文書アクセス技術の開発を進めている。また、名古屋大学で生産された学術論文やWebサイトなどの文書データを用いた実証実験を通してブラッシュアップをはかっている。これらの技術を統合することにより、デジタル図書館機能を備えた大学の学術情報基盤のモデル形成、ならびに、大学の知的生産物を社会へ還元する情報発信機能の構築を目指している。
(4) 言語コーパス
言語処理技術の発展のために、人間の言語行為に学ぶことが重要である。我々は、同時通訳データ、車内音声対話データ、講演番組データ、学術論文データ、判決文データなど大量の言語コーパスを収集し、分析、統計、事例、実験のデータとして活用している。利用価値の高い言語資源とするため、規模と品質(アノテーションの多様化)の双方の向上をはかっている。
■今後の展開■
上述の要素技術を背景に、音声・文書の流通環境の充実を目指した研究を展開する。具体的には、大型計算機を用いた大規模言語計算、音声言語マイニング、学術情報機構としての大学Web、言語資源の共有化を進めるともに、フィールドデータを駆使した技術の実用化を推進する。人間の知的活動を効果的に支援する言語情報基盤の構築を通して、人間と機械が共生するユビキタス知識社会を探求していく。
言語コーパスの構築と利用

言語コーパスの構築と利用

経歴

  • 1998年名古屋大学大学院博士後期課程修了。博士(工学)。
  • 1998年同大学助手。
  • 2002年同大学助教授。現在、情報科学研究科准教授。この間、日本学術振興会特別研究員、ATR音声言語コミュニケーション研究所客員研究員、独立行政法人情報通信研究機構専攻研究員を兼任。

所属学会

  • 電子情報通信学会
  • 情報処理学会
  • 人工知能学会
  • 言語処理学会
  • 日本通訳学会
  • ACM
  • ACL

主要論文・著書

  1. Robust Dependency Parsing of Spontaneous Japanese Spoken Language, IEICE Transactions on Information and Systems, E88-D (3), 545-552 (2005).
  2. Example-based Query Generation for Spontaneous Speech, IEICE Transactions on Information and Systems, E87-D (2), 324-329 (2005).
  3. 主辞情報付き文脈自由文法に基づく漸進的な依存構造解析,電子情報通信学会論文誌,J86-D-II (1),84-97(2003).