線図形を介した計算機とのコミュニケーション

Human-Machine Communication with Diagrams

○小出 哲也(名大院) 正 渡辺 崇(名大)

Tetsuya KOIDE, Nagoya University, Furo-cho, Chikusa-ku, Nagoya
Takashi WATANABE, Nagoya University, Furo-cho, Chikusa-ku, Nagoya

  There are many opportunities for our communication and consideration to draw diagrams and pictures.
We have been studying a human-machine interface which accepts diagrams and understands their meanings in application domains, and proposed a useful and flexible system. The system has a rule-based inference mechanism and recognizes the domain where the diagram should be understood. In this paper, we construct an interface system to communicate in natural language (Japanese). In addition to the inference mechanism, the new system consists of three subsystems: a decomposition mechanism of input sentences, a conversion mechanism of sentences into command lines and a drawing system. These subsystems presents an integrated interface which makes communication with diagrams more natural and practical.

Key Words : Diagrammatic Reasoning , Human-Machine Communication, Natural Language, Artificial Intelligence

 

1.まえがき

 我々は日常,図や絵を描くことで,意志の疎通を図ったり物事について思考することがよくある.例えば道順の説明であれば,口頭だけで伝えるよりも図も用いるほうが情報伝達は確実であるし,方向や建物の位置関係といった状況の把握が容易である.更には,話す言語の異なる者同士が対話する場面においても,図の描画を利用した会話は,意思疎通の上で大変有効なものである.本研究では,このような図が持つ効用(1)に注目し,人と計算機との図を介した円滑なコミュニケーションのためのアプローチを示す.

 人間主体の対話を実現させるためには,計算機が人間の意図を理解できなければならない.例えば1つの図でも,それが用いられる応用領域ごとに意味を持つため,人が想定している分野を推定する必要がある.上田ら(2)は,人と計算機が,図を介して会話を進めるための方法について具体的に考察し,図推論システム(DRSDiagrammatic Reasoning System)を構築している.そこでは,人と計算機との円滑な対話を実現するための例として,人が図に込めた問題領域を同定し,比喩的表現を理解することのできる推論法が提案されている.
 本研究では,この図推論システムに注目し,より実用的なシステムへ発展させていくための一段階として,自然言語を使いながら人が計算機と対話できる環境の構築を行なった.また,扱う図情報が更新された場合の表示機能を
Javaアプレットで作成し,システムを身近な環境から容易に利用できるようにするためのWebインターフェイスを作成した.システム独自の機能の拡張も検討しており,これらによって線図形を介した人と計算機の,より円滑な対話へ近づけることを目標としている.

 

2.図推論システム

 図推論システムDRSは,ルールベースの推論機構を持ったシステムである.1つの図を幾通りにも解釈することができ(多義解釈機能),これにより,人が用いる比喩的表現を理解する.具体的には,円と線分で描かれた図を推論の対象とする.例えば人が,与えられた図を木構造(樹形図)とみなして話をしようと意図するのであれば,システムは,それにあわせて,円を木の「根」,木の「葉」や木の「節」のいずれかとみなす.そして線分については,木の「幹」や「枝」といった捉え方をする.また一方で,人がこの図を線路図とみなすならば,システム側も,円を道路の「交差点」や鉄道の「駅」,そして線分を「道路」や「線路」と捉えて話を進める

 推論の対象となる図は,アプリケーションプログラムのtgifに準拠した書式のオブジェクトファイルにより記述される.DRSは,このファイル内に記述されているオブジェクトの位置関係を表す数値情報から,図オブジェクト間の上下左右の位置関係や接続関係などの定性的な図表現を作り,これをもとに推論を行なう.

 DRSが有する主要な機能は以下の通りである.

(1)質問回答機能 図に関するユーザの質問に対してシステム側が回答を表示する機能.

(2)描画追加機能 ユーザが図への新しいオブジェクトの追加描画を要求したときに対応する機能.

(3)ラベル付け機能 名前の付いていない図オブジェクトに対し,ラベル付けという形で命名する機能.

 DRSの実装は,Linux上のAllegro Common Lisp 5.0を用いて行なっている.

 DRSを含んだ一連の処理の流れについて説明する(Fig.1).全体的な処理は,Perlプログラムで統括する.まず,ブラウザから入力された日本語文を,後述するJUMANに渡し,一旦単語単位に分解する.次に,本研究で独自に作成した辞書ファイルを参照しながら,DRSが読み込み可能なコマンドラインに変換する.そして,Lispインタープリタを起動してDRSを呼び出し,推論対象となる図とコマンドラインを読み込ませる.推論後のDRSの結果に対して,回答文はPerlプログラムで,図情報はJavaアプレットで表示することにより,1ステップの対話処理が終了する.図情報の変化は,次回以降の推論においても順次引き継がれる.

 

3.日本語形態素解析システムの利用

 本研究では,Webページから図についての質問文や要求文の入力を受けた際に,内部で形態素解析システムJUMAN(3により品詞分解を行なう.JUMANは,京都大学の長尾研究所で黒橋らによって開発されたアプリケーションプログラムである.例えば,「根はどれ?」という文がJUMANに渡されると,「根」,「は」,「どれ」,「?」といった各品詞および記号の単位に分解される(Fig2).
 入力された日本語を
JUMANシステムによって一度分解した上で,分解された個々の単語と,本研究で独自に作成した辞書ファイルとを対応付けてDRSが読み込み可能なコマンドラインへ変換する.例えば,「根はどれ?」という入力文は,「query what root 」というDRSの理解できるコマンドラインに変換されて推論が行なわれる.

 

4.稼動

 図推論システムの稼動例を,入出力画面Fig3およびFig4を交えながら解説する.
 入力画面においてユーザから質問文や要求文が入力されて決定ボタンが押下されると,内部で
Perlプログラムが実行される.このPerlプログラムには,JUMANDRSの実行や日本語からコマンドラインへの変換を行なうための処理が記述がされている.待機中であったJUMANに対し,入力文の形態素解析の実行を依頼する.結果,Fig2のように品詞別の各単語が得られるので,次はその単語を辞書ファイル内の英単語に置き換え,DRSが読み込み可能なコマンドラインを生成する.そしてDRSにそのコマンドラインを渡して推論する.最後に,DRSからの応答をPerlプログラムが受け取り,図答表示,Javaアプレットを利用した描画を行なう.
 入力画面(
Fig3)において,例えば,「FHを連結せよ」という要求文を入力して「決定」ボタンを押すと,計算機が推論を開始する.結果画面(Fig4)では,計算機側からの「了解」という回答と共に,図の状態が要求どおりに更新されていることが確認できる.

 

6.まとめ

 本研究では,これまでに提案されてきた図推論システムを拡張し,図と自然言語を用いたインターフェイスをWWW上において構築することで,より円滑に対話を進める環境について考案した.
 今後は,「太い経路はどれ?」
や,「大きい駅はどれ?」 といった,サポートしていない機能の充実化を図り,更に柔軟なシステムへと発展させていきたい.

 


参考文献

  1. Glasgow, J 2, Diagrammatic Reasoning, AAAI Press, 1995).
  2. 上田, 渡辺, 図を介した人との円滑なコミュニケーションを目指す多義解釈とその推論の一提案,情報処理学会第56回全国大会講演論文集(2) ,1998, pp230-231
  3. 黒橋, 日本語形態素解析システムJUMAN Ver.36, 京都大学大学院情報学研究科知能情報学専攻,1998).