説明を中断して別の会話をしても
元の話題に戻ることが可能
実験結果の分析を踏まえて2008年度はプログラム作成に取り組み、エージェントが自律的に動くシステムを完成させた。
このシステムは、ユーザーの視線と音声を識別し、それに応じて会話や動作を自動的に変える。たとえば、エージェントがある携帯電話の説明をしているとき、ユーザーが別の携帯電話を注視していると、話題を切り替える。あるいは、説明の途中でユーザーがその携帯電話の価格を質問すると、説明を中断して価格について答え、「よろしいでしょうか」と確認してユーザーが「はい」と返事をすると、説明に戻る。文字通り、ユーザーの態度に気づくエージェントだ。
「アイトラッカで計測するユーザーの視線データと、音声認識によるユーザーの発話データは理解部というところに入ってきて、ユーザーの会話参加状態が分かるようになっています。
エージェントの動作をコントロールするのは、会話管理部です。理解部に入ってくるユーザーの情報と、予め設定しているエージェントが話すべき内容を照合しながら、エージェントの発話や動作を次々に決めていきます。そして、その発話や動作に応じた合成音声、表情、ジェスチャーが自動的に生成されます」
また、このシステムは、エージェントやユーザーが話した内容、ユーザーの視線データなどを記録するIS(インフォメーション・ステート)という機構も備えている。
「ISは、エージェントがいつ何を話したか、ユーザーがいつどのような返事や質問をしたかといった情報を一元的に管理しています。このISによって、どこまで話が進んだかが分かるので、エージェントが話を中断してほかの商品の説明をしたり、ユーザーの質問に答えたりしても、中断した話に戻ることが可能になっているのです」
中野先生は、ユーザーの態度に気づく会話エージェントの研究をライフワークの1つに位置付けている。今後は、センサーを増やして、ユーザーの視線だけでなく頭の動きや手の動きを読み取り、それをエージェントの振る舞いに反映させていくことなどをめざしている。
【用語解説】
*1 エージェント:情報科学、とくに人工知能の分野でよく使われる言葉。この言葉自体はもともと「代理人」とか「動作主」といった意味があるが、その両方の要素を持ち、人間とコンピュータの仲介役として自律的に動くものを会話エージェントという。
*2 ウィザード・オブ・オズ(オズの魔法使い):ある人工物に対して人間がどのように反応するか、どのようにインタラクションするかを知りたいときに、とりあえず見かけだけつくって、それを人間が操作し、被験者のデータを得ることを目的とした実験方法のこと。
《つづく》
(次回は「異文化コミュニケーションを支援する会話エージェントについて」です)
■成蹊大学 理工学部
http://www.seikei.ac.jp/university/rikou/