Mood Calculating Method for Speech Interface Agent by using Emotion Generating Calculation Method and Mental State Transition Network

Jazyk: japonština
Rok vydání: 2010
Předmět:
Zdroj: 知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics. 22(1):10-24
ISSN: 1347-7986
Popis: 現在,音声によるインタフェースに対する注目は年々高まっており,応用システムとしても,さまざまな用途のアプリケーションが開発されている.このような人間とインタラクションを行うエージェントにとって重要な機能として,人間の意図の理解,エージェントの行動の決定,エージェントの状態表出の3機能が挙げられるが,本研究では特にエージェントが自身の感情状態を表出する機能に注目する.本研究では,CGエージェント型の音声情報案内システムである「たけまるくん」に対してエージェントの感情を付与することで,より親しみやすいコミュニケーションを実現することを目指す.「たけまるくん」はユーザ発話を想定した質問文データベースを持っており,それぞれの質問文には,応答文とエージェントのリアクション動画が対応付けられている.そして音声入力からスコアリングにより質問文が選択され,リンクされた応答文とリアクション動画を出力する.本手法では,まず情緒計算手法を用いてユーザの発話内容に対するエージェントの生起情緒を計算する.次に,気分の変化を状態遷移によって表すため,心的状態遷移ネットワークを用いる.これにより気分状態はエージェントの生起情緒をもとにして心的状態遷移ネットワーク上を連続的に変化していく.各気分における固有の応答文データベースとリアクションデータベースを作成することで,質問文に対し気分によって異なる反応を返す.さらに,事前に計算され質問文に付与された生起情緒を基に気分の遷移を行う.生起情緒は,入力文,応答文,リアクション,気分の4つのセットに対して計算される.そのために,まずこのセットを人間が認識および行動したときに心の中で認識される事象を抽出し,その事象に対して情緒計算手法を適用することで生起情緒を計算する.そして,生起情緒と心的状態遷移ネットワークの遷移コストをもとに7種類の気分状態を遷移する.従来のエージェントと本手法のエージェントに対する印象を18の形容詞に対し評価した結果,本手法においては好感因子の平均得点が高く,性格に関する項目においては,「やんちゃ」や「不真面目」の項目の平均得点が従来手法に比べて高かった.使用感に関する項目では,「楽しめそう」の項目で高い平均得点を得た.本手法は従来手法より好ましい印象を与え,エージェントが性格を持っているように感じられることから,本手法に基づくエージェントに対して,ユーザがより親しみを感じているといえる./ This paper proposes a human-computer interaction system that the computer agent has an emotion calculation process in order that the user feels familiar to the agent. The interaction system is developed based on a speech interface system “Takemaru-kun” constructed by Shikano et al. 4465 question-example texts are prepared for Takemaru-kun and all the texts are determined suitable response texts and animation gestures. When speech recognition result is inputted, the most similar question-example text is chosen and its corresponding response and gesture are presented to the user. However, the Takemaru-kun system always replies the same reaction for the same input. It makes us feel monotonous and mechanical. The variation of reaction is one of the factors to be able to decrease such images. In order to reply different response for same input and different mood, a set of response text is prepared for each mood. Next mood is calculated from present mood and emotions aroused from input utterance. The emotion is calculated from events which are recognized when human hears input utterance and reply response at the present mood. Emotion Generating Calculation method is used to calculate emotions. Then, the mood transits on Mental State Transition Network based on aroused emotions and the transition cost. 41 subjects evaluated the impression of proposed system using 18 adjectives. As a result, average of “preference” factor of proposed system was higher than that of non-emotion system. And the averages of “mischievous,” “light-minded,” and “entertain” were also high.
Databáze: OpenAIRE