D班 第1回研究会

日時:7月28日(金)

場所:早稲田大学 理工学部

協調的音声対話のモデリング   荒木雅弘 堂下修司 (京大)

クロスワードパズルタスクの対話の分析とモデリング  中里収 白井克彦 (早稲田大)

統計的音韻中心の推定とその応用  大川茂樹 白井克彦 (早稲田大)

状況依存性を考慮した確率文脈自由文法の検討  北研二 (徳島大)

千葉大学地図課題対話J1N4Fの談話構造について  土屋俊 (千葉大)


1. 協調的音声対話のモデリング

荒木雅弘 堂下修司 (京大)

本稿では、音声対話システムにおける2つの重要な側面 -- 「頑健性」 と「協調性」-- を反映した対話モデルを提案する。「頑健性」と 「協調性」を実現するために、本モデルでは会話空間と問題解決空間 と呼ぶ2つの処理空間を用いている。会話空間は動的に成長するネッ トワークで、発話の意味理解や表層的な対話の展開などを確率推論に よって行なうもので、Bayesian ネットワークの形式を用いている。 この会話空間によって対話モデルの「頑健性」が達成される。一方、 問題解決空間はプラン認識を行なうためのもので、タスク領域の知識 を階層ネットワークで表現している。この問題解決空間によって対話 モデルの「協調性」が達成される。本報告では、これらの処理空間と 段階的対話理解課程を対応づけ、対話モデルを構築するための方法に ついて説明する。


2. クロスワードパズルタスクの対話の分析とモデリング

中里収 白井克彦 (早稲田大)

音声対話には記号的・言語的な情報と供に,対話自体を制御する機能 を持った発話が存在している.例えば、呼びかけや返事、発話を促す あいづち、思考中を示す独り言などがあげられる。クロスワードパズ ルタスクの場合にも、言語的な情報に加え、対話の制御や情報の重要 度を対話場面に提示していることがすでに確認されている。本報告で は,2人の人間が協調的にクロスワードパズルを解く場面での対話デー タを分析し,上で述べた発話の機能に着目して対話コーパスにタグ付 けを行ない、対話の分析を試みる.


3. 統計的音韻中心の推定とその応用

大川茂樹 白井克彦 (早稲田大)

統計的音韻中心という新しい概念を導入し,それに基づく音韻性抽出 手法ならびにその音声認識への応用法を提案した.あらゆる音韻に対 して統計的に決定され得る中心点が存在するとの前提を設け,大量の 音声データに対して尤度の局所最大化に基づく繰り返し計算を行い, その点を推定する.この中心点の尤度を用いることにより,高精度な 音韻性抽出が実現できる.また,音韻中心間セグメントを単位とした HMMの連結により単語モデルを作成し,中心尤度を考慮した最適化ア ルゴリズムにより単語認識を行う.評価実験の結果,提案する手法の 有効性が確認された.


4. 状況依存性を考慮した確率文脈自由文法の検討

北研二 (徳島大)

学習データを幾つかのクラスタに分割し、各クラスタから確率文脈自 由文法のパラメータを推定することにより、対話状況依存性を持つ確 率文脈自由文法を構築する研究を行なった。IFT(Illocutionary Force Type; 発話行為タイプ)付きの対話コーパスを用いた評価実験 を行ない、通常の確率文脈自由文法よりも優れていることを示した。 また、IFT 付きのコーパスから、話者の交替や質問・応答・確認といっ た会話の基本的なサイクルを確率・統計的にモデル化するための研究 として、ergodic HMM および Alerigia アルゴリズムを用いた対話構 造の自動獲得についても研究を行なった。


5. 千葉大学地図課題対話J1N4Fの談話構造について

土屋俊 (千葉大)