ICSLP-94における展示

日時:9月 19日(月)16:00 〜 22日(木)12:00

場所:横浜・パシフィコ横浜

1. 音声対話カーナビゲーションシステム  (早稲田大学)

2. 渋谷の飲食店の情報提供を行う音声対話システム  (東京工業大学)

3. 巡視者支援用音声応答システム  (東京大学)

4. 自然な発話の日本語音声認識システム  (豊橋技術科学大学)

5. 自由発話からのキーフレーズスポッティング  (京都大学)

6. 音声理解のためのLightweight Parser  (東京大学)

7. 音声分析・評価システム  (宇都宮大学)

8. 音声対話コーパスの作成  (千葉大学)

9. 日本音響学会音声コーパス  (筑波大学)

10. 音声による 英語/中国語/日本語 識別  (豊橋技術科学大学)


1. 音声対話カーナビゲーションシステム

白井克彦 中里収 大川茂樹 亀山晋 桜井直弘 大附克年 (早稲田大学)

カーナビゲーションをタスクとした音声対話システムのプロトタイプ を紹介する。今回のデモンストレーションでは、横浜の観光地でのド ライブをトピックとして扱う。このシステムは以下のような特徴を持 つ。(1)キーワードスポッティングに基づく音声認識、 (2)対話状態 の遷移により話題を取り扱う対話管理、(3)大規模データベースを用 いた文音声合成。ユーザが音声対話によりいくつかの目的地を入力し、 経路を決定すると、システムは設定された経路のドライブシーンをシ ミュレーションする。


2. 渋谷の飲食店の情報提供を行う音声対話システム

田中穂積 秋葉友良 上條俊一 (東京工業大学)

我々のデモシステムは、渋谷の飲食店に関する問い合わせに答えるこ とをタスクにしており、次のような特徴を持つ。
1) 不特定話者連続音声認識に基づいた発話認識
2) 自由発話に対応することを目的とした言語処理
3) ユーザモデルを考慮した適切な対話管理


3. 巡視者支援用音声応答システム

広瀬啓吉 妹尾徹 桜井淳宏 (東京大学)

このシステムは電力施設の巡視者に天候状態などの情報を与える。情 報は巡視者の質問に対する音声応答の形で主に与えられる。システム は以下の機能を持つ。
1) 必要な情報の選択
2) Q-Aタイプの対話応答の生成
3) 天候状態に関する警告や警報をon-lineで知らせる


4. 自然な発話の日本語音声認識システム

中川聖一 甲斐充彦 (豊橋技術科学大学)

このシステムはパーザを統合したHMM連続音声認識に基づいている。 間投詞や言い直しを扱うための未知語処理を含んでおり、自然な発話 を認識するための実験的なバージョンのシステムである。


5. 自由発話からのキーフレーズスポッティング

堂下修司 河原達也 荒木雅弘 (京都大学)

自由発話の頑健な理解を指向したキーフレーズスポッティングのデモ ンストレーションを行なう。本手法は、認識可能な部分のみを抽出し、 残りをスキップするものである。発話全体を近似するヒューリスティッ クな言語モデルと共に、フレーズ文法を用い、2パス探索で実現して いる。プラットフォームはSPARCstation10である。


6. 音声理解のためのLightweight Parser

Nigel Ward (東京大学)

Lightweight parser は音声理解システムと密に統合するために適切 なパーザである。パーザへの入力は単語仮説のラティスであり、出力 は意味解釈に必要なスコア付けされた手がかりの集合である。さらに、 出力はフィードバックのためにも使われる。このパーザは、文法的に 何がどこにあるべきかについての相互に独立で、スコア付け可能な "construction hypotheses"(構造仮説)を利用している。


7. 音声分析・評価システム

粕谷英樹 (宇都宮大学)

このシステムは音声研究者、音声言語治療士、喉頭科医のために設計 されたWindows上で動作するソフトウェアである。システムの特徴は、 次の通りである: (1)フォルマント、ピッチ、スペクトラム、音響スペクトログラムを 含む基本音声パラメータの高速な計算、(2)ジッタ/シマ、声門雑音、 スペクトラム形状を含むいろいろな音響音声評価パラメータの計測、 (3)豊富な波形編集機能、(4)Windows機能の有効活用。


8. 音声対話コーパスの作成

市川熹 仲真紀子 土屋俊 (千葉大学)

千葉大学における日本語 Map Task Corpus プロジェクトは、言語的・ 音響的かつ認知科学的にも十分に信頼性がある日本語の対話コーパス を構築することを目標としている。基本的なデザインはエジンバラ大 学のMap Task Corpusのものと同様であるが、被験者の非言語的な行 動を記録するのに十分な拡張がなされている。次の様な特徴を持つデ モを行う。
1) 収集されたサンプルのデータ、音声、書き起こしの統合的な表現
2) 対話の書き起こしのためのツールキットのプロトタイプ


9. 日本音響学会音声コーパス

板橋秀一 岡登洋平 (筑波大学)

このコーパスは7枚のCD-ROMに入った音声波形とテキストから成って いる。これらは28の研究所が協力して収集された。Vols.1-3には、 ATR音韻バランス文が9,600文入っている。Vols.4-6には、いくつかの ガイドタスクにおける12,000文が入っている。Vol.7には37の模擬対 話とその書き起こしテキストが入っている。


10. 音声による 英語/中国語/日本語 識別

中川聖一 Allan A. Reyes (豊橋技術科学大学)

HMMに基づく2つの手法を用いた言語識別実験を行った。2つの手法 はエルゴディックHMMと最適シーケンスのトライグラムに基づく。こ れら2つの手法を統合したものは、4ヶ国語の言語識別で、10秒の発 話に対して98.4%の識別性能を達成している。