B班・D班 合同研究会

日時: 1995年12月8日(金)・9日(土)

場所: 関西大学 セミーナーハウス「高岳館」

処理負担と報酬に基づく頑健な対話文解析 松本裕治 (奈良先端大)

語彙の共起関係を包含する自由文脈文法の設計法 日高達 (九大)

各種音声コーパスの高頻度n-gramの特徴 上田直子 高木一幸 山本幹雄 板橋秀一 (筑波大)

音声対話システムの評価 藤崎博也 (東京理科大)

自律移動ロボットを使用する際の音声情報の利用について 平松薫 安西祐一郎 (慶應大)

音声情報処理技術を応用した語学教育 壇辻正剛 (関西大)

話ことばの副助詞 丸山直子 (東京女子大)

対話音声の抑揚の分析 市川熹 佐藤伸二 (千葉大)

知識管理の標識 田窪行則 (九大)

自然言語解析の新しい手法 -LR表工学の提案- 田中穂積 (東工大)

対話場面における言語獲得 小林哲則 (早大)

日本語話者と韓国語話者との対照からみた対話における発話解釈と応答生成の認知的特性 金子康朗 (釧路公立大) 阿部純一 (北大)

スケジューリングタスクにおける自由発話音声データの特徴 榑松明 中筋知己 (電通大)

自由会話における因果関係の表現 西澤信一郎 森辰則 中川裕志 (横浜国大)


1. 処理負担と報酬に基づく頑健な対話文解析

松本裕治 (奈良先端大)

対話においては常に文法的に正しい文が発話される保証はなく,非文 法的な入力を処理するための頑健な言語処理手法が不可欠である.文 法的および意味的制約の違反,間投詞の挿入,言い直しなどの対話に 生じる様々な言語現象を統合的に取り扱うことのできる枠組を提案し た.文法に基づく解析結果は句や節の断片の集まりとして得られるが, 本手法では,最終的な解釈へと至るためにそれらが果たす貢献度を 「報酬」それらにまつわる制約違反を修正するための処理を「コスト」 として定義し,報酬とコストのバランスによって解析を行なう.


2. 語彙の共起関係を包含する文脈自由文法の設計法

日高達 (九大)

音声対話のための自然言語の統語規則は、句構造を統御する句生成規 則と意味上の重要な制約である語彙の共起関係を包含する確率文法で あることが望ましい。しかし、語彙の共起制約を確率文脈自由文法に 組込むことは難しいとされて来た。本研究では句の主要な意味を荷な う head word という概念を導入し、語彙の共起関係を文脈自由文法 に構造的に取込む方法を考察する。


3. 各種音声コーパスの高頻度N-gramの特徴

上田直子 高木一幸 山本幹雄 板橋秀一 (筑波大)

本研究では、音声コーパスの設計法の指針を提案することを最終的な 目標とし、音声コーパスの選択方法を定量的に示すことを試みている。 本稿では、音声コーパスの書き起こしテキストに注目し、簡単な統計 調査を行うことによって、音声コーパスの選択に有用であると思われ る情報を抽出する方法とその結果について述べている。既存の5種類 の音声コーパスについて1 〜10モーラ結合頻度を調べることにより、 書き言葉と話し言葉の区別、対話のキーワード、大まかな対話のタス クを知ることができた。また、各モーラ結合単位のエントロピーを調 査し、音韻バランスについても各コーパスの比較検討を行った。さら に、Nモーラ結合で抽出される単位列から重複する単位列を除くこと により、対話中に現れる決まった言い回しを得ることが出来た。これ と合わせて、各話者毎の発話の偏りを考慮することによって、タスク の内容やその性質など音声コーパスの詳しい特徴を知ることができる ことが分かった。以上のように、簡単な統計調査をとることにより、 形態素解析などの複雑な作業を行わずにコーパスの内容をある程度示 すことが可能であることを示した。


4. 音声対話システムの評価

藤崎博也 (東京理科大)


5. 自律移動ロボットを使用する際の音声情報の利用について

平松薫 安西祐一郎 (慶應大)

音声言語情報を用いてパーソナルロボットとインタラクションを行う ためには,音声言語情報のみでなくパーソナルロボット周辺の非音声 言語情報の活用が重要となる.本研究では,非音声言語情報として周 辺のユーザ情報に注目し,パーソナルロボット向けユーザ識別システ ムとロボット上で実行するセンサマネージャの作成を行った.ユーザ 識別システムは,ユーザの身につける Identification Pendantとロ ボット上のレシーバから成り立つ.Identification Pendantから発信 されるユーザ IDをレシーバが受信することでユーザの識別を行う. また,音声対話の継続性とロボットの環境の変化に対する即応性を調 整するために,ロボット上で実行されるセンサマネージャを作成した. センサマネージャは,音声言語情報やセンサ情報などの複数の入力と マネージャ内のルールのマッチングを行い,状況に応じたアクション スレッドを生成する.複数のアクションスレッドの並行実行によって, 音声対話をはじめとしたパーソナルロボットの様々な動作が行われる. 発表ではこの二つのシステムを利用した例として,ユーザ識別情報を 利用した発話と荷物の受け渡しをビデオで紹介した.


6. 音声情報処理技術を応用した語学教育

壇辻正剛 (関西大)

音声教育に重点をおいた語学教育はLL教室で行なわれることが多い。 我々はLL教室にパーソナルコンピュータを導入した語学教室を設計 し、音声情報処理技術を応用した音声対話主体の語学教育を試みてい る。導入されたパーソナルコンピュータはMacintosh Quadra 650 お よびNEC PC-9821 Ce Model2 であり、コンピュータとの連動方式のL L授業用になっている。Macintosh Quadra 650には音声情報処理ソフ トウェアとしてMac Speech Labo IIがインストールされており、NEC PC-9821 Ce Model2には音声情報処理ソフトウェアとして音声工房が インストールされている。LL教室の概要は以下のようである。1教 室48名分のブースが用意されているが、2ブースは予備ブースとし て通常は利用しないので、クラスサイズは46名である。2名で1卓 を占めることになるが、1卓にカセットデッキ2台と接話式マイクロ フォン2セットと、中央にモニター1台が標準装備されている。モニ ターは埋め込み式になっている。授業は目的指向のタスクを設定して、 音声対話を主体とした内容になっている。学生による評価をアンケー ト調査したところ概ね好評であり、さらにシステムを発展させていき たいと考えている。


7. 話しことばの副助詞

丸山直子 (東京女子大)

格助詞の現れない格成分の中には、「新聞は読む」「新聞だけ読む」 のように、係助詞や副助詞が現れているものがある。筆者は、副助詞 を体副形成子(体言や副詞相当の表現を形成するもの)として捉え、 格助詞の無形化が、係助詞と副助詞では異なる形で現れているとみて いる。つまり、「新聞φは読む」と「新聞だけφ読む」の違いである。 本発表では、話しことばによくみられる助詞「とか」「なんか」「な んて」が、対話の書き起こしデータや新聞記事において、どのような 現れ方をしているかについて報告し、ルール化の方向を示した。並列、 引用、例示、非断定の姿勢などが関わる。


8. 対話音声の抑揚の記述

市川熹 佐藤伸二 清水詠行 堀内靖雄 井宮淳 (千葉大)

整形分を実時間で理解できる対話音声などの対話型自然言語では、抑 揚情報が本質的に重要な役割を果たして居ると考えられる。しかし、 この様な機能を可能としている抑揚の具体的構造は必ずしも明かでは ない。そこで本研究では、対話における抑揚の機能を解析するために、 対話コーパスにピッチを中心とした抑揚情報の符号レベルの記述法を 提案した。また、それを準実時間で処理する可能を具体的に提案し、 実験結果の例を示した。さらに、本手法を基に準実時間で発話文の構 造を推定する手法を提案した。


9. 知識管理の標識

田窪行則 (九大)

日本語では、いわゆる人称代名詞が完全に他の名詞と文法的に分離し ておらず、様々な表現をもちいて人称を表現している。しかし、本来、 対話においてもっぱら話し手自身を表す単語「私、僕、おいら、うち、 等」、聞き手を表す単語「あなた、君、おまえ、等」と、本来は人称 詞とは関係ないが、対話の場面で、場合によって、話し手自身、聞き 手を指せる語彙がある。「お父さん、お母さん、おばあちゃん」のよ うな親族名称を表す語や「先生」は、全ての人称を表すことができる し、「教授、師匠、親分、だんな」のような上下関係を表す語や「社 長、課長、大尉、店長」等の職階を表す語は、三人称を表すと同時に 二人称を表すこともできる。これらの本来人称を表す名詞類と他の類 のものとがどのように異なるか、また、本来、人称詞でないもののな かで、話し手自身や聞き手を指せるものと指せないものの違いはなに かを考察した.ここでは、本来、人称詞でないものが、聞き手を指す ことができるのは、これらが呼称として使えることと関係しているこ とを明らかにし、これらの語が特定の対話場面における対話相手を表 す大域変数として機能していることを示した.このような特定の対話 セッションにおける大域変数の設定の仕方を見ることで、他の代名詞 的単語(自分、彼、等)の様々な用法が説明できることを示した.


10. 自然言語解析の新しい手法 −LR表工学の提案−

田中穂積 (東工大)

自然言語を解析するにはさまざまな制約を考慮する必要がある.本発 表では,一般化LR解析法に基づく新しい自然言語の解析法を提案した. この手法によれば自然言語解析で用いる制約をLR表の上で実現し,既 存の一般化LR解析法を用いて解析をおこなうことができる.例として, 通常は正規文法あるいは接続表の形式で与えられる形態素の接続に関 する制約と文脈自由文法の形式で与えられる句構造の制約をLR表で表 現する例をとりあげた.さらにこの考え方を進めて音素の環境依存性 をLR表に取り入れる例も示した.この場合には,LR表が縮退できる場 合があることも紹介し,その制約伝播によるLR表の縮退アルゴリズム についても言及した.


11. 会話環境における言語獲得

小林哲則 (早大)

音声言語システムの言語移植に要する作業を軽減するため、会話によ る第2言語の獲得システムを構築した。本システムは初期状態におい て、極小規模の単語辞書以外新たな言語知識の記述を必要としない。 専門家による文法規則の記述あるいは大規模コーパスの収集・アノテー ション等の作業をせずに利用を開始できる。システムは第1言語のシ ステムの構築/利用時に得られる意味構造の大規模コーパスを参照し ながら、どのような文法・語彙を仮定すれば有意味な意味構造を生成 できるか仮説を立て、構文・意味解析を進める。さらに解釈した結果 でバックエンドシステムを起動し、その応答が、利用者の意に沿った ものか否かを確認することで仮説の検証を行なう「弱指導学習」によっ て知識を増やす。


12. 日本語話者と韓国語話者との対照から見た,対話における発話解釈と 応答生成の認知的特性

金子康朗 阿部純一 (北大)

対話を構成する発話に対して日本語話者と韓国語話者とでは一方にとっ て「普通」である発話が他方にとって「普通」ではないという意味に おいて全く異なった反応を示すことが指摘されている。この研究では 質問紙調査に乗り出す前にそういった対話における「普通さ」に関す る反応の特性及びその反応の違いを生じさせるのに関与している機構 についてどのような見通しをもつことができるのか示そうと試みた。 その結果、(i)「発語内効力に基づく応答」と「連想に基づく応答」 の二つのプロセスの存在と交替の仕方、(ii)「連想記憶機構」への入 力(単位)とそこからの出力(連想内容)、といった要因が日本語話 者と韓国語話者の対話に対する反応の違いに関与している可能性が示 唆された。今後の課題として、「普通さ」の最大化が局所的になされ ているのか大域的になされているのかという問題が、ゴール(発話の 機能)とプラン(発話)との関係が日本語話者と韓国語話者とでは違 うということとからめて解決されなければならないと考えられる。


13. スケジューリングタスクの自由発話音声の言語的性質

榑松明 中筋知己 (電通大)

話し言葉による音声対話システムや音声翻訳システムを実現するには、 頑強な音声認識と自由発話の言語処理が必須である。このためには、 人間が話す音声や言語の基本的研究のベースとなる自由発話のデータ ベースが重要である。我々は、二人の話者が都合のよいスケジュール をきめるというスケジューリングタスクについて、人間対人間の音声 対話データベースを収集している。本稿では、まず、データベースの 収集方法について述べる。次に、書き起こしおよび形態素解析の結果 から、自由発話音声対話の言語的性質を主に品詞の頻度情報を用いて 分析する。また、品詞の細分類についても検討した結果、品詞バイグ ラム文法のパープレキシティの減少を得た。


14. 自由会話における因果関係の表現

西澤信一郎 森辰則 中川裕志 (横浜国大)

本稿では,日本語の会話中において,発話間の因果関係がどのような 形式で記述されているのか,をコーパスを用いて検討した結果につい て述べる.このような談話構造は,発話者の「思考の流れ」を示して いるものと考えられ,発話者は,地図課題対話など目的の定まった会 話の場合はもちろんのこと,雑談など特定の目的に左右されない自由 会話の場合でも,この構造をある程度認識し,協調的な会話を進めて いるものと考えられる.そこで,本稿では,地図課題など目的の定まっ た会話からなるコーパスではなく,飲み会の席上での会話データを対 象とした自由課題コーパスを用いた検討を行なった.また,この検討 結果を利用し,因果関係を記述するような談話構造をコーパス中から 取り出すために必要な手順について提案した.