A班・B班合同研究会

日時:12月17日(金)・18日(土)

場所:京都・御車会館


1. 音声対話システムのための音声合成手法と合成音声の心理的評価

--音声対話における応答音声の生成--

    広瀬啓吉 (東京大学)

音声対話システムでの応答音声生成は、テキストから音声を生成する 場合と比較して、言語処理手法や韻律規則に異なる点が多い。このよ うな観点に立って、現在、スキー場案内を対象としたシステムの開発 を進めている。入力は深層意味表現の形式で与えられるとし、それに 対して対話の流れに沿った適切な応答内容を生成し、それを文章化し て高品質の合成音声として出力する手法を開発した。この手法はいく つかの特徴を有する。まず、応答内容生成に関しては、個々の対話例 に対応する話題依存規則を作成して利用することにより、規則の追加・ 更新を容易なものとしている。音声化に関しては、対話音声用の韻律 規則を開発するとともに、高品質音声合成を可能とするフォルマント 合成器を作成した。実際に応答音声の合成を行って手法の有効性を確 認した。


2. 音素・単語・フレーズの同時スポッティングによる対話音声の解析

    有木康雄 (龍谷大学)

対話音声においては、音素、単語、フレーズといった階層的な聞き取 りが存在 すること、それらは下から上への階層をなしているのでは なく、学習の習熟や理解のレベルに応じて選択されるものであるとい う観点から、本研究では、各階層が同時に処理を進め、理解のレベル に応じて階層を選択しながら協調処理し、不明なところを補足する音 声認識手法を研究の目標としている。今回、継続時間長を持たない HMMにより、処理時間が早く、よく似た短い単語に対しても精度よく 抽出できるワードスポッティングのアルゴリズムを研究した。方法と しては、音素スポッティングと単語スポッティングを同時に進行させ、 音素セグメントの境界のみで単語をスポッティングし、更に継続時間 長チェック、既知語らしさチェックなど音素情報をできるだけ取り込 んで処理している。この手法を用いて、ATR連続音声25文(DSC)に対し て、57単語のスポッティングを行なった。音素境界に於て、第3ベス トまで単語スポッティングする事により、抽出率77.8%、わきだし率 128倍を得た。


3. 対話音声の音響的分析  --非言語的特徴の音響分析から対話の構造を解析する方法について--

    北澤茂良 松永隆雄 (静岡大学)

対話音声には音素レベルの音声認識ではできない対話 (Interpersonal Communication)固有の非言語情報が含まれる。音 声対話では言語的情報に加えて多くの暗示的な非言語情報が伝達され ている。しかし、音声によって伝達される周辺言語情報は超文節的特 徴や対話構造と明確に区分しがたい。われわれは対話音声の実例につ いて音響分析の立場から観察を進め、計算機による取扱いが可能なデー タを提供することを目指している。 「音声対話」の研究は音声情報処理技術と新しい言語学の流れと行 動科学などの関連諸分野の中で位置づけて、これまでの音声技術の研 究の枠組みを拡大した新しい枠組みを構築すべきであることを論じた。 特に、「音声対話」の中に非言語的情報を取り入れるための処理技術 について考察した。非言語的音声情報としてTragerが定義した周辺言 語の概念が行動科学や社会言語学の分野で継承されて、最近では「文 書の電子化と交換の指針」(TEI)として具体化されている。われ われは新しい音声技術研究の枠組みとしてTEIを取り入れた、すな わち、対話音声の非言語的側面を取り入れた、対話音声のラベル付け の実験を行いその結果を報告した。今後、このラベルデータについて 音声認識、言語解析、対話分析などの立場から実験を行いたい。


4. セミナーでの対話にみられるパラフレーズの分析

    仁科喜久子 (東京工業大学)

本研究はできるだけ自然な対話の分析をし、そのプロトコルを作成す ることを目標とする。分析対象として大学院セミナーの実況を10編 (530分)録画し、その中で特にパラフレーズの行われている部分に 着目した。 対話者は外国人留学生、日本人学生、日本人教官で、そ れぞれ日本語能力と専門知識に差がある集団である。パレフレーズは 語と語、語と文、文と文のそれぞれの組合せを12の型に分けて集計し 考察した。今回までの調査では、言い淀み、確認、自省、疑問、要約、 説得など様々な意図によって同一発話者による同一発話内の発話、あ るいは聞き手側の次項以降ディスコース全体に及ぶ発話で起こるパラ フレーズのコヒージョンの構造の様相を観察し、対話者間の属性との 相関性を検討した。また別添資料として現在までに書き起こした対話 コーパスを作成した。


5. 対話音声中の間投詞・未知語の処理方式

    中川聖一 甲斐充彦 (豊橋技術科学大学)

本稿では対話音声中に現れる間投詞や未知語に音声認識システムが対 処できるように、未知語処理を行なうための処理方式について検討し ている。一般に検討されている未知語処理法の有効性は、認識実験だ けで評価するのは困難である。そこで、計算機シミュレーションによっ て、システムの認識精度と未知語検出率がどのような関係であるかを 確かめた。また、実システムによって間投詞や未知語を含んだ音声の 認識実験も行ない、未知語処理法の一方式の評価を行なった。


6. 一般化LR法を用いた形態素解析と統語解析の統合

    田中穂積 (東京工業大学)

本論文では, 形態素解析と統語解析を一般化LR構文解析法の枠組で統 合化する手法を提案する. 形態素解析と統語解析を統合しておこなう ことによって, 形態的制約と統語的制約を同時に利用することができ る. 本手法では, 隣接する単語間の接続可能性検査をLR法における先 読みと関連させ, 接続表をLR表に組み込んでいる. これにより, 単語 が入力されると直ちにLR表による接続検査がおこなわれる.


7. “話者世界”表象の指標表現

    阿部純一 (北海道大学)

本研究では,人間が談話を理解する際に心内で行っている最も基本的 な処理の一つとして“話者及び発話の状況(話者世界と呼ぶ)に関す るモデル化”があることを指摘し,その心理学的性格について考察を 行った.話者世界は個々の発話に対して想定され得るものであり,そ の話者世界との関連の下に発話の命題内容は解釈される.すなわち, 与えられた個々の言語表現の外延特定,さらには行為的意味の解釈な どは,ある特定の話者世界を参照枠として使用することで解決されて いる.また,心内の話者世界表象は,単一の文の理解においてのみな らず,文連結すなわち談話の理解の過程にも大きな役割を果たしてい る.


8. 頑健な自然言語処理に向けて

    松本裕治 (奈良先端科学技術大学院大学)

対話文のような自由な発話の解析のためには,従来よく用いられてい る硬い文法と辞書に基づく解析手法に比べて,より柔軟でかつ頑健な 解析手法の確立が重要である.本研究では,非文法的な文の解析を可 能にする頑健な自然言語処理手法を概観し,個々の手法の利点と欠点 について考察した.多くの手法は,解析失敗に際して文法や辞書に記 述された種々の条件を緩和するという意味で緩和手法として見ること ができるが,事前に想定された種類の失敗だけに対処するのではなく, より柔軟な緩和手法を実現するために,少数の原則に基づく緩和手法 を提案した.また,我々が開発してきた汎用の自然言語解析システム を用いた実現方法についても考察した.


9. いわゆる「助詞の脱落」

    丸山直子 (東京女子大学)

本研究は、いわゆる「助詞の脱落」に関して、格の認定・無形表示の 機能・書き言葉と話し言葉の違いという、三つの観点から研究しよう とするものである。今回は、その中でも特に、格の認定に関して、I PALの動詞辞書を使用して、結合価情報がどのくらい使えそうかの 検討をした。対象とした無助詞格成分は529個。そのうち直後の動詞 にかかるものは431個、述語との間に他の要素があるものが98個だっ た。総じてIPALの情報がかなり有効であることがわかった。無助 詞の格成分が直後の動詞にかかる場合、ヲ格が圧倒的に多い。述語か ら遠い位置に現れるものは、格の認定がむずかしくなり、主題性が高 くなる。


10. 対話文理解のための解析手法と認知意味論的モデルの研究

    石崎俊 田中茂範 (慶応義塾大学)

対話文において意味を主体として解析を進めるためには、従来の意味 解析手法や、従来の辞書の機能では不十分なことが多い。対話モデル における処理単位としては、構文情報を中心としたものよりも、意味 を主体としたまとまり(チャンク)を中心として情報を交換するとい うモデルを考え、そのモデルに適した意味解析法や概念辞書が持つべ きの構造と機能に関して基礎的な検討を行う。 具体的には、概念辞 書における概念間の距離の導入、意味空間における距離とその変化の 考察、情緒的情報の導入などに基づいて、自然言語の意味を柔軟に解 析するための基礎について述べる。本研究で述べるいくつかの実験に ついては現在実施中であるため、具体的な結果は次の機会に明らかに したい。


◎パネル討論「音声処理と言語処理の統合」

パネリスト: 新美康永 (京都工繊大)

       中川聖一 (豊橋技科大)

       田中穂積 (東工大)

       石崎俊 (慶応大)