1 はじめに

音声研究を進める上で音声データが必要なことは言うまでもない。その音声データは、多種多様(性別・年齢・方言・人数等)であることが求められる。従来は各研究者が、必要に応じて音声データを収録し、保管・利用していた。音声研究が進歩するにつれて処理可能なデータ量が増大し、そのため用意すべきデータ量が大幅に増してきた。最近では、特に統計的手法の発達により大量の音声データがシステムの学習のために必要とされるようになった。[1-4]　一方、音声情報処理システムの研究・開発を行うためには、分析・合成・認識の各種の手法を適切に比較・評価することが必要とされる。これを行う方法としては現在のところ、共通の音声データを用いてこれらの処理を行い、その結果を比較するという方法以外は知られていない。このようなことから、共通利用可能な各種・大量の音声データを収録し、保管・公開することは研究・開発過程での利用および認識システムの性能評価の両面から求められている。このような目的に利用される音声データを一般に音声データベースあるいは音声コーパスと呼んでいる。音声情報処理の分野では　「音声データベース」というときには、データベースシステムよりも「大量の音声データの集積」そのものを指すことが多い。そのため最近では、それを意味する「音声コーパス」を使うようになった。音声コーパスの必要性やその意義については近年広く認められるようになってきた。[5-8]

本重点領域研究を遂行する上でも音声対話コーパスは必須という立場に立ち、コーパスワーキンググループ(以下、WGとする)が設けられた。本WGの目的は、これから発展するであろう音声対話研究の基礎的なデータとして活用できる、ある程度の規模のコーパスを構築することである。本WGのメンバーと活動概要を付録Aに示す。

Next: 2 音声対話コーパスの概要 Up: PASDコーパス - 重点領域模擬対話音声コーパス - Previous: PASDコーパス - 重点領域模擬対話音声コーパス -

Tatsuya Kawahara
Wed May 14 21:30:55 JST 1997