アナウンサーの発話区間切り出しによる記事抽出



目的

 ビデオ・オン・デマンドを目指したニュースデータベースの構築では、ニュ ースを記事毎に切り出しておく必要がある。ニュース記事を切り出すには、ア ナウンサーの発話区間の抽出が有効であると考えられる。  本研究では、自動的に話者毎の発話区間を切り出すことを目的とし、話者照 合に基づいた話者区間の切り出し法を提案する。


方法

 入力音声から抽出した音声区間の話者を学習し閾値を設定する。以後、抽出 した音声区間の話者と既に学習した話者を照合する。話者の学習と照合には、 主成分分析法に基づく部分空間法を用いている。  照合の結果、既に学習した話者であれば、以前発話した音声区間と合わせて 再学習を行なう。新しい話者であれば、その音声区間を学習し閾値を設定する。 これを繰り返すことにより、話者の発話区間を切り出す。



主成分分析法


話者区間の切り出し法


処理結果

 NHKの5分間のニュース30日分を用いて、アナウンサーの発話区間を切 り出す実験を行なった結果、アナウンサー切り出し率93.4%、アナウンサー 適合率98.7%、記事切り出し率61.7%が得られた。


Back to previous page