部分空間法による話者照合



目的

 話者認識とは、コンピュータにより発声者が誰であるかを自動的に判定する ものである。話者認識は、話者識別と話者照合に分類することができる。話者 識別は、入力された音声が登録話者中の誰であるかを判定する。話者照合は、 音声を入力するとともに、自分が誰であるかを申告する。  本研究には、インターネット上で行なわれる電子商取引(EC)など、音声 による利用者確認を行なえるメリットがある。


話者照合法

 話者照合では、入力音声とあらかじめ作成しておいた本人の音声モデルとの 類似度(尤度)を求め、尤度がある閾値よりも大きければ本人の音声であると 判定し、閾値より小さければ他人の音声であると判定する。  本人のモデルの構築と照合に部分空間法を用いて、話者照合を行う。



主成分分析法


話者照合システムの構成

処理結果

 話者15名(男性10名・女性5名)の部分空間をあらかじめ作成しておき、 各話者が発声した15文章を1文章づつ照合した結果、約93%の照合率が得 られた。


デモ

 発声話者の部分空間を作成し、その話者の閾値を求める。入力音声をその話 者の部分空間に射影して、閾値により本人の音声であるか否かを判定する。


Back to previous page