6.4.2 FeatureRemover

6.4.2.1 ノードの概要

本ノードは,入力ベクトル中から指定した次元要素を削除し, ベクトルの次元を減らしたベクトルを出力する.

6.4.2.2 必要なファイル

無し.

6.4.2.3 使用方法

どんなときに使うのか

音響特徴量やミッシングフィーチャーマスクベクトルなどの ベクトル型の要素の中から不要な要素を削除し,次元数を減らすときに使う.

通常,特徴量の抽出処理は,静的特徴に続いて,動的特徴量を抽出する. その際に,静的特徴が不要となる場合がある.不要な特徴量を削除するには, 本ノードを使用する.特に対数パワー項を削除することが多い.

典型的な接続例

MSLSExtraction や MFCCExtraction で対数パワー項を計算し,その後, Delta を用いると,デルタ対数パワー項を計算できる. 対数パワー項を計算しなければデルタ対数パワーを計算できないため,一度 対数パワー項を含めて音響特徴量を計算してから,対数パワー項を除去する. 本ノードは,通常 Delta の後段に接続し,対数パワー項を削除 するために用いる.

\includegraphics[width=120mm]{fig/modules/FeatureRemover}
Figure 6.59: FeatureRemover の典型的な接続例

6.4.2.4 ノードの入出力とプロパティ

Table 6.55: FeatureRemover パラメータ表

パラメータ名

デフォルト値

単位

説明

SELECTOR

Object 

<Vector<int> >

 

次元インデックスからなるベクトル

       

(複数指定可)

入力

INPUT

: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.

出力

OUTPUT

: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.

パラメータ

SELECTOR

: Vector<int> 型.値域は,0 以上入力特徴量の次数未満.いくつ指定してもよい.1次元目と3次元目の要素を削除し,入力ベクトルを 2次元減らす場合は, <Vector<int> 0 2> とする. 次元指定のインデクスが 0 から始まっていることに注意.

6.4.2.5 ノードの詳細

本ノードは,入力ベクトル中から不要な次元要素を削除し, ベクトルの次元を減らす.

音声信号を分析すると,分析フレームの対数パワーは,発話区間で大きい傾向がある. 特に有声部分で大きい.従って,音声認識において対数パワー項を音響特徴量に取り 入れることで認識精度の向上が見込める.しかしながら,対数パワー項を直接特徴量 として用いると,収音レベルの違いが音響特徴に直接反映される.音響モデルの作成 に用いた対数パワーレベルと収音レベルに差が生じると音声認識精度が低下する. 機器の設定を固定しても,発話者が常に同一レベルで発話するとは限らない. そこで,対数パワー項の動的特徴量であるデルタ対数パワーを用いる.これにより, 収音レベルの違いに頑健で,かつ発話区間や有声部分を表す特徴を捉えることが可能 となる.