1. 音源数未知状況における音源分離

ここでは,4 つのマイクで (i) 2 音源を分離,(ii) 5 音源を分離した場合の結果を示します. 従来の手法のように音源数に応じたパラメータ設定をすることなく,いずれの場合も同様の設定で処理しています.
音再生は Chrome にて動作確認しています.分離音等の聴取はヘッドホンの利用をお勧めします.
  1. 2 音源の分離
    混合音
    混合音
    分離音 (女声)
    sep_female_01
    分離音 (男声)
    sep_male_02

  2. 5 音源の分離
    混合音
    混合音
    分離音 (60 deg.) 分離音 (0 deg.)
    分離音 (-90 deg.) 分離音 (-60 deg.)
    分離音 (90 deg.)

2. 残響除去と音源分離の統合

残響を含む環境では,音源分離性能が劣化します. 残響除去を行う場合は,残響は過去に観測した音が現在の観測に伝播したものとしてモデル化し,除去しています. ここでも,4 つのマイクで (i) 2 音源,(ii) 5 音源のそれぞれの場合について, 残響除去なし/ありの結果を示します.
  1. 2 音源の分離
    • 残響除去なし: 音の響きや,他音源の反射音が混入する.
      混合音
      混合音
      分離音 (女声)
      sep_female_01
      分離音 (男声)
      sep_male_02
    • 残響除去あり: 反射音の抑圧が確認できる.
      混合音 (上記「残響除去なし」と同じ)
      混合音
      残響除去+分離音 (女声)
      derev_sep_female_01
      残響除去+分離音 (男声)
      derev_sep_male_02
  2. 5 音源の分離
    • 残響除去なし
      混合音
      混合音
      分離音 (60 deg.) 分離音 (0 deg.)
      分離音 (-90 deg.) 分離音 (-60 deg.)
      分離音 (90 deg.)
    • 残響除去あり
      混合音 (上記「残響除去なし」と同じ)
      混合音
      残響除去+分離音 (60 deg.) 残響除去+分離音 (0 deg.)
      残響除去+分離音 (-90 deg.) 残響除去+分離音 (-60 deg.)
      残響除去+分離音 (90 deg.)

3. 移動音源の分離

ここでの移動音源の分離は,この手法が (相対的に) 動いている音源を自動的に時分割しながら分離・定位する性質を利用します. 音源の移動範囲がマイクロホンアレイから見て排他的な範囲を動く場合は,時分割された分離音を対応する音源同士つなぎ合わすことで 各音源の分離が出来ます.
移動音源分離概要
移動音源分離の概要: 青と赤の音は排他的範囲を動き,分離・定位結果を結合することで元の音源を復元する.
移動ロボットによる分離例
例: ロボットは 2 つのスピーカーの間を直進.左側からは音楽,右側からは音声などを再生.

右図の移動ロボットによる分離例を示します.
観測音 (3-8 sec 移動中)
混合音
左側: 音楽
left_music
右側: 虫・カエルの鳴き声
right_frog

関連する発表文献

  1. Takuma Otsuka, Katsuhiko Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: "Bayesian Nonparametrics for Microphone Array Processing," IEEE Transactions on Audio, Speech and Language Processing, Vol. 22, No. 2, pp. 493-504, 2014. 10.1109/TASLP.2013.2294582
  2. Takuma Otsuka, Katsuhiko Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: "Unified Auditory Functions based on Bayesian Topic Model," Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.2370-2376, 2012.
  3. Takuma Otsuka, Katsuhiko Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: "Bayesian Unification of Sound Source Localization and Separation with Permutation Resolution," Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence (AAAI-12), pp.2038-2045, 2012.
  4. 大塚 琢馬, 石黒 勝彦, 澤田 宏, 奥乃 博:"マイクロホンアレイを用いた音源定位・分離の統一的ノンパラメトリックベイズモデル," 第27回信号処理シンポジウム, 2012.
  5. 大塚 琢馬, 石黒 勝彦, 澤田 宏, 奥乃 博: "移動ロボットによる音環境理解に向けて," 日本ロボット学会第30回学術講演会, 3D2-5, 2012.