About Me
- History (my CV is here)
- Born at Nishinomiya, Hyogo in November 1980
- 2003–2005: Master student, Audio Media Processing Group (Okuno Lab), Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University
- 2005–2008: Ph.D. student, ditto.
- 2005–2008: JSPS Research Fellowship for Young Scientists (DC1)
- 2008–2013: Research Scientist, Media Interaction Research Group (Goto Group), Information Technology Research Institute (ITRI), National Institute of Advanced Industrial Science and Technology (AIST)
- 2013–2014: Senior Researcher, ditto.
- 2014–2018: Senior Lecturer, Graduate School of Informatics, Kyoto University
- 2018–present: Associate Professor, Graduate School of Informatics, Kyoto University
- 2017–present: Team Leader (concurrent post), Sound Scene Understanding Team, Center for Advanced Intelligence Project (AIP), RIKEN
- Ph.D. (Informatics) from Kyoto University, March 2008
- A member of IPSJ, IEICE, IEEE, and ISMIR
- Research interests
- Music information processing (statistical analysis and generation of music signals and scores)
- Audio signal processing (source separation, source localization, and speech enhancement)
- Statistical machine learning (nonparametric, hierarchical, and deep Bayesian models)
- Hobbies
- Swimming
- Hiking
- Cycling: Strava
Resources
- Publications
- External sites
- Lectures
本研究室に興味をお持ちの学生や研究員の方へ
音楽情報処理・音響信号処理チームでは、音楽や音声を題材とした世界最先端の研究に一緒に取り組んでくれるB4や研究員の方を募集しています。私たちは、解析対象の性質をよく観察した上で、事前知識を取り込みつつ、できる限り物理的に妥当な確率的生成モデルを定式化するという普遍的なアプローチを取ります。具体的には、確率的な枠組みのもとで、様々な確率モデル(混合モデル・因子モデル・深層生成モデルなど)を組み合わせた統一的な生成モデルを構成し、様々な最適化技法(変分ベイズ法・マルコフ連鎖モンテカルロ法・各種勾配降下法など)を駆使して、潜在変数およびパラメータを一挙に推定します。このようなエレガントな数理アプローチに基づく情報学的な見地から人間の知能の本質に迫ります。
私たちは「音声メディア」研究室ではありますが、これら一連の研究活動を通して、音に限らず、現実の様々な問題に対する普遍的な考え方を身に着けることができます。実際、卒業生も音以外の様々な分野の一線で活躍しています。技術的には、自然言語処理・画像処理・機械学習など他分野の最新技法も積極的に活用しています。最新の深層学習技術をブラックボックス的に適用するような研究は行いません。以下のような人を歓迎します。
- 統計的機械学習・音響信号処理・自然言語処理・ベイズ学習・深層学習などを習得したい人
- 将来的に上記技術を駆使しながら、研究・開発の仕事がしたいと考えている人
- 単に技術に関する知識を深めるだけではなく、何らかの事象をモデル化する際の普遍的かつ実践的なセンスを身に着けたい人
- 高度な文章執筆能力やプレゼンテーションスキルを身に着けたい人(受賞者多数)
本研究室の学生は、音響信号処理はもちろんですが、統計的機械学習の知識・実装能力、プレゼンテーションスキルにおいても専攻内・コース内でも随一だと自負しています。研究室見学や教員や学生との相談・雑談は常随時可能ですのでお気軽にどうぞ。
Demonstrations
I'm one of the Songle Developer Team (Director: Masataka Goto).
The active music listening Web service "Songle" is open to the public!
Research Topics
- Nonparametric Bayesian modeling
- Music recommendation
- Drum sound recognition
- Active music listening
- Music visualization and annotation
- Music robots