音声メディア研究室 発表論文

[ 2015年度| 2014年度| 2013年度| 2012年度| 2011年度| 2010年度| 2009年度| 2008年度| 2007年度| 2006年度| 2005年度| 2004年度| 2003年度| 2002年度| 2001年度| (2000年度以前)| 受賞| English ]


DBLP: 吉井, 糸山, 坂東, 井山, 丸尾, 土橋, 大喜多, 関口, 板倉, 福田,
Youssef, 西出, , 前澤, 古川, 池宮, 西牟田, 奥乃, 杉山, 大塚, Lim, 神田, 平山, 望月, 山口, 矢澤, , Cahier, 田崎, 水本, 中村, 糸原, 阪上, 柳楽, 信田, 尾形, 高橋, 平澤, 西川, 山川, 武田, 日下, 安良岡, 松山, 粟野, 駒谷, 吉岡, 藤原, 勝丸, 白松, 安部, 池田, 神田, 久保田, 福林, 須見, , 山本, 横矢, 内藤, 北原, 丹羽, 吉田, 松本, Valin, 秋葉, 大庭, 石原, 小鷹, 渡辺, 戸田, 河原 , Lane, 秋田, 山肩, Raux, 伊藤,
Google Scnholar, Microsoft Academic Search, odysa, Most Prolific DBLP Authors

o 2015年度(音声メディア研究室) o 2014年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    ジャーナル論文

  1. Shotaro Sano, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: HMM-based Attacks on Google's ReCAPTCHA with Continuous Visual and Audio Symbols, Journal of Information Processing, accepted, 12 Aug. 2016.
  2. Izaya Nishimuta, Kazuyoshi Yoshii, Katsutoshi Itoyama, Hiroshi G. Okuno: Toward a Quizmaster Robot for Speech-based Multiparty Interaction. Advanced Robotics, accepted, Jul. 23, 2015.
  3. 古川 孝太郎, 糸山 克寿, 吉井 和佳, 奥乃 博: Scheme による3D図形の構成的制作, コンピュータソフトウエア, 採録決定, 平成26年3月,日本ソフトウエア科学会. 岩波書店.
  4. Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata: Preferential Training of Neuro-Dynamical Model Based on Predictability of Target Dynamics, Advanced Robotics, Vol.29, No.9 (2015) 587-596, 27. May 2015. Taylor & Francis, doi: 10.1080/01691864.2015.1031279
  5. Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Fabien Gouyon, Luis Paulo Reis: Beat Tracking for Interactive Dancing Robots, International Journal of Humanoid Robotics, in print, Vol.12 (2015) 1550023 (24 pages), World Scientific Publishing Company. Online ready, 22 May 2015, doi 10.1142/S0219843615500231
  6. Akira Maezawa, Hiroshi G. Okuno: Bayesian Audio-to-Score Alignment Based on Joint Inference of Timbre, Volume, Tempo, and Performer-Dependent Note Onset Timings. Computer Music Journal, Vol.39, No.1 (Spring 2015) 74-87, accepted on Jan. 23, 2014, posted online March 24, 2015. MIT Press. IF: 0.410 doi:10.1162/COMJ_A_00286
  7. 国際会議論文

  8. Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno Human-Voice Enhancement based on Online RPCA for a Hose-shaped Rescue Robot with a Microphone Array Proceedings of the 13th International Symposium on Safety, Security, and Rescue Robotics (SSRR-2015) , pp.1-6, IEEE-RAS, West Lafayette, Indiana, U.S., Oct. 18-20, 2015 Most Innovative Paper Award, People's Choice Demo Award
  9. Kazuyoshi Yoshii, Katsutoshi Itoyama, Masataka Goto: Infinite Superimposed Discrete All-pole Modeling for Source-Filter Decomposition of Wavelet Spectrograms, Proceedings of the 16th International Society for Music Information Retrieval Conference (ISMIR-2015), accepted, October 2015.
  10. Karim Youssef, Katsutoshi Itoyama, Kazuyoshi Yoshii: Identification and Localization of One or Two Concurrent Speakers in a Binaural Robotic Context, Proceedigns of IEEE International Conference on Systems, Man, and Cybernetics (SMC-2015), accepted, October 2015.
  11. Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno: Microphone-Accelerometer Based 3D Posture Estimation for a Hose-shaped Rescue Robot, Proceedings of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2015), accepted, (acceptance rate 46%), Sep. 28- Oct. 3, 2015, Hamburg.
  12. Misato Ohkita, Yoshiaki Bando, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Audio-Visual Beat Tracking Based on a State-Space Model for a Dancing Robot Playing with Humans, Proceedings of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2015), accepted, (acceptance rate 46%), Sep. 28- Oct. 3, 2015, Hamburg.
  13. Kouhei Sekiguchi, Yoshiaki Bando, Katsutoshi Itoyama, Kazuyoshi Yoshii: Optimizing the Layout of Multiple Mobile Robots for Cooperative Sound Source Separation, Proceedings of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2015), accepted, (acceptance rate 46%), Sep. 28- Oct. 3, 2015, Hamburg.
  14. Kousuke Itakura Izaya Nishimuta, Yoshiaki Bando, Katsutoshi Itoyama, Kazuyoshi Yoshii: Bayesian Integration of Sound Source Separation and Speech Recognition:A New Approach to Simultaneous Speech Recognition, Proceedings of the 16th Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), accepted, Dresden, Germany, Sep. 6-10, 2015.
  15. Akira Maezawa, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno: Unified Inter- and intra-recording duration model for multiple music audio alignment, Proceedings of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, (WASPAA 2014), accepted, (acceptance rate 73/151=48%), Mohonk Mountain House, New Paltz, NY, Oct 18-21, 2015.
  16. Tatsunori Hirai, Yukara Ikemiya, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: Automatic Singing Voice to Music Video Generation via Mashup of Singing Video Clips, Proceedings of the 12th Sound and Music Computing Conference (SMC 2015), pp.153-159, Maynooth, Ireland, July 26 - Aug 1, 2015.
  17. Ayaka Dobashi, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: A Music Performance Assistance System based on Vocal, Harmonic, and Percussive Source Separation and Content Visualization for Music Audio Signals, Proceedings of the 12th Sound and Music Computing Conference (SMC 2015), pp.99-104, Maynooth, Ireland, July 26 - Aug 1, 2015.
  18. Tsubasa Fukuda, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: A Score-Informed Piano Tutoring System with Mistake Detection and Score Simplification, Proceedings of the 12th Sound and Music Computing Conference (SMC 2015), pp.105-110, Maynooth, Ireland, July 26 - Aug 1, 2015.
  19. Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Singing Voice Analysis and Editing based on Mutually Dependent F0 Estimation and Source Separation, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), (acceptance rate 52%), pp.574-578, AASP-P8.2, Brisbane, Australia, April 19-24 (23), 2015.
  20. Satoshi Maruo, Kazuyoshi Yoshii, Katsutoshi Itoyama, Matthias Mauch, Masata Goto: A FEEDBACK FRAMEWORK FOR IMPROVED CHORD RECOGNITION BASED ON NMF-BASED APPROXIMATE NOTE TRANSCRIPTION. Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp.196-200, AASP-P1.4, Brisbane, Australia, April 19-24 (21), 2015.
  21. Yoshiaki Bando, Takuma Otsuka, Katsutoshi Itoyama, Kazuyoshi Yoshii, Yoko Sasaki, Satoshi Kagami, Hiroshi G. Okuno: CHALLENGES IN DEPLOYING A MICROPHONE ARRAY TO LOCALIZE AND SEPARATE SOUND SOURCES IN REAL AUDITORY SCENES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp.723-727, AASP-P10.11, Brisbane, Australia, April 19-24 (24), 2015.
  22. Hiroshi G. Okuno, Kazuhiro Nakadai: ROBOT AUDITION: ITS RISE AND PERSPECTIVES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp.5610-5614, SS-L3.1, Brisbane, Australia, April 19-24 (22), 2015.
  23. 口頭発表(研究会・全国大会)

  24. 関口 航平, 坂東 宜昭, 糸山 克寿, 吉井 和佳, 複数移動ロボットを用いた音源分離における音源配置に応じたロボットの最適配置探索 日本ロボット学会第33回学術講演会, RSJ2015AC3D1-05, 東京電機大学, Sep. 3-5, 2015
  25. 坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博, ロバスト主成分分析を用いた動作雑音抑圧に基づく柔軟索状ロボットのための音声強調 日本ロボット学会第33回学術講演会, RSJ2015AC2D2-05, 東京電機大学, Sep. 3-5, 2015
  26. 糸山 克寿, 坂東 宜昭, 粟野 皓光, 合原 一究, 吉井 和佳: , 視聴覚統合NMFによるカエル合唱音声の分析, 情報処理学会 第107回音楽情報科学研究会, May. 23, 2015, ベストプレゼンテーション賞
  27. 坂東 宜昭, 金 宜鉉, 糸山 克寿, 吉井 和佳, 中臺 一博, 奥乃 博, 両耳聴ロボット聴覚ソフトウェアHARK-Binauralの紹介とRaspberry Pi 2を用いたヒューマノイドロボットへの適用 情報処理学会 第107回音楽情報科学研究会, 電気通信大学, May. 23 2015

2015年度 o 2014年度(音声メディア研究室)o 2013年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. Akira Maezawa: Bayesian Music Alignment. 博士論文 (主査: 河原達也教授), Feb. 2015.

  2. Yukara Ikemiya: Singing Voice Analysis and Editing for Recorded Music. 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
  3. Yoshiaki Bando: Sound-based Posture Estimation for a Hose-shaped Rescue Robot. 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
  4. Izaya Nishimuta: A Quizmaster Robot with Auditory Functions for Speech-based Multiparty 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
  5. 古川 孝太郎: Scheme による 3D 図形の構成的制作. 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.

  6. 板倉 光佑: ベイズモデルに基づく音源分離の不確実性を考慮した同時発話音声認識 卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
  7. 大喜多 美里: ダンス共演ロボットのための状態空間モデルに基づく視聴覚統合ビートトラッキング 卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
  8. 関口 航平: 分散型マイクロホンアレイを用いた音源分離のための複数移動ロボットの配置最適化 卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
  9. 福田 翼: 弾き間違い検出と楽譜簡略化機能をもつピアノ演奏練習システム 卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.

    ジャーナル論文

  10. Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata: Preferential Training of Neuro-Dynamical Model Based on Predictability of Target Dynamics, Advanced Robotics, accepted, March. 2015.
  11. 古川 孝太郎, 糸山 克寿, 吉井 和佳, 奥乃 博: Scheme による3D図形の構成的制作, コンピュータソフトウエア, 採録決定, 平成26年3月,日本ソフトウエア科学会. 岩波書店.
  12. Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shunsuke Mori, Hiroshi G. Okuno: Automatic Speech Recognition for Mixed Dialect Utterances by Mixing Dialect Language Models, IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.23, No.2 (Feb. 2015) 373-382. IF: 2.625 doi:10.1109/TASLP.2014.2387414
  13. Akira Maezawa, Hiroshi G. Okuno: Bayesian Audio-to-Score Alignment Based on Joint Inference of Timbre, Volume, Tempo, and Performer-Dependent Note Onset Timings. Computer Music Journal, Vol.39, No.1 (Spring 2015) 74-87, accepted on Jan. 23, 2014, posted online March 24, 2015. MIT Press. IF: 0.410 doi:10.1162/COMJ_A_00286
  14. Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata: Audio-Visual Speech Recognition using Deep Learning. Applied Intelligence, Vol.42, Issue 1 (Jan. 2015) 63-74, Springer. doi:10.1007/s10489-014-0629-7
  15. Yoshiaki Bando, Takuma Otsuka, Kazuhiro Nakadai, Satoshi Tadokoro, Masashi Konyo, Katsutoshi Itoyama, HIroshi G. Okuno: Posture Estimation of Hose-shaped Robot by using Active Microphoe Array, Advanced Robotics, Vol.29, Issue 1 (Jan. 2015) 35-49. IF: 0.562 doi: 10.1080/01691864.2014.981291 Taylor Francis
  16. Ui-Hyun Kim, Kazuhiro Nakadai, Hiroshi G. Okuno: Improved Sound Source Localization in Horizontal Plane for Binaural Robot Audition, Applied Intelligence, Vol.42, Issue 1 (Jan. 2015) pp.63-74. doi:10.1007/s10489-014-0544-y IF: 1.853
  17. Takuma Otsuka, Katsutoshi Ishiguro, Takuya Yoshioka, Hiroshi Sawada, Hiroshi G. Okuno: Multichannel Sound Source Dereverberation and Separation for Arbitrary Number of Sources based on Bayesian Nonparametrics IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.22, No.12 (Dec. 2014) 2218-2232. IF: 2.625 doi:10.1109/TASLP.2014.2363790
  18. Akira Maezawa, Katsutoshi Itoyama, Hiroshi G. Okuno: Nonparametric Bayesian dereverberation ofpower spectrograms based on infinite-orderautoregressive processes and interpretation, IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.22, No.12 (Dec. 2014) 1918-1930. doi:10.1109/TASLP.2014.2355772 IF: 2.625
  19. Matthew E.P. Davies, Philippe Hamel, Kazuyoshi Yoshii, Masataka Goto: AutoMashUpper: Automatic Creation of Multi-Song Music Mashups, IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.22, No.12 (Dec. 2014) 1726-1737, doi:10.1109/TASLP.2014.2347135 IF: 2.625
  20. Angelica Lim, Hiroshi G. Okuno: A Recipe for Empathy: Integrating the mirror system, insula, somatosensory cortex and motherese. International Journal of Social Robotics, Vol.7, Issue 1 (Feb. 2015) 35-49. Springer. doi:10.1007/s12369-014-0262-y
  21. 平山 直樹, 吉野 幸一郎, 糸山 克寿, 森 信介, 奥乃 博: 擬似生成した複数方言言語モデル混合による混合方言音声認識, 情報処理学会論文誌, Vol.55, No.7 (July 2014) pp.1681-1694, 情報処理学会. pdf, DL
  22. Angelica Lim, Hiroshi G. Okuno: The MEI Robot: Towards Using Motherese to Develop Multimodal Emotional Intelligence. IEEE Transactions on Autonomous Mental Development, Vol.6, Issue 2 (June 2014) pp.126-138, doi:10.1109/TAMD.2014.2317513 IF: 2.170

    章分担・解説

  23. 奥乃 博: 第2章 総論 聴覚デバイスの要求・制約事項. 『感覚デバイス開発-- 機器が担うヒト感覚の生成・拡張・代替技術』, pp.85-101, NPS,2014年11月刊.
  24. 奥乃 博, 中臺 一博: 第2章第1節 混合音を聞きわける技術の開発. 『感覚デバイス開発-- 機器が担うヒト感覚の生成・拡張・代替技術』, pp.102-113, NPS,2014年11月刊.
  25. 奥乃 博: サイロからの脱出 京都大学工学広報, No.62,2014年10月.
  26. 奥乃 博: 夏を迎えての雑感 「情報学展望」, No.16, p.3,京都大学大学院情報学研究科 ,2014年5月.
  27. Angelica Lim, Hiroshi G. Okuno: Developing Robot Emotions through Interaction with Caregives. Jordi Vallverdú (Ed.) Synthesizing Human Emotion in Intelligent Systems and Robotics, in print, Hershey, PA, IGI Global, 2014.
  28. Yukara Ikemiya, Katsutoshi Itoyama, Hiroshi G. Okuno: Transferring Vocal Expression of F0 Contour using Singing Voice Synthesizer, Moonis Ali, et al (Eds.): Modern Advances in Applied Intelligence - the 27th International Conference on Industrial, Engineering and Other Applications of Applied Intelligence Systems, IEA/AIE-2014, Proceedings, Part II, Lecture Notes in Computer Science, Vol.8482, pp. 250-259. June 3-6, 2014, Kaohsiung, Taiwan. doi:10.1007/978-3-319-07467-2_27
  29. 奥乃 博: 研究の水平展開, コンピュータソフトウエア, 巻頭言, Vol.31, No.2 (2014年5月)pp.1, 岩波 書店.

    国際会議論文

  30. Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Singing Voice Analysis and Editing based on Mutually Dependent F0 Estimation and Source Separation, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
  31. Satoshi Maruo, Kazuyoshi Yoshii, Katsutoshi Itoyama, Matthias Mauch, Masata Goto: Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
  32. Yoshiaki Bando, Takuma Otsuka, Katsutoshi Itoyama, Kazuyoshi Yoshii, Yoko Sasaki, Satoshi Kagami, Hiroshi G. Okuno: CHALLENGES IN DEPLOYING A MICROPHONE ARRAY TO LOCALIZE AND SEPARATE SOUND SOURCES IN REAL AUDITORY SCENES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
  33. Hiroshi G. Okuno, Kazuhiro Nakadai: ROBOT AUDITION: ITS RISE AND PERSPECTIVES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
  34. Yoshiaki Bando, Takuma Otsuka, Ikkyu Aihara, Hiromitsu Awano, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno: Recognition of In-field Frog CHorusing using Bayesian Nonparametric Microphone Array Processing. AAAI-2015 Workshop on Comutational Sustainability, accepted, Jan. 26, 2015, AAAI, Austin, TX.
  35. Izaya Nishimuta, Kazuyoshi Yoshii, Katsutoshi Itoyama, Hiroshi G. Okuno: Development of a Robot Quizmaster with Auditory Functions for Speech-based Multiparty Interaction. Proceedings of 2014 IEEE/SICE International Symposium on System Integration (SII 2014), 328-333, Dec.12-13, Chuo Univ., Tokyo, Japan. pdf
  36. Izaya Nishimuta, Naoki Hirayama, Kazuyoshi Yoshii, Katsutoshi Itoyama, Hiroshi G. Okuno: A Robot Quizmaster that can Localize, Separate, and Recognize Simultaneous Utterances for a Fastest-Voice-First Quiz Game, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2014), accepted (acceptance rate 59% = 171/288), IEEE, Madrid, Nov.18 - 20, 2014.
  37. Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata: Applying Intrinsic motivation for Visuomotor Learning of Robot Arm Motion, Proceedings of the 11th International Conference on Ubiquitous Robots and Ambient Intelligence (URAI2014), accepted, Kuala Lumpur, Malaysia, Nov. 12-15, 2014.
  38. Yoshiaki Bando, Katsutoshi Itoyama, Satoshi Tadokoro, Masashi Konyo, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno: A Sound-based Online Method for Estimating the Time-Varying Posture of a Hose-shaped Robot, Proceedings of the 12th International Symposium on Safety, Security, and Rescue Robotics (SSRR-2014), 1-6, Oct. 28, 2014. Oct. 27-30, 2014, IEEE-RAS, Toya, Japan. Best student paper award doi:10.1109/SSRR.2014.7017665
  39. Akira Maruyama, Motoko S. Fujita, Katsutoshi Itoyama, Hiroshi G. Okuno, Mamoru Kanzaki: Development of automatic bird-species recognition system from birdsongs in tropical forests, Proceedings of the 26th International Ornithological Congress (IOC2014), p14-003, 18-24, August 2014, Tokyo.
  40. Akira Maezawa, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno: BAYESIAN AUDIO ALIGNMENT BASED ON A UNIFIED GENERATIVE MODEL OF MUSIC COMOSITION AND PERFORMANCE, Proceedings of 2014 International Symposium on Music Information Retrieval (ISMIR 2014), accepted, Taipei, Taiwan, Oct 27-31, 2014.
  41. Shoto Sasaki, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: LYRICSRADAR: A LYRICS RETRIEVAL SYSTEM BASED ON LATENT TOPICS OF LYRICS, Proceedings of 2014 International Symposium on Music Information Retrieval (ISMIR 2014), accepted, Taipei, Taiwan, Oct 27-31, 2014.
  42. Taro Masuda, Kazuyoshi Yoshii, Masataka Goto, Shigeo Morishima: SPOTTING A QUERY PHRASE FROM POLYPHONIC MUSIC AUDIO SIGNALS BASED ON SEMI-SUPERVISED NONNEGATIVE MATRIX FACTORIZATION, Proceedings of 2014 International Symposium on Music Information Retrieval (ISMIR 2014), accepted, Taipei, Taiwan, Oct 27-31, 2014.
  43. Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Transferring Vocal Expressions of a Professional Singer to Unaccompanied Singing Signals, The 15th International Society for Music Information Retrieval (ISMIR 2014), Late-Breaking / Demo (LBD), Accepted, Taipei, Taiwan, Oct 27-31, 2014.
  44. Katsutoshi Itoyama, Hiroshi G. Okuno: Parameter Estimation of Virtual Musical Instrumental Synthesizers, Proceedings of 2014 Joint Conference on 11th Sound and Music Computing Conference (ICMC) and 40th International Computer Music Conference (SMC) (ICMC|SMC 2014), accepted for poster presentation, Jun. 13 ((120+153)/383), Sep. 14-20, 2014, Athens, Greece.
  45. Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata: Lipreading using Convolutional Neural Network, Proceedings of 2014 International Conference on Spoken Language Processing (Interspeech 2014), accepted (acceptance rate is 52%), 10 June 2014, Singapore, 14-18 Sep. 2014.
  46. Osamu Sugiyama, Katsutoshi Itoyama, Kazuhiro Nakadai, Hiroshi G. Okuno, Sound Annotation Tool for Multidirectional Sounds based on spatial information extracted by HARK robot audition software, Proceeding of IEEE International Conference on Systems, Man, and Cybernetics (SMC 2014), 2335-2340, San Diego, 5-8 Oct. 2014. doi:10.1109/SMC.2014.6974275
  47. Takahiro Iyama, Osamu Sugiyama, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: Visualization of auditory awareness based on sound source positions estimated by depth sensor and microphone array, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2014), pp.1908-1913 (acceptance rate 47%), IEEE, RSJ, Chicago, 14-18 Sep. 2014. pdf doi 10.1109/IROS.2014.6942814
  48. Joao Lobato Oliveira, Keisuke Nakamura, Thibault Langlois, Fabien Gouyon, Kazuhiro Nakadai, Angelica Lim, Luis Paulo Reis, Hiroshi G. Okuno, Making a Robot Dance to Diverse Musical Genre in Noisy Environments, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2014), pp.1896-1901 (acceptance rate 47%), IEEE, RSJ, Chicago, 14-18 Sep. 2014. pdf doi 10.1109/IROS.2014.6942812
  49. Shun Nishide, Keita Mochizuki, Hiroshi G. Okuno, Tetsuya Ogata: Insertion of Pause in Drawing from Babbling for Robot's Developmental Imitation Learning. Proceedings of 2014 IEEE International Conference on Robots and Automation (ICRA 2014), pp.4785-4791, (acceptance rate 48%), Hong Kong, China, May 31- June 7, 2014. pdf doi: 10.1109/ICRA2014.6907559
  50. Akira Maezawa, Hiroshi G. Okuno: Audio Part Mixture Alignment Based on Hierarchical Nonparametric Bayesian Model of Musical Audio Sequence Collection, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.5249-5253, (acceptance rate = 1745/3492, 50.0%), AASP-P7.11 Florence, Italy, May 4-9, 2014. pdf doi: 10.1109/ICASSP.2014.6854597
  51. Kazuki Yazawa, Katsutoshi Itoyama, Hiroshi G. Okuno: Automatic Transcription of Guitar Tablature from Audio Signals in Accordance with Player's Proficiency, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.3146-3150, (acceptance rate = 1745/3492, 50.0%), AASP-L3, Florence, Italy, May 4-9, 2014. pdf doi: 10.1109/ICASSP.2014.6854175
  52. Yukara Ikemiya, Katsutoshi Itoyama, Hiroshi G. Okuno: Transcribing Vocal Expression from Polyphonic Music, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.3151-3155, (acceptance rate = 1745/3492, 50.0%), AASP-L3, Florence, Italy, May 4-9, 2014. pdf doi: 10.1109/ICASSP.2014.6854176
  53. Kazuyoshi Yoshii, Hiromasa Fujihara, Tomoyuki Nakano, Masataka Goto: Cultivating Vocal Activity Detection for Music Audio Signals in a Circulation-type Crowdsourcing Ecosystem, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.624-628, (acceptance rate = 1745/3492, 50.0%), AASP-P1.5 Florence, Italy, May 4-9, 2014. pdf
  54. Tomoyuki Nakano, Kazuyoshi Yoshii, Masataka Goto: Vocal Timbre Analysis Using Latent Dirichlet Allocation and Cross-Gender Vocal Timbre Similarity, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.5239-5244, (acceptance rate = 1745/3492, 50.0%), AASP-P7.9 Florence, Italy, May 4-9, 2014. pdf
  55. Tomohiko Nakamura, Hirokazu Kameoka, Kazuyoshi Yoshii, Masataka Goto: Timbre Replacement of Harmonic and Drum Components for Music Audio Signals, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.7520-7524, (acceptance rate = 1745/3492, 50.0%), AASP-P10.7 Florence, Italy, May 4-9, 2014. pdf

    口頭発表(研究会・全国大会)

  56. 井山 貴裕, 杉山 治, 坂東 宣昭, 糸山 克寿, 吉井 和佳, 奥乃 博: 聴覚アウェアネスの可視化のための深度センサとマイクロフォンアレイを用いた物体認識と音イベント検出 情報処理学会第77回全国大会, 2ZB-07, Mar. 2015. 京都大学.
  57. 古川 孝太郎, 糸山 克寿, 吉井 和佳, 奥乃 博: プログラミング基礎教育のための図形言語の3D拡張. 情報処理学会第77回全国大会, 3ZF-05, Mar. 2015. 京都大学.
  58. 土橋 彩香, 池宮 由楽, 糸山 克寿, 吉井 和佳: 1歌声・伴奏音・打楽器音分離に基づく音楽演奏支援システム. 情報処理学会第77回全国大会, 4S-01, Mar. 2015. 京都大学. 学生奨励賞
  59. 福田 翼, 池宮 由楽, 糸山 克寿, 吉井 和佳: ユーザの技術に合わせた自動編曲機能をもつピアノ演奏練習システム. 情報処理学会第77回全国大会, 4S-02, Mar. 2015. 京都大学.
  60. 関口 航平, 坂東 宣昭, 糸山 克寿, 吉井 和佳: 分散型マイクロホンアレイを用いた音源分離のための複数移動ロボットの配置最適化. 情報処理学会第77回全国大会, 4T-07, Mar. 2015. 京都大学. 学生奨励賞
  61. 板倉 光佑, 西牟田 勇哉, 坂東 宜昭, 糸山 克寿, 吉井 和佳: 2混合音に対する音源分離の不確実性を考慮した同時発話音声認識, 情報処理学会第77回全国大会, 5P-0, Mar. 2015. 京都大学. 学生奨励賞
  62. 赤堀 渉,増田 太郎, 奥乃 博, 森島 繁生: 雑音下での音源定位・音源分離に与える伝達関数測定法の影響の評価. 情報処理学会第77回全国大会, 5P-03, Mar. 2015. 京都大学.
  63. 池宮 由楽, 糸山 克寿, 吉井 和佳: 音楽音響信号に対する相補的な歌声分離と音高推定. 情報処理学会第77回全国大会, 5S-01, Mar. 2015. 京都大学. 学生奨励賞
  64. 丸尾 智志, 吉井 和佳, 糸山 克寿, Matthias Mauch,後藤真孝: コード制約付きNMFを用いた音高推定に基づくコード認識, 情報処理学会第77回全国大会, 5S-03, Mar. 2015. 京都大学.
  65. 大喜多美里, 坂東 宣昭, 池宮 由楽, 糸山 克寿, 吉井 和佳: ダンス共演ロボットのためのマルチモーダルビートトラッキング 情報処理学会第77回全国大会, 5S-05, Mar. 2015. 京都大学. 学生奨励賞
  66. 坂東 宣昭, 池宮 由楽, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博: 柔軟索状レスキューロボットのためのロバスト主成分分析を用いた走行雑音抑圧, 情報処理学会第77回全国大会, 5T-04, Mar. 2015. 京都大学. 学生奨励賞
  67. 西牟田 勇哉, 糸山 克寿, 吉井 和佳, 奥乃 博: 早言いクイズ司会者ロボットの開発と評価 情報処理学会第77回全国大会, 5T-06, Mar. 2015. 京都大学.
  68. 池宮 由楽, 糸山 克寿, 吉井 和佳: 市販楽曲中の歌声の分離と音高推定に基づく歌唱表現編集システム, インタラクション2015, 一般講演, 採録, 情報処理学会, Dec. 5, 2014. 日本科学未来館, Mar. 5 -- 7, 2015.
  69. 中臺 一博, 奥乃 博: ロボット聴覚オープンソフトウェアHARKの紹介, 第15回計測自動制御学会システムインテグレーション部会講演会, キーノート講演, 2L3-1, pp.1712-1716, Dec. 15, 2014, 東京ビッグサイト. pdf
  70. 井山 貴裕, 杉山 治, 坂東 宣昭, 糸山 克寿, 吉井 和佳, 奥乃 博: 深度センサとマイクロフォンを用いた聴覚アウェアネスの提示, 第39回 AI チャレンジ研究会, SIG-Challenge-B402-03, 20-25, 人工知能学会, 慶應義塾大学日吉 来往舎, Nov. 21. 2014. pdf
  71. 坂東 宣昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博: マイクロホンアレイとスピーカをもつ柔軟索状ロボットのための動的スピーカ選択 による姿勢推定の高速化, 第39回 AI チャレンジ研究会, SIG-Challenge-B402-08, 45-50, 人工知能学会, 慶應義塾大学日吉 来往舎, Nov. 21. 2014. pdf
  72. 古川 孝太郎, 坂東 宣昭, 糸山 克寿, 吉井 和佳, 奥乃 博: Schemeによる3D図形の構成的制作 日本ソフトウエア科学会第31回大会, 名古屋大学, Sep. 7-9, 2014.
  73. 坂東 宣昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 奥乃 博: マイクロホンアレイを用いた駆動機構付ホース型ロボットの姿勢推定, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013. pdf
  74. 西牟田 勇哉, 吉井 和佳, 西出 俊 糸山 克寿, 奥乃 博: 「早言い」合図を識別してインタラクションに活用するロボット司会者, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013. pdf
  75. 井山 貴裕, 杉山 治, 坂東 宣昭, 糸山 克寿, 吉井 和佳, 奥乃 博: 聴覚アウエアネス可視化に基づくジェスチャ操作インタフェースの開発, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013. pdf
  76. 野田 邦明, 山口 雄紀, 中臺 一博, 奥乃 博, 尾形 哲也: Deep Neural Networkを用いたマルチモーダル音声認識, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013. pdf
  77. 西出 俊 望月 敬太, 奥乃 博, 尾形 哲也: 「早言い」合図を識別してインタラクションに活用するロボット司会者, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013. pdf
  78. 中野倫靖 吉井 和佳, 後藤真孝: 確率的生成モデルに基づく音楽の類似度とありがち度の推定に関する検討, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(2), pp.1-7, 京都大学, 情報処理学会, 25 Aug. 2014.
  79. 吉井 和佳, 糸山 克寿, 後藤真孝: 多重音基本周波数解析のための無限重畳離散全極型モデル, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(9), pp.1-8, 京都大学, 情報処理学会, 25 Aug. 2014. pdf
  80. 中村 友彦, 吉井 和佳, 後藤真孝, 亀岡弘和: 音楽音響信号中の調波音の周波数特性およびドラムの音色の置換システム, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(11), pp.1-6, 京都大学, 情報処理学会, 25 Aug. 2014.
  81. 前澤 陽, 糸山 克寿, 吉井 和佳, 奥乃 博, 河原達也: 演奏間相対テンポの結合力学モデルに基づく音響信号間アライメント, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(13), pp.1-7, 京都大学, 情報処理学会, 25 Aug. 2014. pdf
  82. 池宮 由楽, 糸山 克寿, 吉井 和佳, 奥乃 博: 混合音中の歌声F0軌跡に対する歌唱表現転写システム, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(23), pp.1-6, 京都大学, 情報処理学会, 25 Aug. 2014. ベストプレゼン賞. pdf
  83. 杉山 治, 糸山 克寿, 中臺 一博, 奥乃 博: HARKを用いた多方向音声のアノテーションツールの開発, クラウドネットワークロボット研究会(CNR), 電子情報通信学会, 慶應義塾大学, June 16, 2014
  84. 前澤 陽, 糸山 克寿, 吉井 和佳, 奥乃 博: 潜在共通構造モデルに基づく音響信号間アライメント, 音学シンポジウム, 音楽情報科学研究会, Vol.2014-MUS-103 No.23, 音声研究会, 日本大学, May 25, 2014 pdf
  85. 池宮 由楽, 糸山 克寿, 吉井 和佳, 奥乃 博: 市販楽曲からの歌い方ライブラリの作成, 音学シンポジウム, 音楽情報科学研究会, Vol.2014-MUS-103 No.48, 音声研究会, 日本大学, May 25, 2014 pdf

    特許・ディジタルコンテンツ

  86. 楽譜位置推定装置、楽譜位置推定方法、及び楽譜位置推定プログラム. 発明者: 中臺 一博, 大塚 琢馬, 奥乃 博, 特許第5654897号, 登録日平成26年11月28日. 特開2011-180590号, 2011年9月15日. 特願2011-37526号, 2011年2月23日. pdf
  87. Musical score position estimating device, musical score position estimating method, and musical score position estimating robot. Inventors: Kazuhiro Nakadai, Takuma Otsuka, Hiroshi Okuno, Patent No. US 8,889,976, Date of Patent: Nov. 18, 2014. Date of Application: Aug. 14, 2009.
  88. 音源定位システム及び音源定位方法. 発明者: 中臺 一博, 奥乃 博, 大塚 琢馬, 特許第5629249号, 登録日平成26年10月10日. 特開2013-44950号, 2013年3月4日. 特願2011-182774号, 2011年8月24日. pdf
  89. Music Audio Signal Generating System. Inventors: Takehiro Abe, Naoki Yasuraoka, Katsutoshi Itoyama, Hiroshi Okuno, Patent No. US 8,831,762, Date of Patent: Sep 9, 2014. Date of Application: Feb. 16, 2010.
  90. 環境音検索装置、環境音検索方法. 発明者: 中臺 一博, 中村 圭祐, 山村 祐介, 奥乃 博, 特開2014-178886号, 2014年9月25日. 特願2013-52424号, 2013年3月14日.
  91. 楽譜位置推定装置、楽譜位置推定方法および楽譜位置推定ロボット. 発明者: 中臺 一博, 大塚 琢馬, 奥乃 博, 特許第5582915号, 登録日平成26年7月25日. 特開2011-39511号, 2011年2月24日. 特願2010-177968号, 2010年8月6日. pdf
  92. 残響抑制装置,及び残響抑制方法, 発明者:中臺 一博, 武田 龍, 奥乃 博, 特許第5572445号, 登録日平成26年7月4日. 特開2011-232691号, 2011年11月17日. 特願2010-105369号, 2010年4月30日. pdf
  93. 残響抑制装置,及び残響抑制方法, 発明者:中臺 一博, 中島 弘史, 奥乃 博, 武田 龍, 特許第5550456号, 登録日平成26年5月30日. 特開2010-282193号, 2010年12月16日. 特願2010-124873号, 2010年5月31日. pdf
  94. Theremin-player robot. Inventors: Hiroshi Tsujino, Hiroshi Okuno, Takeshi Mizumoto, Patent No. US 8,718,823, Date of Patent: May 6, 2014. Date of Application: Oct. 6, 2010.
  95. 音声理解装置, 発明者:中野 幹生, 勝丸 真樹, 船越 孝太郎, 奥乃 博, 特許第5530729号, 登録日平成26年4月25日. 特開2010-170137号, 2010年8月5日. 特願2010-11175号, 2004年11月12日. pdf

2014年度 o 2013年度(奥乃・吉井研究室)o 2012年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. Angelica Lim: MEI: Multimedia Emotional Intelligence (MEI: マルチメディア・エモーショナル・インテリジェンス), 博士論文 (指導教員: 奥乃博教授), Feb. 2014.
  2. 大塚 琢馬: Bayesian Microphone Array Processing (ベイズ法によるマイクロフォンアレイ処理), 博士論文 (指導教員: 奥乃博教授), Feb. 2014.
  3. 神田 直之: Open-ended Spoken Language Technology: Studies on Spoken Dialogue Systems and Spoken Document Retrieval Systems (拡張可能な音声言語技術:音声対話システムと音声文書検索システムにおける研究), 博士論文 (指導教員: 奥乃博教授), Feb. 2014.

  4. 平山 直樹: 複数方言言語モデル混合による複数方言音声認識の高機能化, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
  5. 矢澤 一樹 ギター演奏音響信号からの運指時の身体的制約と演奏難易度に基づくタブ譜自動生成, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
  6. 望月 敬太 神経力学モデルを用いた描画運動における人間の認知モデルに基づくロボットの発達的模倣, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
  7. 黄 楊暘 追体験メディアにおける注意誘導の音響提示手法, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
  8. 佐野 正太郎 Designing Security Guidelines for COntinuous Visual and Audio CAPTCHAs with HMM-based Breaker, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
  9. 山口 雄紀 Deep Neural Network とマルチストリームHMMを用いた視聴覚音声認識, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.

  10. 井山 貴裕: 深度センサとマイクロフォンアレイを用いた音源位置推定による聴覚アウェアネスの可視化, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2014.
  11. 絵本 詩織: 類似楽曲検索のための音響特徴量を用いた時間変化する楽曲印象分布の推定, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2014.
  12. 山崎 健史: 歌声ー話声変換における動的音響特徴量が話声らしさに及ぼす影響, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2014.

  13. Ui-Hyum Kim: Improvement of Sound Source Localization for a Binaural Robot of Spherical Head with Pinnae (耳介付球状頭部を持つ両耳聴ロボットのための音源定位の高性能化), 博士論文 (指導教員: 奥乃博教授), Aug. 2013.
  14. 田崎 豪: People Detection based on Points Tracked by an Omnidirectional Camera and Interaction Distance for Service Robots System (サービスロボットシステムのための全方位カメラによるトラッキング可能特徴点と インタラクション距離情報を用いた人物検出), 博士論文 (指導教員: 奥乃博教授), Aug. 2013.

  15. 中村 秀樹: Server Side HARKの設計と開発及びその複数人対話の書き起こし支援への応用, 卒業特別研究報告 (指導教員: 奥乃博教授), Jul. 2013.

    ジャーナル論文

  16. Ui-Hyun Kim, Kazuhiro Nakadai, Hiroshi G. Okuno: Improved Sound Source Localization in Horizontal Plane for Binaural Robot Audition, Applied Intelligence, accepted, Springer, Mar. 25, 2014. IF: 1.853
  17. Akira Maezawa, Hiroshi G. Okuno: MAHLER : Audio-to-Score Alignment based on Joint Bayesian Inference of Timbre, Volume, Tempo, and Performer-Dependent Note Onset Timings. Computer Music Journal, accepted, Jan. 23, 2014. IF: 0.756
  18. Ikkyu Aihara, Takeshi Mizumoto, Takuma Otsuka, Hiromitsu Awano, Kohei Nagira, Hiroshi G. Okuno, Kazuyuki Aihara: Spatio-Temporal Dynamics in Collective Frog Choruses Examined by Mathematical Modeling and Field Observation. Scientific Reports, 4:3891 Nature Publishing Group, 27 Jan. 2014. doi: 10.1038/srep03891 IF: 2.927
  19. 平山 直樹, 吉野 幸一郎, 糸山 克寿, 森 信介, 奥乃 博: 入力方言の自動推定による複数方言音声認識システムの構築. 情報処理学会論文誌, 条件付き採録, Jan. 23, 2014, 情報処理学会.
  20. Angelica Lim, Hiroshi G. Okuno: The MEI Robot: Towards Using Motherese to Develop Multimodal Emotional Intelligence. IEEE Transactions on Autonomous Mental Development, publication pending minor revisions, Jan. 20, 2014
  21. 神田 直之, 糸山 克寿, 奥乃 博: 音声中の任意検索語検出のための未知語区間推定に基づく選択的インデクス統合法, 情報処理学会論文誌, Vol.55, No.3 (Mar. 2014) 121-1211, 情報処理学会. pdf, DL
  22. Takuma Otsuka, Katsutoshi Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: Bayesian Nonparametrics for Microphone Array Processing, IEEE/ACM Transactions on Audio, Speech and Language Processing, in print, Vol.22, Issue 2 (Feb. 2014) 493--504.. doi: 10.1109/TASLP.2013.2294582 IF: 2.625
  23. Tsuyoshi Tasaki, Tetsuya Ogata, Hiroshi G. Okuno: The Interaction between a Robot and Multiple People based on Spatially Mapping of Friendliness and Motion Parameters, Advanced Robotics, Vol.28, Issue 1 (Jan. 2014) pp.39-51 Published on line on 30 Oct. 2013. doi: 10.1080/01691864.2013.854457 IF: 0.562
  24. 田崎 豪, 尾形 哲也, 奥乃 博: 相槌認識による聞き手の理解状態推定を利用した インタラクションのためのロボット動作制御, ヒューマンインタフェース学会論文誌, Vol.15, No.4 (Nov. 2013) pp.363-374. 学会オンラインサーバ
  25. Ui-Hyun Kim, Hiroshi G. Okuno: Improved Binaural Sound Localization and Tracking for Unknown Time- Varying Number of Speakers, Advanced Robotics, accepted, Dec. 28, 2012. Vo.27, Issue 15 (Nov. 2013) pp.1161-1173 Published Online on 1 July 2013. doi: 10.1080/01691864.2013.812177 IF: 0.562
  26. Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno: A real-time super-resolution robot audition system that improves the robustness of simultaneous speech recognition Advanced Robotics, Vol.27 Issue 12 (Dec. 2013), pp.933-945, Published Online on 10 May 2013. doi:10.1080/01691864.2013.797139 IF: 0.510 The Best Paper Award.
  27. Daichi Sakaue, Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: Robust Multipitch Analyzer against Initialization based on Latent Harmonic Allocation using Overtone Corpus, Journal of Information Processing, Vol.21, No.2 (Apr. 2013), pp.246-256, IPSJ, Jan. 2013. doi:10.2197/ipsjjip.21.246

    章分担・解説

  28. Shotaro Sano, Takuma Otsuka, Hiroshi G. Okuno: Solving Google's Continuous Audio CAPTCHA with HMM-based Automatic Speech Recognition, Advances in Information and Computer Security, Proceedings of the 8th International Workshop on Security (IWSEC 2013), Lecture Notes in Computer Science, Vol.8231, pp.36-52, Springer, Nov. 18-20, Okinawa. The Best Paper Award Description doi: 10.1007/978-3-642-41383-4_3
  29. Ui-Hyun Kim, Kazuhiro Nakadai, Hiroshi G. Okuno: Improved Sound Source Localization and Front-Back Disambiguation for Humanoid Robots with Two Ears, Recent Trends in Applied Artificial Intelligence, Lecture Notes in Computer Science, Vol.7906, pp.282-291, Springer. June 17-21, Amsterdam, The Netherland. (Acceptance rate for long papers: 34.7%). The Best Paper Award (1/103 papers) pdf doi: 10.1007/978-3-642-38577-3_29
  30. YangYang Huang, Takuma Otsuka, Hiroshi G. Okuno: A Speaker Dialization System with Robust Speaker Localization and Voice Activity Detection, Comtemprary Challenges and solutions in Applied Artificial Intelligence, Studies in Computational Intelligence, Vol. 489 (2013) pp.77-82, Springer. June 17-21, Amsterdam, The Netherland. doi: 10.1007/978-3-319-00651-2_11

    国際会議論文

  31. Angelica Lim, Hiroshi G. Okuno: A model for human empathy based on a neuroscience-inspired emotional robot, HRI2014 Workshop on "HRI: a bridge between Robotics and Neuroscience", poster, Mar. 3, 2014
  32. Yuki Yamaguchi, Kuniaki Noda, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Learning and Association of Synaesthesia Phenomenon using Deep Neural Networks, Proceedings of 2013 IEEE/SICE International Symposium on System Integration (SII 2013), MP2-K.2, pp.659-664, Dec. 15-17, 2013, Kobe. 10.1109/SII.2013.6776750
  33. M.J. Hikita, Hiroshi G. Okuno: PROPOSAL OF INTERNATIONAL CONFERENCE PROMOTION --- Destination Branding and Risk Management by a network of conference centres ---, Proceedings of the First International Conference of Serviceology (ICServ 2013), pp.61-68, Oct. 16-18, AIST Tokyo Waterfront, Japan.
  34. Keita Mochizuki, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: DevelopmentalHuman-Robot Imitation Learning of Drawing with a Neuro Dynamical System, Proceeding of 2013 IEEE International Conference on Systems, Man, and Cybernetics (SMC 2013), pp.2336-2341, part SMC: Human-Machine, Manchester, UK, 13-16 Oct. 2013. doi:10.1109/SMC.2013.399 pdf
  35. Hiroshi G. Okuno: Outdoor Auditory Scee Analysis, Keynote Talk, TuCT8.1, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2013), Nov. 5, 2013.
  36. Yoshinori Bando, Takeshi Muzumoto, Katsutoshi Itoyama, Kazuhiro Nakadai, Hiroshi G. Okuno: Posture Estimation of Horse-Shaped Robot using Microphone Array Localization, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2013), TuCT8.5, pp.3446-3451, (acceptance rate 43%), IEEE, RSJ, Tokyo Big Sight, Japan, 3-7 Nov. 2013. doi 10.1109/IROS.2013.6696847 IEEE Robotics and Automation Society Japan Chapter Young Award pdf
  37. Koutarou Furukawa, Keita Okutani, Kohei Nagira, Takuma Otsuka, Katsutoshi Itoyama, Kazuhiro Nakadai, Hiroshi G. Okuno: Noise Correlation Matrix Estimation for Improving Sound Source Localization by Multirotor UAV, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2013), TuDT8.5, pp.3943-3948, (acceptance rate 43%), IEEE, RSJ, Tokyo Big Sight, Japan, 3-7 Nov. 2013. doi 10.1109/IROS.2013.6696920 pdf
  38. Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shunsuke Mori, Hiroshi G. Okuno: Automatic Estimation of Dialect Mixing Ratio for Dialect Speech Recognition, Proceedings of International Conference on Spoken Language Processing (Interspeech 2013), pp.1492-1496, (acceptance rate 52%), Aug., 2013. Lyon, France. pdf
  39. Ui-Hyun Kim, Hiroshi G. Okuno: Robust Localization and Tracking of Multiple Speakers in Real Environments for Binaural Robot Audition, Proceedings of the 14th International Workshop on Image and Audio Analysis for Multimedia Interactive Services (WIA2MIS 2013), pp.1-4, Paris, July 3-5, 2013. pdf doi: 10.1109/WIAMIS.2013.6616137
  40. Kazuki Yazawa, Daichi Sakaue, Kohei Nagira, Katsutoshi Itoyama, Hiroshi G. Okuno: AUDIO-BASED GUITAR TABLATURE TRANSCRIPTION USING MULTIPITCH ANALYSIS AND PLAYABILITY CONSTRAINTS, Proceedings of 2013 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), AASP-P.1.4, pp.196-200. Vancouver, Canada, May 26-31. pdf doi: 10.1109/ICASSP.2013.6637636
  41. Daichi Sakaue, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: INITIALIZATION-ROBUST BAYESIAN MULTIPITCH ANALYZER BASED ON PSYCHOACOUSTICAL AND MUSICAL CRITERIA, Proceedings of 2013 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), AASP-P1.10, pp.226-230, Vancouver, Canada, May 26-31. pdf doi: 10.1109/ICASSP.2013.6637642
  42. Naoyuki Kanda, Katsutoshi Itoyama, Hiroshi G. Okuno: MULTIPLE INDEX COMBINATION FOR JAPANESE SPOKEN TERM DETECTION WITH OPTIMUM INDEX SELECTION BASED ON OOV-REGION CLASSIFIER, Proceedings of 2013 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), SLP-P5.7, pp.8540-8544, pdf Vancouver, Canada, May 26-31. doi: 10.1109/ICASSP.2013.6639332
  43. Tetsuya Ogata, Hiroshi G. Okuno: Integration of behaviors and languages with a hierarchal structure self-organized in a neuro-dynamial model, IEEE Symposium Series on Computational Intelligence 2013, pp.89-95, Singapore, Apr. 16-19, 2013. doi: 10.1109/RiiSS.2013.6607934
  44. Randy Gomez, Keisuke Nakamura, Kazuhiro Nakadai, Ui-Hyun Kim, Hiroshi G. Okuno, Tatsuya Kawahara: Hands-Free Human Robot Communication Robust to Speaker's Radial Position, Proceedings of 2013 IEEE International Conference on Robots and Automation (ICRA 2013), pp.4329-4334, (acceptance rate 39%), Karlsruhe, Germany, May 6-10, 2013. doi: 10.1109/ICRA.2013.6631190 pdf

    口頭発表(研究会・全国大会)

  45. 水本 武志, 合原 一究, 奥乃 博: 音声可視化デバイス「カエルホタル」によるニホンアマガエル合唱の時空間構造解析 第38回 AI チャレンジ研究会, SIG-Challenge-B303-08, 人工知能学会, 京都大学, Mar. 18. 2014. pdf
  46. 合原 一究, 粟野 皓光, 水本 武志, 坂東 宜昭, 大塚 琢馬, 柳楽 浩平, 奥乃 博: 振動子モデルと音声可視化システムを用いたアマガエルの合唱法則の解析, 第38回 AI チャレンジ研究会, SIG-Challenge-B303-09, 人工知能学会, 京都大学, Mar. 18. 2014. pdf 人工知能学会 2013年度研究会優秀賞.w
  47. Shotaro Sano, Takuma Otsuka, Hiroshi G. Okuno: HMM-based CAPTCHA Breaker for Overlapped Symbols, 情報処理学会第76回全国大会, 2Z-3, Mar. 2014. 東京電機大学. 学生奨励賞 pdf
  48. 望月 敬太, 西出 俊 奥乃 博, 尾形 哲也: ロボットによる描画運動発達モデルと軌道の重み付き区間認識・学習を利用した精度向上, 情報処理学会第76回全国大会, 3C-5, Mar. 2014. 東京電機大学. 大会優秀賞. pdf
  49. 坂東 宣昭, 大塚 琢馬, 中臺 一博, 田所 諭, 昆陽 雅司, 糸山 克寿, 奥乃 博: マイクロホンアレイの位置推定によるホース型ロボットの姿勢推定, 情報処理学会第76回全国大会, 4V-1, Mar. 2014. 東京電機大学. 学生奨励賞 pdf
  50. 平山 直樹, 吉野 浩一郎, 森 信介, 糸山 克寿, 奥乃 博: 混合方言言語モデルと混合比推定による方言音声認識システム, 情報処理学会第76回全国大会, 4S-6, Mar. 2014. 東京電機大学. 学生奨励賞 pdf
  51. 矢澤 一樹, 糸山 克寿, 奥乃 博: ギター演奏音からの難易度調整可能なタブ譜自動生成システム, 情報処理学会第76回全国大会, 5R-5, Mar. 2014. 東京電機大学. 学生奨励賞 pdf
  52. 池宮 由楽, 糸山 克寿, 奥乃 博: 伴奏付き歌唱からの歌唱表現のパラメータ化と転写, 情報処理学会第76回全国大会, 5R-7, Mar. 2014. 東京電機大学. pdf
  53. 山崎 健史, 池宮 由楽, 糸山 克寿, 奥乃 博: 歌声-話声変換における動的音響特徴量が話声らしさに及ぼす影響, 情報処理学会第76回全国大会, 5R-8, Mar. 2014. 東京電機大学. pdf
  54. 絵本 詩織, 糸山 克寿, 奥乃 博: 音響特徴量を用いた楽曲印象分布の推定, 情報処理学会第76回全国大会, 6R-8, Mar. 2014. 東京電機大学. pdf
  55. 西牟田 勇哉, 平山 直樹, 大塚 琢馬, 杉山 治, 糸山 克寿, 奥乃 博: 環境音に頑健な同時合図を識別するクイズ司会者の構築, 情報処理学会第76回全国大会, 5S-1, Mar. 2014. 東京電機大学. pdf
  56. 山口 雄紀, 野田 邦明, 中臺 一博, 奥乃 博, 尾形 哲也: Deep Neural Networkを用いたマルチモーダル音声認識の為の特徴量学習, 情報処理学会第76回全国大会, 5S-3, Mar. 2014. 東京電機大学. 学生奨励賞 pdf
  57. 井山 貴裕, 杉山 治, 大塚 琢馬, 糸山 克寿, 奥乃 博: 深度センサとマイクロホンアレイを用いた音源位置可視化による聴覚アウェアネスの提示, 情報処理学会第76回全国大会, 6S-5, Mar. 2014. 東京電機大学. 学生奨励賞 pdf
  58. 黄 楊暘, 杉山 治, 大塚 琢馬, 奥乃 博: 追体験メディアにおける注意誘導の提示手法, 情報処理学会第76回全国大会, 6S-7, Mar. 2014. 東京電機大学. pdf
  59. Hadi Tjandra,高橋城志,村田真悟,有江浩明, 山口 雄紀, 尾形 哲也, 菅野重樹: 神経力学モデルと身体バブリングに基づく道具身体化と動作生成 情報処理学会第76回全国大会, 1S-4, Mar. 2014. 東京電機大学.
  60. 高橋 裕己,中野 幹生,岩橋 直人,左 祥,船越 孝太郎,岡 夏樹,菅野 重樹: マルチモーダル情報を利用した未知語を含む発話のドメイン選択精度の向上, 情報処理学会第76回全国大会, 4S-2, Mar. 2014. 東京電機大学.
  61. アッタミミ・ムハンマド, 長井 隆行, 岩橋 直人, 奥乃 博: 音声命令と行動予測に基づく文脈を考慮したロボットの行動決定, 第14回 計測自動制御学会 システムインテグレーション部門講演会 (SI2013), 2013年12月18日(水)〜20日(金) 神戸国際会議場
  62. 西牟田 勇哉, 平山 直樹, 大塚 琢馬, 杉山 治, 糸山 克寿, 奥乃 博: ロボット聴覚ソフトウエアHARKを用いたクイズの同時回答を識別する ロボット司会者 の設計と実装, 第37回 AI チャレンジ研究会, SIG-Challenge-B3020-09, pp.45-50, 人工知能学会, 早稲田大学, Dec. 6. 2013. pdf
  63. 坂東 宣昭, 大塚 琢馬, 糸山 克寿, 中村 圭佑, 昆陽 雅司, 田所 諭, 中臺 一博, 奥乃 博: ホースの伸び縮みによるマイク位置の変化を許容する マイクロホンアレイを用いたホース型ロボットの姿勢推定, 第37回 AI チャレンジ研究会, SIG-Challenge-B3020-10, pp.51-56, 人工知能学会, 早稲田大学, Dec. 6. 2013. pdf
  64. 望月 敬太, 西出 俊 奥乃 博, 尾形 哲也: 停止活動を活用した描画運動におけるロボットの発達的模倣学習, 日本ロボット学会第31回学術講演会, 1C2-06, 首都大学東京, Sep. 4-6, 2013. pdf
  65. 西出 俊 奥乃 博, 尾形 哲也: スパース再帰神経回路モデルによる人物の行動学習, 日本ロボット学会第31回学術講演会, 2C2-01, 首都大学東京, Sep. 4-6, 2013. pdf
  66. 坂東 宣昭, 大塚 琢馬, 水本 武志, 糸山 克寿, 中臺 一博, 奥乃 博: ホース型ロボットのマイクロホンアレイを用いた姿勢推定, 日本ロボット学会第31回学術講演会, 3D3-01, 首都大学東京, Sep. 4-6, 2013. pdf
  67. 古川 孝太郎, 大塚 琢馬, 糸山 克寿, 中臺 一博, 奥乃 博: Multirotor UAV を用いた音源定位のための雑音相関行列推定, 日本ロボット学会第31回学術講演会, 3D3-02, 首都大学東京, Sep. 4-6, 2013. pdf
  68. 西牟田 勇哉, 平山 直樹, 大塚 琢馬, 杉山 治, 糸山 克寿, 奥乃 博: HARKを用いたロボットクイズ司会者HATTACK25 の開発, 日本ロボット学会第31回学術講演会, 3D3-08, 首都大学東京, Sep. 4-6, 2013. pdf
  69. 糸山 克寿, 奥乃 博: 楽器音に対する仮想音源のパラメータ推定 第100回音楽情報処理研究会, 研究報告音楽情報科学(MUS), 2013-MUS-100(5),1-6 (2013-08-24) 東京大学, 情報処理学会, Aug. 2013. pdf
  70. 前澤 陽, 奥乃 博: 楽曲パート混合オーディオ同士の楽譜なしアライメント手法, 第100回音楽情報処理研究会, 研究報告音楽情報科学(MUS), Vol.2013-MUS-100, No.14, 1-6 (2013-09-31) 東京大学, 情報処理学会, Aug. 2013. pdf
  71. 矢澤 一樹, 糸山 克寿, 奥乃 博: ギター演奏者の習熟度に合わせた音響信号からのタブ譜自動生成, 第100回音楽情報処理研究会, 研究報告音楽情報科学(MUS), Vol.2013-MUS-100, No.17, 1 -6 (2013-09-01) 東京大学, 情報処理学会, Sep. 2013. pdf
  72. 池宮 由楽, 糸山 克寿, a href="http://winnie.kuis.kyoto-u.ac.jp/members/okuno/">奥乃 博: 伴奏付き歌唱に含まれる歌い方要素の個別抽出 第100回音楽情報処理研究会, 研究報告音楽情報科学(MUS), Vol.2013-MUS-100, No.20, 1 -6 (2013-09-01) 東京大学, 情報処理学会, Sep. 2013. pdf

    特許・ディジタルコンテンツ

  73. 音響処理装置, 音響処理方法, 及び音響処理プログラム 発明者:ジョアオ ロバート オリベイラ,インジュ ギョカン, 中村 圭佑, 中臺 一博, 奥乃 博, ルイス パウロ レイシュ, ファビアン, グーヨン, 特開2014-52630号, 2014年3月20日. 特願2013-182717号, 2013年9月3日.
  74. Robot, method and program of correcting a robot voice in accordance with head movement. Inventors: Kazuhiro Nakadai, Takuma Otsuka, Hiroshi Okuno, Patent No. US 8,639,511, Date of Patent: Jan. 28, 2014. Date of Application: Sep. 14, 2010.
  75. 音源探査装置, 発明者:堀邊 隆介, 梅田 修志, 田中 史記, 猪田 岳司, 奥乃 博, 高橋 徹. 特許第5423370号, 登録日平成25年12月6日. 特開2011-238964号, 2011年6月23日. 特願2009-280115号, 2009年12月10日. pdf
  76. 音源分離定位装置、方法、及びプログラム, 発明者: 石黒 勝彦, 澤田 宏, 大塚 琢馬, 奥乃 博, 特開2014-21315号, 2014年2月3日. 特願2012-160450号, 2012年7月19日.
  77. ロボット、ロボット制御方法およびプログラム, 発明者: 中臺 一博, 大塚 琢馬, 奥乃 博, 特許第5393544号, 登録日平成25年10月25日. 特開2011-189439号, 2011年9月29日. 特願2010-56265号, 2010年3月12日. pdf
  78. 音データ記録再生装置および音データ記録再生方法, 発明者: 中臺 一博, 長谷川 雄二, 辻野 広司, 奥乃 博, 特許第5383056号, 登録日平成25年10月11日. 特開2008-197650号, 2008年8月28日. 特願2008-25678号, 2008年2月5日. pdf
  79. Beat tracking apparatus, beat tracking method, recording medium, beat tracking program, and robot. Inventors: Kazuhiro Nakadai, Yuji Hasegawa, Hiroshi Tsujino, Kazumasa Murata, Ryu Takeda, Hiroshi Okuno, Patent No. US 8,594,846, Date of Patent: Nov. 26, 2013. Date of Application: Jul. 15, 2009.
  80. Speech recognition system and speech recognizing method. Inventors: Kazuhiro Nakadai, Toru Takahashi, Hiroshi Okuno, Patent No. US 8,577,678, Date of Patent: Nov. 5, 2013. Date of Application: Mar. 10, 2011.
  81. Speech understanding apparatus using multiple language models and multiple language understanding models. Inventors: Mikio Nakano, Masaki Katsumaru, Kotaro Funakoshi, Hiroshi Okuno, Patent No. US 8,548,808, Date of Patent: Oct. 1, 2013. Date of Application: Jan. 22, 2010.
  82. ビートトラッキング装置、ビートトラッキング方法、記録媒体、ビートトラッキング用プログラム、及びロボット, 発明者: 中臺 一博, 長谷川 雄二, 辻野 広司, 村田 和真, 武田 龍, 奥乃 博, 特許第5337608号, 登録日平成25年8月9日. 特開2010-26512号, 2010年2月4日. 特願2009-166048号, 2009年7月14日. pdf
  83. 音楽音響信号生成システム, 発明者: 安部 武宏, 安良岡 直希, 糸山 克寿, 奥乃 博, 特許第5283289号,登録日2013 (平成25年) 6月7日. 特願2011-500614号, 出願日2011年8月9日, 国立大学法人京都大学. pdf
  84. 会話システムおよび会話ソフトウェア, 発明者: 中野 幹生, 辻野 広司, 竹内 誉羽, 駒谷 和範, 奥乃 博, 特許第5248867号, 登録日平成25年4月19日. 特願2007-556883号, 2007年1月31日. pdf
  85. Musical score position estimating apparatus, musical score position estimating method, and musical score position estimating program. Inventors: Kazuhiro Nakadai, Takuma Otsuka, Hiroshi Okuno, Patent No. US 8,440,901, Date of Patent: May 14, 2013. Date of Application: Mar. 1, 2011.
  86. Audio Source Detection System, Inventors: Hiroshi Tsujino, Kazuhiro Nakadai, Hiroshi Okuno, Takeshi Mizumoto, and Ikkyu Aihara. Patent No. US 8,416,957, Date of Patent: Apr. 9, 2013. Date of Application: Dec. 4, 2009.

2013年度 o 2012年度(奥乃研究室)o 2011年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 水本 武志: Synchronization among Interacting Individuals: Case Studies of Human-Robot Ensembles and Frog Choruses, 博士論文 (指導教員: 奥乃博教授), Feb. 2013.
  2. 中村 圭佑: Robust Sound Source Localization Based on Microphone Array Processing for Robot Audition, 博士論文 (指導教員: 奥乃博教授), Feb. 2013.

  3. 糸原 達彦: Beat-tracking method for music robot ensembles with a human guitarist, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
  4. 阪上 大地: Optimization-Free Multipitch Analyzer based on Psychoacoustical and Musical Criteria, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
  5. 柳楽 浩平: Nonparametric Bayesian Blind Source Separation in Frequency Domain with Permutation Resolution, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
  6. 信田 春満: 神経力学モデルを用いた予測可能性による身体識別と 視覚運動系環境学習における身体の優先的獲得, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
  7. JooYoung Ahn: Real-Time Lead Sheet Following for Human Accompaniment by Particle Filter, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.

  8. 池宮 由楽: 伴奏付き歌声からのF0抽出による楽譜逸脱成分推定, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
  9. 田島 照久: 楽器音の音量変化を共有化したNMFによる楽器パート分離, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
  10. 古川 孝太郎: 雑音相関行列の推定によるクアドロコプターからの音源定位, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
  11. 水野 俊一郎: カエルの鳴き声混合音からの複数種識別, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.

    査読つきジャーナル論文

  12. Kohei Nagira, Takuma Otsuka, Hiroshi G. Okuno: Nonparametric Bayesina Sparse Factor Analysis for Frequency Doain Blind Source Separation without Pearmuation Ambiguity, EURASIP Journal on Audio, Speech, and Music Processing, 2013, 2013:3. doi:10.1186/1687-4722-2013-4 目次 (学会サーバ) IF: 0.382
  13. Kazunori Komatani, Mikio Nakano, Masaki Katsumaru, Kotaro Funakoshi, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Allocation of Training Data for Speech Understanding based on Multiple Model Combinations, IEICE Transactions on Information and Systems, Vol.E95-D, No.9 (Sep. 2012) pp.2298-2307. pdf (学会サーバ)
  14. Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Long-Term Analysis of User Behaviors in Deployed Spoken Dialogue System Dialogue & Discourse, conditionally accepted pending required revisions, May 21, 2012.
  15. Akira Maezawa, Katsutoshi Itoyama, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automated Violin Fingering Transcription Through Analysis of an Audio Recording, Computer Music Journal, Fall 2012, Vol.36, No.3, Pages 57-72 Posted Online August 14, 2012 doi:10.1162/COMJ_a_00129 (Free at MIT Press) IF: 0.756
  16. Shun Nishide, Jun Tani, Toru Takahashi, Hiroshi G. Okuno, Tetsuya Ogata: Tool-Body Assimilation of Humanoid Robt using Neuro-Dynamical System, IEEE Transactions on Autonomous Mental Development, Vol.4, Issue:2 (june 2012) pp.139-149, 2012. doi:10.1109/TAMD.2011.2177660 IF: 2.170

    章分担・解説

  17. Angelica Lim: Musical Robots and Interactive Multimodal Systems, Book Review, International Journal of Synthetic Emotions, Vol. 3, No. 2 (2012) 84-86. doi: 10.4018/jse.2012070105
  18. 奥乃 博: 数独問題の難易度定義とそれに基づく問題自動生成法の研究, 中山隼雄科学技術文化財団20周年記念誌,2012.
  19. Kohei Nagira, Takuma Otsuka, Tetsuya Ogata, Hiroshi G. Okuno: Infinite Sparse Factor Analysis for Blind Source Separation in Reverberant Environments, SSPR/SPR2012, Lecture Notes in Computer Science, Vol. 7626, pp.638-647, Nov. 7-9. Hiroshima, Japan. doi: 10.1007/978-3-642-34166-3_70
  20. Angelica Lim, Hiroshi G. Okuno: Using speech data to recognize emotion in human gait, Human Behavior Understanding, A.A. Salah et al. (Eds): Human Behavior Understanding 2012, Lecture Notes in Computer Science, Vol.7559, pp.52-64, Springer, Algarve, Portgul, October 7, 2012. acceptance rate 42%. Abstractpdf doi: 10.1007/978-3-642-34014-7_5
  21. Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Chord Recognition Based on Probabilistic Integration of Acoustic Features and Chord Transition, He Jiang et al. (Eds.): Advanced Research in Applied Artificial Intelligence, IEA/AIE-2012, pp.58-67, LNAI Vol.7345. Springer. June 9-12, Dalian, China. doi: 10.1007/978-3-642-31087-4_7
  22. Takeshi Mizumoto, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Adaptive Pitch Control for Robot Thereminist using Unscented Kalman Filter. H. Jiang, M. Ali, and M. Li (Eds.), Modern Advances in Intelligent Systems and Tools, Studies in In Computational Intelligence, pp.19-24, Springer. June 9-12, Dalian, China, 2012. (IEA/AIE-2012) doi: 10.1007/978-3-642-30732-4_3
  23. 水本 武志, 粟野 皓光, 坂東 宣昭, 3Dプリンタで遊ぼう, 情報処理, 「夏休み自作自習小特集」, Vol.53, No.8 (Aug. 2012) 情報処理学会 http://id.nii.ac.jp/1001/00082771/
  24. 奥乃 博: 編集にあたって, 情報処理, 「夏休み自作自習小特集」, Vol.53, No.8 (Aug. 2012) 情報処理学会 http://id.nii.ac.jp/1001/00082770/
  25. 奥乃 博, 中臺 一博, 水本 武志: 混合音を聞き分けるセンシング技術, 電子情報通信学会学会誌, 人間を理解するためのICT技術特集 2-2, Vol.95, No.5 (May 2012) pp.401-404, 電子情報通信学会. pdf
  26. 後藤 真孝, 奥乃 博: 編集にあたって, 情報処理, 特集号「CGMの現在と未来」, Vol.53, No.5 (May 2012) pp.464-465, 情報処理学会 電子図書館

    国際会議論文

  27. Naoki Hirayama, Shinsuke Mori, Hiroshi G. Okuno: Statistical Method of Building Dialect Language Models for ASR Systems, Proceedings of the 24th International Conference on Computational Linguistics (Coling-2012), 1179-1194, Mumbai, India, Dec. 8-15, 2012.
  28. Tatsuhiko Itohara, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: Improvement of Audio-Visual Score Following in Robot Ensemble with Human Guitarist, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2012), accepted as oral (acceptance rate 57% = 133/233), IEEE, Osaka, Nov. 30 - Dec. 1, 2012. doi 10.1109/HUMANOIDS.2012.6651577
  29. Hiroshi G. Okuno: Human Robot Interaction through Robot Audition, Keynote, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012) Workshop on Motivational Aspect of Robotics in Physical Therapy, Vilamoura, Algarve, Portgul, October 12, 2012.
  30. Keita Mochizuki, Harumitsu Nobuta, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Developmental Human-Robot Imitation Learning with Phased Structuring in Neuro Dynamical Systems, Proceedings of IROS-2012 Workshop on Cognitive Neuroscience Robotics, Pos-3, 6 pages, IEEE, RSJ, Vilamoura, Algarve, Portgul, October 12, 2012. pdf
  31. Yuki Yamaguchi, Harumitsu Nobuta, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Developmental Human-Robot Imitation Learning with Phased Structuring in Neuro Dynamical Systems, Proceedings of IROS-2012 Workshop on Cognitive Neuroscience Robotics, PM2-3, 6 pages, IEEE, RSJ, Vilamoura, Algarve, Portgul, October 12, 2012. pdf
  32. Takeshi Mizumoto, Tetsuya Ogata, Hiroshi G. Okuno: Who is the leader in a multiperson ensemble? ---Multiperson human-robot ensemble model with leaderness---, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.1413-1419 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. pdf doi: 10.1109/IROS.2012.6385782
  33. Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Luis Paulo Reis, Fabien Gouyon, Live Assessment of Beat Tracking for Robot Audition, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.992-997 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. pdf doi 10.1109/IROS.2012.6386100
  34. Takuma Otsuka, Katsutoshi Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: Unified Auditory Functions based on Bayesian Topic Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.2370-2376 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. pdf doi: 10.1109/IROS.2012.6385787
  35. Yusuke Yamamura, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Unified Auditory Functions based on Bayesian Topic Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.2364-2369 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. pdf doi: 10.1109/IROS.2012.6385765
  36. Hiroshi G. Okuno: Human Robot Interaction through Robot Audition Keynote, Workshop on Motivational Aspect of Robotics in Physical Therapy. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), Vilamoura, Algarve, Portgul, October 12, 2012.
  37. Daichi Sakaue, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: Bayesian Nonnegative Harmonic-Temporal Factorization and Its Application to Multipitch Analysis Proceedings of 13th International Society for Musical Information Retrieval Conference (ISMIR-2012), pp.91-96, Porto, Portgul, Oct, 2012.
  38. Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Luis Paulo Reis, Fabien Gouyon, An Active Audition Framework for Auditory-driven HRI: Application to Interactive Robot Dancing, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2012), pp.1078-1085, IEEE, Paris, Sep 9-13, 2012. pdf doi: 10.1109/ROMAN.2012.6343892
  39. Takuya Yoshioka, Daichi Sakaue: Log-normal matrix factorization with application to speech-music separation, Proceedings of SAPA-SCALE Conference 2012, pp.80-85, Portland, OR, 7-8 September, 2012.
  40. Ikkyu Aihara, Takeshi Mizumoto, Takuma Otsuka, Hiromitsu Awano, Hiroshi G. Okuno, Kazuyuki Aihara: Possible Functions of Call Alternation in Frog Choruses, Tenth International Congress of Neuroethology, accepted, Aug. 5-10, 2012, University of Maryland, College Park, MD, USA. (poster) doi: 10.3389/conf.fnbeh.2012.27.00267
  41. Takeshi Mizumoto, Hiromitsu Awano, Ikkyu Aihara, Takuma Otsuka, Hiroshi G. Okuno: Sound imaging system for visualizing multiple sound sources from two species, Tenth International Congress of Neuroethology, accepted, Aug. 5-10, 2012, University of Maryland, College Park, MD, USA. (poster) doi: 10.3389/conf.fnbeh.2012.27.00247
  42. Takuma Otsuka, Katsuhiko Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: Bayesian Unification of Sound Source Localization and Separation with Permutation Resolution, Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence (AAAI-12), 2038-2045 (26%, 294/1129), July 22-26 (26), 2012, Toronto, Canada. pdf AAAI server
  43. Harumitsu Nobuta, Kenta Kawamoto, Kuniaki Noda, Kohtaro Sabe, Hiroshi G. Okuno, Tetsuya Ogata: Body area segmentation from visual scene based on predictability of neuro-dynamical system, Proc. of the 2012 International Joint Conference on Neural Networks (IJCNN 2012), pp.1-8, Brisbane, Australia, June 10-15, 2012. doi:10.1109/IJCNN.2012.6252530
  44. Shun Nishide, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Self-organization of Object Features Representing Motion Using Multiple Timescales Recurrent Neural Network, Proc. of the 2012 International Joint Conference on Neural Networks (IJCNN 2012), pp.1-8, Brisbane, Australia, June 10-15, 2012. doi:10.1109/IJCNN.2012.6252714
  45. Luis-Kenzo Furuya Cahier, Tetsuya Ogata, Hiroshi G. Okuno: Incremental Probabilistic Geometry Estimation for Robot Scene Understanding, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2012), pp.3265-3630, (acceptance rate 40%), May 14-18, 2012, St. Paul, MN. pdf doi: 10.1109/ICRA.2012.6225343

    口頭発表(研究会・全国大会)

  46. 池宮 由楽, 阪上 大地, 糸山 克寿, 奥乃 博: 歌声F0 生成過程とメロディ分離手法に基づく楽譜逸脱成分推定, 情報処理学会第75回全国大会, 3R-9, Mar. 2013. 東北大学. pdf
  47. 田島 照久, 阪上 大地, 糸山 克寿, 奥乃 博: 単音の音量ダイナミクスを共有化したNMFによる楽器パート分離, 情報処理学会第75回全国大会, 3R-10, Mar. 2013. 東北大学. pdf
  48. 矢澤 一樹, 阪上 大地, 糸山 克寿, 奥乃 博: ギター演奏からの押弦パターン・発音時刻・フォーム変化時間制約を 用いたタブ譜自動生成システム, 情報処理学会第75回全国大会, 4R-3, Mar. 2013. 東北大学. pdf
  49. 阪上 大地, 大塚 琢馬, 糸山 克寿, 奥乃 博: 非負値調波時間構造因子分解法に基づく音楽音響信号の多重基本周波数解析, 情報処理学会第75回全国大会, 4T-8, Mar. 2013. 東北大学.
  50. JOOYOUNG AHN, 糸山 克寿, Louis-Kenzo Cahier, 奥乃 博: Score Following of Human Accompaniment using a Lead-sheet for an Artificial Lead Singer, 情報処理学会第75回全国大会, Mar. 2013. 東北大学. pdf
    情報処理学会 第75回全国大会 学会推奨 修士論文認定, 2013年5月.
  51. 古川 孝太郎, 奥谷 啓太, 中臺 一博, 柳楽 浩平, 大塚 琢馬, 奥乃 博: クアドロコプターを用いた飛行雑音に頑健な音源定位, 情報処理学会第75回全国大会, 4T-7, Mar. 2013. 東北大学. pdf
    情報処理学会 第75回全国大会 学会推奨 卒業論文認定, 2013年5月.
  52. 坂東 宣昭, 水本 武志, 中臺 一博, 奥乃 博: チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ 位置推定, 情報処理学会第75回全国大会, 3Y-1, Mar. 2013. 東北大学. pdf
  53. 黄 楊暘, 大塚 琢馬, 中臺 一博, 奥乃 博: 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討, 情報処理学会第75回全国大会, 4T-2, Mar. 2013. 東北大学. pdf
  54. 平山 直樹, 森 信介, 奥乃 博: 方言対訳コーパスを用いた日本語方言変換システム, 情報処理学会第75回全国大会, 6T-5, Mar. 2013. 東北大学. pdf
  55. 佐野 正太郎, 大塚 琢馬, 奥乃 博: 音声Captcha の自動解析に向けたSingle Channel 混合音声の数字認識, 情報処理学会第75回全国大会, 4T-5, Mar. 2013. 東北大学. 学生奨励賞 pdf
  56. 柳楽 浩平, 大塚 琢馬, 奥乃 博: Permutation-free infinite ICAによる周波数領域ブラインド音源分離, 情報処理学会第75回全国大会, Mar. 2013. 東北大学.
  57. 糸原 達彦, 水本 武志, 奥乃 博: 音楽ロボットのための複数のビートトラッキングの結合手法とその有効性の検証, 情報処理学会第75回全国大会, 4T-4, Mar. 2013. 東北大学. pdf
  58. 山口 雄紀, 野田 邦明, 西出 俊, 奥乃 博, 尾形 哲也: 多層神経回路モデルによる共感覚現象の学習と連想, 情報処理学会第75回全国大会, Mar. 2013. 東北大学. 大会奨励賞
  59. 望月 敬太, 西出 俊 奥乃 博, 尾形 哲也: 神経回路モデルを用いたロボットの描画運動における発達的模倣学習, 情報処理学会第75回全国大会, 1R-5, Mar. 2013. 東北大学. 学生奨励賞 大会奨励賞 pdf
  60. 信田 春満, 西出 俊 奥乃 博, 尾形 哲也: 再帰結合神経回路モデルを用いた予測可能性による段階的対象選択学習, 情報処理学会第75回全国大会, 3R-2, Mar. 2013. 東北大学. 学生奨励賞 pdf
  61. 藤田 素子, 丸山 晃央, 神崎 護, 奥乃 博: 音声録音データを用いた鳥類多様性評価の可能性, 日本生態学会第60回大会 企画集会T-17『熱帯雨林における生物多様性MRVを確立するために』 企画者:鮫島弘光 (京大東南研), 今井伸夫 (京大農森林生態), 北山兼弘 (京大農森林生態), 2013年3月6日, 静岡.
  62. 平山 直樹, 森 信介, 奥乃 博: 方言対訳コーパスを用いた日本語方言音声認識システム, 第14回音声言語シンポジウム, 18-19 Dec. 2012.
  63. 信田 春満, 河本 献太, 野田 邦昭, 佐部 浩太郎, 西出 俊, 奥乃 博, 尾形 哲也: 神経力学モデルによる自己身体領域抽出と視覚運動系の自己組織化, SI 2012, 福岡国際会議場, Dec. 19-21, 2012.
  64. 中村 圭佑, 中臺 一博, 奥乃 博: 実時間超解像ロボット聴覚システムとその複数同時音声認識への応用, SI 2012, 福岡国際会議場, Dec. 19-21, 2012. 優秀講演賞
  65. 中村 圭佑, 中臺 一博, 奥乃 博: ロボットのための実環境ロバストな実時間超解像三次元音源定位, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
  66. 黄 楊暘, 大塚 琢馬, 中臺 一博, 奥乃 博: 視覚情報との統合による音声区間検出および音声認識精度向上の検討, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
  67. 大塚 琢馬, 石黒 勝彦, 澤田 宏, 奥乃 博: ベイズモデルによるマイクロホンアレイ処理の移動ロボットへの応用, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
  68. Uihyun Kim, Hiroshi G. Okuno: A Two Microphone-Based Approach for Multiple Speaker Localization on the SIG-2 Humanoid robot, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
  69. 糸原 達彦, 奥乃 博: ROS (Robot Operating System) を用いた音楽合奏ロボットシステムの構築 (クラウドネットワークロボット), 電子情報通信学会技術研究報告, 信学技法 112 (233), 33-36, Nov. 11, 2012. 沖縄科学技術大学院大学.
  70. 黄 楊暘, 大塚 琢馬, 中臺 一博, 奥乃 博: マイクロホンアレイを用いた複数人対話からの発話区間検出 および話者方向推定の評価手法, 日本ロボット学会第30回学術講演会, 3D1-4, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  71. 水本 武志, 尾形 哲也, 奥乃 博: 人とロボットの合奏のための多人数合奏の主導権推定, 日本ロボット学会第30回学術講演会, 3D2-3, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  72. 柳楽 浩平, 大塚 琢馬, 奥乃 博: ノンパラメトリックベイズに基づくパーミュテーションのない周波数領域でのブラインド音源分離, 日本ロボット学会第30回学術講演会, 3D2-4, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  73. 大塚 琢馬, 石黒 勝彦, 澤田 宏, 奥乃 博: 移動ロボットによる音環境理解に向けて, 日本ロボット学会第30回学術講演会, 3D2-5, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  74. 糸原 達彦, 奥乃 博: 音楽ロボットとの合奏ための信頼度を用いたビートトラッキングの結合手法, 日本ロボット学会第30回学術講演会, 3D2-6, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  75. 西出 俊, 奥乃 博, 尾形 哲也: 神経力学モデルによる自己身体領域抽出と視覚運動系の自己組織化, 日本ロボット学会第30回学術講演会, 3N1-7, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  76. Uihyun Kim, Hiroshi G. Okuno: Reliable Speaker Localization using Signalto-Noise Ratio Information in Noise Environments for the SIG-2 Humanoid Robot, 日本ロボット学会第30回学術講演会, 4D1-4, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  77. 山口 雄紀, 信田 春満, 西出 俊, 奥乃 博, 尾形 哲也: 神経力学モデルを用いたロボットの道具身体化機構, 日本ロボット学会第30回学術講演会, 4N3-3, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  78. 望月 敬太, 信田 春満, 西出 俊 奥乃 博, 尾形 哲也: 発達的模倣学習における神経力学モデルの段階的構造化と獲得プリミティブの解析, 日本ロボット学会第30回学術講演会, 4N3-4, 札幌コンベンションセンター, Sep. 17-20, 2012. pdf
  79. 矢澤 一樹, 阪上 大地, 糸山 克寿, 奥乃 博: 押弦制約と運指制約を用いたタブ譜生成システム, 第96回音楽情報科学研究会, Vol.2012-MUS-96 (11), pp.1-7, 情報処理学会, Aug. 2, 2012.
  80. 阪上 大地, 大塚 琢馬, 糸山 克寿, 奥乃 博: ベイジアン非負値調波因子分解と多重基本周波数推定への応用 第96回音楽情報科学研究会, Vol.2012-MUS-96 (11), pp. 情報処理学会, Aug. 2, 2012.
  81. 平山 直樹, 森 信介, 奥乃 博: 方言音声認識のための話し言葉言語モデル構築, NLP若手の会 第7回シンポジウム, 4 Sep. 2012. pdf

    特許・ディジタルコンテンツ

  82. Speech recognition system and method for generating a mask of the system. Inventors: Kazuhiro Nakadai, Toru Takahashi, Hiroshi Okuno, Patent No. US 8,392,185, Date of Patent: Mar. 5, 2013. Date of Application: Aug. 19, 2009.
  83. Reverberation suppressing apparatus and reverberation suppressing method . Inventors: Kazuhiro Nakadai, Hirofumi Nakajima, Hiroshi Okuno, and Ryu Takeda Patent No. US 8,391,505, Date of Patent: Mar. 5, 2013. Date of Application: Jun. 1, 2010.
  84. Musical piece recommendation system and method . Inventors: Masataka Goto, Kazuyoshi Yoshii, Hiroshi Okuno, Patent No. US 8,370,277, Date of Patent: Feb. 5, 2013. Date of Application: Jul. 31, 2008.
  85. 音源分離システム, 音源分離方法及び音源分離用コンピュータプログラム, 発明者: 糸山 克寿, 奥乃 博, 後藤 真孝, 特許第5201602号, 登録日平成25年2月22日. 特願2009-511801号, 2009年4月14日. pdf
  86. 音声認識装置及び音声認識装置のマスク生成法, 発明者: 中臺 一博, 高橋 徹, 奥乃 博, 特許第5180928号, 登録日平成25年1月18日. 特開2010-49249号, 2010年3月4日. 特願2009-185164号, 2009年8月7日. pdf
  87. 音源分離システム, 発明者: 武田 龍, 中臺 一博, 辻野 広司, 奥乃 博, 特許第5178370号, 登録日平成25年1月18日. 特開2009-42754号, 2009年2月26日. 特願2008-191382号, 2008年7月24日. pdf
  88. 音源追跡システム,方法,およびロボット, 発明者: 中臺 一博, 辻野 広司, 長谷川 雄二, 奥乃 博, 特許第5170440号, 登録日平成25年1月11日. WO2007/129731, 2007年11月15日. 特願2008-514510号, 2007年5月9日. PCT/JP2007/059599 pdf
  89. 音源定位システム及び音源定位方法, 発明者: 中臺 一博, 奥乃 博, 大塚 琢馬, 特開2013-44950号, 2013年3月4日. 特願2011-182774号, 2011年8月24日.
  90. Sound source tracking system, method and robot. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, yuji Hasegawa, Hiroshi Okuno, Patent No. US 8,155,331, Date of Patent: Apr. 10, 2012. Date of Application: May 9, 2007.
  91. 文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松 俊, 駒谷 和範, 奥乃 博, 特許第5167546号, 登録日平成25年1月11日. 特願2008-530812号, 2007年3月16日. 出願者: 京都大学 pdf
  92. ロボット, 発明者: 中臺 一博, 長谷川 雄二, 辻野 広司, 村田 和真, 武田 龍, 奥乃 博, 特許第5150573号, 登録日平成24年12月7日. 特開2010-026513号, 2010年2月4日. 特願2009-166049号, 2009年7月14日. pdf
  93. 音分離装置、及び、それを備えたカメラユニット. 発明者:梅田 修志, 堀邊 隆介, 奥乃 博, 高橋 徹. 特開2012-238964号, 2012年12月6日. 特願2011-105404号, 2011年5月10日.
  94. 音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法, 発明者: 藤原 弘将, 奥乃 博, 後藤 真孝, 特許第5131904号,登録日: 2012年11月16日. 特開2008-134606号, 2008年6月12日. 特願2007-233682号, 2007年9月10日. pdf
  95. Language Understanding Device. Inventors: Mikio Nakano, Hiroshi Okuno, Kazunori Komatani, Yuichiro Fukubayashi, Kotaro Funakoshi. Patent No. US 8,244,522, Date of Patent: Aug. 14, 2012. Date of Application: May 20, 2008.
  96. Sound source separation system, sound source separation method, and computer program for sound source separation. Inventors: Katsutoshi Itoyama, Hiroshi Okuno, and Masataka Goto. Patent No. US 8,239,052, Date of Patent: Aug. 7, 2012. Date of Application: Apr. 14, 2008.
  97. 楽譜位置推定装置、及び楽譜位置推定方法, 発明者: 中臺 一博, 大塚 琢馬, 奥乃 博 特開2012-168538号, 2012年9月6日. 特願2012-29802号, 2012年2月14日
  98. 言語理解装置, 発明者: 中野 幹生, 奥乃 博, 福林 雄一朗, 船越 孝太郎, 特許第5066483号,登録日: 2012年8月17日. 特開2008-293019号, 2008年12月4日. 特願2008-134401号, 2008年5月22日. pdf
  99. Moving Object Equipped with Ultra-Directional Speaker. Masamitsu Ishii, Shinichi Sakai, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, Europian Patent EP 1,715,717, Publication Date: 04/18/2012 Filing Date: 02/10/2005
  100. Sound source tracking system, method and robot. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Yuji Hasegawa, and Hiroshi Okuno. Patent No. US 8,155,331, Date of Patent: Apr. 10, 2012. Date of Application: May 9, 2007.

2012年度 o 2011年度(奥乃・尾形研究室)o 2010年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 平澤 恭治 : Under-Determined Blind Speech Separation Using a GMM-Based Sound Spectral Model. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
  2. 西川 直毅: 音楽情報検索のための歌詞と音響特徴量を用いた楽曲印象軌跡推定. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
  3. 阿曽 慎平: 歌声話声自動識別及び歌声の話声自動変換への応用. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
  4. Angelica Lim: Design and Implementation of Emotions for Humanoid Robots based on the Modality-independent DESIRE Model. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
  5. 高野 秀樹: 信頼度による調選択を用いた転調に適応可能な音楽音響信号に対する 自動和音進行認識システム, 修士論文 (指導教員: 奥乃博教授), Aug. 2011.
  6. 山川 暢英: 突発性音事象の Matching Pursuit と Formant-wave function による認識と その擬音語変換のための特徴量設計と音源適応, 修士論文 (指導教員: 奥乃博教授), Aug. 2011.

  7. 平山 直樹: 共通語を中間言語とするWFSTを用いた日本語方言変換システム 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2012.
  8. 山村 祐介: 同時複数音源に対する擬音語による音源選択システム 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2012.
  9. 黄 楊暘: 音声特徴を用いるパーティクルフィルタによる複数音源追跡の精度向上 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2012.
  10. 望月 敬太: 段階的に構造化する神経力学モデルを用いた人間とロボットの発達的模倣学習 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2012.
  11. 山口 雄紀: 神経力学モデルを用いた道具身体化モデルによる道具機能表現の獲得 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2012.
  12. 壷内 将之: 軟関節をもつ人間型ロボットにおける神経力学モデルを用いたダイナミック動作の学習 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2012.

    査読つきジャーナル論文

  13. Angelica Lim, Takeshi Mizumoto, Tetsuya Ogata, Hiroshi G. Okuno: A musical robot that synchronizes with a co-player using non-verbal cues, Advanced Robotics, Special Issue on Cutting Edge of Robtics in Japan, Vol.26, Issue 3-4 (Jan. 2012) pp.363-381. doi:10.1163/156855311X614626 IF: 0.510
  14. Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: Towards expressive musical robots: A cross-modal framework for emotional gesture, voice and music, EURASIP Journal on Audio, Speech, and Music Processing, 2012:3, Published: 17 January 2012. doi:10.1186/1687-4722-2012-3 IF: 0.382
  15. Tatsuhiko Itohara, Takuma Otsuka, Takeshi Muzumoto, Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: A multi-modal tempo and beat tracking system based on audio-visual information from live guitar performances. EURASIP Journal on Audio, Speech, and Music Processing, 2012, 2012:6, Published: 20 January 2012. doi:10.1186/1687-4722-2012-6 IF: 0.382
  16. Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Efficient Blind Dereverberation and Echo Cancellation based on Independent Component Analysis for Actual Acoustic Signals, Neural Computation, Vol.24, Issue 1 (Jan. 2012) pp. 234-272, MIT Press. doi:10.1162/NECO_a_00219 Posted online Dec. 9, 2011. IF: 2.290
  17. Tsuyoshi Tasaki, Fumio Ozaki, Nobuto Matsuhira, Tetsuya Ogata, Hiroshi G. Okuno: People Detection Based on Spatial Mapping of Friendliness and Floor Boundary Points for a Mobile Navigation Robot, Journal of Robotics, vol. 2011, Article ID 683975, 10 pages, 2011. doi:10.1155/2011/683975 Hindawi Publishing Corp.
  18. 駒谷 和範, 松山 匡子, 武田 龍, 高橋 徹, 尾形 哲也, 奥乃 博: 発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム, 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3374-3385, IPSJ. pdf, DL
  19. 森 信介, 駒谷 和範, 勝丸 真樹, 尾形 哲也, 奥乃 博: 音声対話システムにおける簡略表現認識のための自動語彙拡張, 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3398-3407. pdf, DL
  20. リム アンジェリカ, 水本 武志, 大塚 琢馬, 古谷 ルイ賢造, 尾形 哲也, 奥乃 博: 音楽共演ロボット: 開始・終了キューの画像認識による人間のフルート奏者との実時間同期, 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3599-3610. pdf, DL
  21. 安良岡 直希, 吉岡 拓也, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: フレーズ置換のための調波非調波GMM・ NMFに基づく音源分離・演奏合成, 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3839-3852, IPSJ. pdf, DL
  22. Hiromasa Fujihara, Masataka Goto, Jun Ogata, Hiroshi G. Okuno: LyricSynchronizer: Automatic Synchronization Method Between Musical Audio Signals and Lyrics, IEEE Journal of Selected Topics in Signal Processing, Vol.5, No.6 (Oct. 2011) pp.1252-1261, doi:10.1109/JSTSP.2011.2159577
  23. Tetsuya Ogata, Tetsuo Sawaragi, Tadahiro Taniguchi: Preface, Advanced Robotics, Vol.25, Issue 17 (Jan. 2011) pp. 2125-2126. doi:10.1163/016918611X59476
  24. Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno: Classification of Known and Unknown Environmental Sounds based on Self-organized Space using Recurrent Neural Network, Advanced Robotics, Vol.25, Issue 17 (Jan. 2011) pp. 2127-2141. doi:10.1163/016918611X595017
  25. Shun Nishide, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Towards Written Text Recognition based on Handwriting Experiences using Recurrent Neural Network, Advanced Robotics, Vol.25, Issue 7 (Jan. 2011) pp.2173-2187. doi:10.1163/016918611X595026
  26. Takeshi Mizumoto, Ikkyu Aihara, Takuma Otsuka, Ryu Takeda, Kazuyuki Aihara, Hiroshi G. Okuno: Sound imaging of nocturnal animal calls in their natural habitat, Journal of Comparative Physiology A: Neuroethology, Sensory, Neural, and Behavioral Physiology, Vol.197, No.9, 915-921, Online First, 17 May 2011. doi:10.1007/s00359-011-0652-7 pdf, html, Supplementary material at MetaPress.
  27. Wataru Hinoshita, Horiaki Arie, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Emergence of Hierarchical Structure mirroring Linguistic Composition in a Recurrent Neural Network, Neural Networks, Vol.24, Issue 4 (May 2011) pages 311-320, Elsevier. doi:10.1016/j.neunet.2010.12.006
  28. 中臺 一博, 奥乃 博: ロボット聴覚用オープンソースソフトウェア HARKの展開, デジタルプラクティス, 特集「世界に飛び出す日本のソフトウエア」, Vol.2, No.2 (Apr. 2011) pp.133-140, 情報処理学会. pdf
  29. 須見 康平, 糸山 克寿, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: ベース音高と和音特徴の統合に基づく和音系列認識, 情報処理学会論文誌, Vol.52, No.4 (Apr. 2011) pp.1803-1812. pdf, pdf, DL

    章分担・解説

  30. Kohei Nagira, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Complex Extension of Infinite Sparse Factor Analysis for Blind Source Separation of Speech Signals, F. Theis et al. (Eds.): LVA/ICA 2012, Lecture Notes in Computer Science 7191, pp. 388-396, 2012. Tel-Aviv, Israel, Mar. 12-15, 2012. doi:10.1007/978-3-642-28551-6_48
  31. Yasuharu Hirasawa, Naoki Yasuraoka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: A GMM Sound Source Model for Blind Speech Separation in Under-determined Condisions, F. Theis et al. (Eds.): LVA/ICA 2012, Lecture Notes in Computer Science 7191, pp. 446-453, 2012. Tel-Aviv, Israel, Mar. 12-15, 2012. doi:10.1007/978-3-642-28551-6_55
  32. Hiromitsu Awano, Shun Nishide, Hiroaki, Arie, June Tani, Hiroshi G. Okuno, Tetsuya Ogata: Use of a Sparse Structure to Improve Learning Performance of Recurrent Neural Networks, Neural Information Processing, Lecture Notes in Computer Science, Vol.7064, pp.323-331, Springer-Verlag, Shanghei, Nov. 13-17, 2011. doi:10.1007/978-3-642-24965-5_36
  33. Kazunori Komatani, Kyoko Matsuyama, Ryu Takeda, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Spoken Dialogue System that uses Utterance Timing to Interprete User Utterances, R.L-C. Delgado and T. Kobayashi (Eds.): Proceedings of the Paralinguistic Information and its Integration in Spoken Dialogue Systems Workshop, pp.315-326, Springer, Sep. 2011. doi:10.1007/978-1-4614-1335-6
  34. 湯淺 太一, 奥乃 博, 尾形 哲也: ぺた語義: 京大における Lisp を使ったプログラミング教育, 情報処理, Vol.52, No.9 (Sep. 2011), pp.1191-1194, 情報処理学会. 電子図書館
  35. 奥乃 博: 東日本大震災 危機発生時の対応について考える: 15.災害復旧支援・原子力事故対策ロボット, 情報処理, Vol.52, No.9 (Sep. 2011) pp.1090-1091, 情報処理学会. 電子図書館
  36. 奥乃 博: ロボット聴覚, 日本ロボット学会編『ロボットテクノロジー』304p, オーム社, 2011.
  37. Yasuharu Hirasawa, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Robot with Two Ears Listens to More Than Two Simultaneous Utterances by Exploiting Harmonic Structures, K.G. Mehrotra et al. (Eds.): Modern Approaches in Applied Intelligence (IEA/AIE-2011), LNAI 6703, pp.348-358. Springer. Syracuse, NY, June 28 - July 1, 2011. doi: 10.1007/978-3-642-21822-4_35
  38. Nobuhide Yamakawa, Toru Takahashi, Tetsuro Kitahara, Tetsuya Ogata, Hiroshi G. Okuno: Environmental Sound Recognition for Robot Audition using Matching-pursuit, Modern Approaches in Applied Intelligence (IEA/AIE-2011), LNAI 6704, pp.1-10. Springer. Syracuse, NY, June 28 - July 1, 2011. doi: 10.1007/978-3-642-21827-9_1
  39. Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno: Cluster Self-organization of Known and Unknown Environmental Sounds using Recurrent Neural Network, T. Honkela, W. Duch, M. A. Girolami, S. Kaski (Eds.): Artificial Neural Networks and Machine Learning - ICANN 2011, LNCS 6791, pp.167-175, Springer, (58%, 108/185), Espoo, Finland, June 14-17, 2011. doi:10.1007/978-3-642-21735-7_21
  40. Hiroshi G. Okuno, Kazuhiro Nakadai, Hyun-Don Kim: Robot Audition: Missing Feature Theory Approach and Active Audition, K. Pradalier, R. Siegward, and G. Hirzinger (Eds.): Robotics Research, STAR 70, pp.227-244, Springer-Verlag. doi:10.1007/978-3-642-19457-3_14

    国際会議論文

  41. Daichi Sakaue, Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: INITIALIZATION-ROBUST MULTIPITCH ESTIMATION BASED ON LATENT HARMONIC ALLOCATION USING OVERTONE CORPUS, Proceedings of 2012 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2012), pp.425-428, IEEE, Kyoto, Japan, March 25-30, 2012. pdf doi: 10.1109/ICASSP.2012.6287907
  42. Harumitsu Nobuta, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Identification of self-body based on dynamic predictability using neuro-dynamical system, Proceedings of 2011 IEEE/SICE International Symposium on System Integration (SII 2011), pp.256-261, Dec. 20-22, 2011, Kyoto. doi: 10.1109/SII.2011.6147456
  43. Shotaro Sano, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Predicting Listener Back-Channels for Human-Agent Interaction using Neuro-dynamical Model, Proceedings of 2011 IEEE/SICE International Symposium on System Integration (SII 2011), pp.18-23, Dec. 20-22, 2011, Kyoto. doi:10.1145/10.1109/SII.2011.6147412
  44. Naoki Nishikawa, Hiromasa Fujihara, Masataka Goto, Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: A Musical Mood Trajectory Estimation Method Using Lyrics and Acoustic Features, Proceedings of International ACM Workshop on Music Information Retrieval with User-Centered and Multimodal Strategies (MIRUM'11), 51-56, ACM, Nov. 28 - Dec. 1, 2011, Scottsdale, AZ. doi:10.1145/2072529.2072543
  45. Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: Converting emotional voice to motion for robot telepresence, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2011), 472-479 IEEE, Bled, Slovenia, Oct. 26-28, 2011. doi:10.1109/Humanoids.2011.6100891
  46. Takuma Otsuka, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: Incremental Bayesian Audio-to-Score Alignment with Flexible Harmonic Structure Models, Proceedings of 12th International Society for Musical Information Retrieval Conference (ISMIR-2011), pp.525-530 Miami, FL, Oct. 24-28. 2011. PDF pdf
  47. Angelica Lim, Takeshi Muzumoto, Takuma Otsuka, Tatsuhiko Itohara, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: More cowbell! A musical ensemble with the NAO thereminist, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), IROS 2011 Standard Platform Demo, IEEE, RSJ, San Francisco, 25-30 Sep. 2011.
  48. Tatsuhiko Itohara, Takeshi Muzumoto, Takuma Otsuka, Tetsuya Ogata, Hiroshi G. Okuno: Particle-filter Based Audio-visual Beat-tracking for Music Robot Ensemble with Human Guitarist, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), pp.118-124, (790/2459 =32.1%), IEEE, RSJ, San Francisco, 25-30 (26) Sep. 2011. doi:10.1109/IROS.2011.6094773 IEEE Robotics and Automation Society Japan Chapter Young Award pdf
  49. Eui-Hyun Kim, Takeshi Muzumoto, Tetsuya Ogata, Hiroshi G. Okuno: Improvement of Speaker Localization by Considering Multipath Interference of Sound Wave for Binaural Robot Audition, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), pp.2910-2915, (790/2459 =32.1%), IEEE, RSJ, San Francisco, 25-30 Sep. 2011. doi:10.1109/IROS.2011.6094778 pdf
  50. Patrick Danes, Hiroshi G. Okuno: An Overview of the BINAAHR Project, Semi-Plenary Invited Talk, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), 26 Sep. 2011.
  51. Shun Nishide, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Handwriting Prediction Based Character Recognition using Recurrent Neural Network, Proceeding of IEEE International Conference on Systems, Man, and Cybernetics (SMC 2011), pp.2549-2554, 9-12 Oct. 2011. doi:10.1109/ICSMC.2011.6084060
  52. Takuma Otsuka, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: Bayesian Extension of MUSIC for Sound Source Localization and Tracking, Proceedings of International Conference on Spoken Language Processing (Interspeech 2011), pp.3109-3112, (oral), Aug. 30, 2011. Florence, Italy. pdf
  53. Yasuharu Hirasawa, Naoki Yasuraoka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Fast and simple iterative algorithm of Lp-norm minimization for under-determined speech separation, Proceedings of International Conference on Spoken Language Processing (Interspeech 2011), pp.1745-1748, Florence, Italy, Aug. 29, 2011. pdf
  54. Mikio Nakano, Shun Sato, Kazunori Komatani, Kyoto Matsuyama, Kotaro Funakoshi, Hiroshi G. Okuno: A Two-Stage Domain Selection Framework for Extensible Multi-Domain Spoken Dialogue Systems, Proceedings of the 12th SIGDIAL Meeting on Discourse and Dialogue (SIGDIAL 2011), pp.18-29, accepted as an oral presentation, June 17-18, 2011, Portland, OR, USA. pdf Best paper award nomination finalist (4 papers)
  55. Katsutoshi Itoyama, Masataka Goto, Tetsuya Ogata, Hiroshi G. Okuno: SIMULTANEOUS PROCESSING OF SOUND SOURCE SEPARATION AND MUSICAL INSTRUMENT IDENTIFICATION USING BAYESIAN SPECTRAL MODELING, Proceedings of 2011 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.3816-3819, Poster, IEEE, Prague, Czech Republic, May 22-28, 2011. pdf doi:10.1109/ICASSP.2011.5947183
  56. Akira Maezawa, Hiroshi G. Okuno, Tetsuya Ogata, Masataka Goto: POLYPHONIC AUDIO-TO-SCORE ALIGNMENT BASED ON BAYESIAN LATENT HARMONIC ALLOCATION HIDDEN MARKOV MODEL, Proceedings of 2011 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.185-188, Poster, IEEE, Prague, Czech Republic, May 22-28, 2011. pdf doi:10.1109/ICASSP.2011.5946371
  57. Naoki Yasuraoka, Hirokazu Kameoka, Takuya Yoshioka, Hiroshi G. Okuno: I-DIVERGENCE-BASED DEREVERBERATION METHOD WITH AUXILIARY FUNCTION APPROACH, Proceedings of 2011 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.369-372, Poster, IEEE, Prague, Czech Republic, May 22-28, 2011. pdf doi:10.1109/ICASSP.2011.5946417
  58. Takeshi Mizumoto, Takami Yoshida, Kazuhiro Nakadai, Ryu Takeda, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno: Design and Implementation of Selectable Sound Separation on a Texai Telepresence System using HARK, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2011), pp.2130-2137, May 9-13 (10), 2011, Shanghai, China. pdf doi:10.1109/ICRA.2011.5979849

    口頭発表(研究会・全国大会)

  59. 阪上 大地, 吉岡 拓也, 奥乃 博: 占有的基底インデクスを用いた対数正規行列分解に基づく音声と音楽の分離, 日本音響学会2012年春季研究発表会, 13 Mar. 2012. 東京.
  60. 西川 直毅, 糸山 克寿, 藤原 弘将, 後藤 真孝, 尾形 哲也, 奥乃 博: 楽曲印象軌跡に基づく楽曲検索システムの実装と評価, 情報処理学会第74回全国大会, 1S-7, 6 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
    情報処理学会 第74回全国大会 学会推奨 修士論文認定, 2012年5月.
  61. 山口 雄紀, 信田 春満, 西出 俊, 奥乃 博, 尾形 哲也: 神経回路モデルを用いた道具身体化モデルによる道具機能表現の獲得, 情報処理学会第74回全国大会, 4Q-3, 7 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
  62. 矢澤 一樹, 阪上 大地, 糸山 克寿, 尾形 哲也, 奥乃 博: 押弦制約付きギター演奏自動採譜システム, 情報処理学会第74回全国大会, 4S-6, 7 Mar. 2012. 名古屋工業大学. pdf
  63. 阪上 大地, 糸山 克寿, 尾形 哲也, 奥乃 博: 倍音コーパスを用いた初期値依存性の低い多重基本周波数推定法, 情報処理学会第74回全国大会, 4S-7, 7 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
  64. 柳楽 浩平, 高橋 徹, 尾形 哲也, 奥乃 博: Complex Infinite Sparse Factor Analysisによる周波数領域での音声信号のブラインド音源分離, 情報処理学会第74回全国大会, 4U-1, 7 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
  65. 平澤 恭治, 安良岡 直希, 高橋 徹, 尾形 哲也, 奥乃 博: マイク数以上の同時発話分離のための調波:非調波音源モデルの検討. 情報処理学会第74回全国大会, 4U-2, 7 Mar. 2012. 名古屋工業大学. pdf
  66. 黄 楊暘, 大塚 琢馬, 高橋 徹, 尾形 哲也, 奥乃 博: パーティクルフィルタを用いた動的環境下の複数音源追跡, 情報処理学会第74回全国大会, 4U-4, 7 Mar. 2012. 名古屋工業大学. pdf
  67. 山村 祐介, 高橋 徹, 尾形 哲也, 奥乃 博: 複数音源下での擬音語による音源選択システム, 情報処理学会第74回全国大会, 4U-7, 7 Mar. 2012. 名古屋工業大学. pdf
  68. 壷内 将之, 尾形 哲也, 奥乃 博, 西出 俊, 信田 春満: 柔軟関節をもつ人間型ロボットにおける神経力学モデルを用いたダイナミック動作の模倣, 情報処理学会第74回全国大会, 5P-7, 8 Mar. 2012. 名古屋工業大学. pdf
  69. 信田 春満, 河本 献太, 野田 邦昭, 佐部 浩太郎, 奥乃 博, 尾形 哲也: 再帰型神経回路モデルを用いた視野変化予測と場所知覚ニューロンの発現, 情報処理学会第74回全国大会, 5P-8, 8 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
  70. Angelica Lim, 尾形 哲也, 奥乃 博: The DESIRE Model: Cross-modal emotion analysis and expression for robots, 情報処理学会第74回全国大会, 5ZA-4, 8 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
  71. 望月 敬太, 信田 春満, 西出 俊 奥乃 博, 尾形 哲也: 段階的に構造化する神経回路モデルを用いたロボットと人間の発達的インタラクション, 情報処理学会第74回全国大会, 5ZA-5, 8 Mar. 2012. 名古屋工業大学. pdf
  72. 平山 直樹, 高橋 徹, 尾形 哲也, 奥乃 博: 発話中の方言変化に頑健な方言変換システム, 情報処理学会第74回全国大会, 6U-8, 8 Mar. 2012. 名古屋工業大学. 学生奨励賞 pdf
  73. 阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: アクセント特徴量を用いた歌声と朗読音声の識別システム, 情報処理学会第74回全国大会, 6U-9, 8 Mar. 2012. 名古屋工業大学. pdf
  74. 阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: スペクトル変化量のピーク間隔・F0・MFCCを用いた歌声と朗読音声の自動識別システム, 第94回音楽情報科学研究会, Vol.2012-MUS-94, pp. 舘山寺温泉, 情報処理学会, Feb. 2012.
  75. 安良岡 直希, 奥乃 博: 調波・非調波・音色構造因子分解による音響信号分析と音源分離インターフェースへの応用, 第94回音楽情報科学研究会, Vol.2012-MUS-94, pp. 舘山寺温泉, 情報処理学会, Feb. 2012.
  76. 糸山 克寿, 尾形 哲也, 奥乃 博: 音響特徴・ベース音・和音遷移を用いた自動和音認識, 第94回音楽情報科学研究会, Vol.2012-MUS-94, pp. 舘山寺温泉, 情報処理学会, Feb. 2012.
  77. 柳楽 浩平, 高橋 徹, 尾形 哲也, 奥乃 博: Infinite Sparse Factor Analysis の複素拡張による音声信号のブラインド音源分離, 日本音響学会関西支部第14回若手研究者交流研究発表会, Dec. 18, 2011, 若手優秀賞・関西支部長賞
  78. 大塚 琢馬, 中臺 一博, 尾形 哲也, 奥乃 博: 音源定位手法MUSICのベイズ拡張, 第34回 AI チャレンジ研究会, SIG-Challenge-B102-6, pp.4-25~4-30, 人工知能学会, Dec. 2011. 慶応義塾大学. pdf
  79. 柳楽 浩平, 高橋 徹, 尾形 哲也, 奥乃 博: ブラインド音源分離のためのInfinite Sparse Factor Analysisの複素拡張, 第34回 AI チャレンジ研究会, SIG-Challenge-B102-9, pp.4-43~4-48, 人工知能学会, Dec. 2011. 慶応義塾大学. pdf
  80. 糸原 達彦, 水本 武志, Angelica Lim, 大塚 琢馬, 中村 圭佑, 長谷川 雄二, 中臺 一博, 尾形 哲也, 奥乃 博: マルチロボットによるKinectを用いた同期合奏, 第34回 AI チャレンジ研究会, SIG-Challenge-B102-10, pp.4-49~4-54, 人工知能学会, Dec. 2011. 慶応義塾大学. pdf
  81. Angelica Lim, 水本 武志, 大塚 琢馬, 糸原 達彦, 中臺 一博, 尾形 哲也, 奥乃 博: An interactive musical ensemble with the NAO Thereminist, 第34回 AI チャレンジ研究会, SIG-Challenge-A, pp. 人工知能学会, Dec. 2011. 慶応義塾大学.
  82. Uihyun Kim, Tetsuya Ogata, Hiroshi G. Okuno: Improved Statistical Model-Based Voice Activity Detection with Noise Reduction for the SIG-2 Humanoid Robot, 日本ロボット学会第29回学術講演会, 1Q1-7, 芝浦工業大学, Sep. 7-9, 2011. pdf
  83. Louis Kenzo Cahier, Tetsuya Ogata, Hiroshi G. Okuno: Fast Incremental Probabilistic Surface Recognition for Robot Scene Understanding, 日本ロボット学会第29回学術講演会, 1Q2-3, 芝浦工業大学, Sep. 7-9, 2011. pdf
  84. Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: Improving social telepresence by converting emotional voice to robot gesture, 日本ロボット学会第29回学術講演会, 1Q3-7, 芝浦工業大学, Sep. 7-9, 2011. pdf
  85. Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Nakamura Keisuke, Yoshida Takami, Mizumoto Takeshi Otsuka Takuma Ince Gohkan: Introduction to Open Source Robot Audition Software HARK, 日本ロボット学会第29回学術講演会, 2Q2-6, 芝浦工業大学, Sep. 7-9, 2011. pdf
  86. 尾形 哲也, 日下 航, 奥乃 博: 神経力学モデルによる文字列からの言語構造の自己組織化とロボット運動感覚との統合, 日本ロボット学会第29回学術講演会, 1A3-6, 芝浦工業大学, Sep. 7-9, 2011. pdf
  87. 高橋 徹, 中臺 一博, 石井 Carlos 寿憲, Jani Even, 奥乃 博: 実環境下での音源定位・音源検出の検討, 日本ロボット学会第29回学術講演会, 1F3-3, 芝浦工業大学, Sep. 7-9, 2011. pdf
  88. 水本 武志, 尾形 哲也, 奥乃 博: テルミン演奏ロボットのためのUnscented Kalman Filter による適応的音高制御, 日本ロボット学会第29回学術講演会, 3A2-1, 芝浦工業大学, Sep. 7-9, 2011. pdf
  89. 糸原 達彦, 大塚 琢馬, 水本 武志, 尾形 哲也, 奥乃 博: パーティクルフィルタを用いたギター演奏の視聴覚統合ビートトラッキング, 日本ロボット学会第29回学術講演会, 3A2-2, 芝浦工業大学, Sep. 7-9, 2011. pdf
  90. 平澤 恭治, 安良岡 直希, 高橋 徹, 尾形 哲也, 奥乃 博: 調波・非調波音源モデルを用いたマイク数以上の音源分離, 日本ロボット学会第29回学術講演会, 3A2-4, 芝浦工業大学, Sep. 7-9, 2011. pdf
  91. 柳楽 浩平, 高橋 徹, 尾形 哲也, 奥乃 博: ノンパラメトリックベイズによる時間周波数領域における音声信号のブラインド音源分離 , 日本ロボット学会第29回学術講演会, 3A2-5, 芝浦工業大学, Sep. 7-9, 2011. pdf
  92. 大塚 琢馬, 尾形 哲也, 奥乃 博: MUSIC 法を用いた音源定位のベイズ拡張, 日本ロボット学会第29回学術講演会, 3A3-2, 芝浦工業大学, Sep. 7-9, 2011. pdf
  93. 信田 春満, 西出 俊 奥乃 博 尾形 哲也: 神経力学モデルによる身体図式に基づく空間地図の獲得, 日本ロボット学会第29回学術講演会, 3N1-5, 芝浦工業大学, Sep. 7-9, 2011. pdf
  94. 佐野 正太郎, 西出 俊 奥乃 博 尾形 哲也: 対話データの再帰結合神経回路による学習と相槌タイミング予測, 日本ロボット学会第29回学術講演会, 32-1, 芝浦工業大学, Sep. 7-9, 2011. pdf
  95. 西川 直毅, 糸山 克寿, 藤原 弘将, 後藤 真孝, 尾形 哲也, 奥乃 博: 歌詞と音響特徴量を用いた楽曲印象軌跡推定法の設計と評価, 第91回音楽情報科学研究会, Vol.2011-MUS-91, pp. 関西学院大学, 三田, 情報処理学会, Jul. 2011.
  96. 前澤 陽, 糸山 克寿, 尾形 哲也, 奥乃 博: MAHL: 演奏者間のインタラクション分析のためのスコアアライメント手法, 第91回音楽情報科学研究会, Vol.2011-MUS-91, pp. 関西学院大学, 三田, 情報処理学会, Jul. 2011.
  97. 山川 暢英, 北原 鉄朗, 高橋 徹, 尾形 哲也, 奥乃 博: 擬音語と環境音の音響的関係性を考慮した環境音to擬音語変換システム, 2011年度人工知能学会全国大会, 1C2-OS4b-4, 岩手, June 1, 2011.
  98. 佐藤 隼, 中野 幹生, 駒谷 和範, 船越 孝太郎, 奥乃 博: ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク, 第86回音声言語情報処理研究会(SIG-SLP), 情処研報, 情報処理学会, 2011.

    特許・ディジタルコンテンツ

  99. 楽曲推薦システム, 楽曲推薦方法及び楽曲推薦用コンピュータプログラム, 発明者: 後藤真孝, 吉井和佳, 奥乃 博, 特許第4953478号, 登録日平成24年3月23日. 特願2007-199936号, 2007年7月31日. pdf
  100. 会話システムおよび会話ソフトウエア, 発明者: 中野 幹夫, 奥乃 博, 駒谷 和範, 特許第4950024号, 登録日平成24年3月16日. 国際公開番号: WO2006/093092, 国際公開日:2006年9月8日, 発行日:2008年8月7日. 特願2007-505922号, 出願日平成18年2月22日, 国際出願番号:PCT/JP2006/303613 国際出願日:2006年2月27日. pdf
  101. 対話処理装置、対話処理方法、及び対話処理プログラム. 発明者: 中野幹生, 船越孝太郎, 駒谷和範, 奥乃 博, 佐藤隼. 特開2012-42952号, 2012年3月1日. 特願2011-175395号, 2011年8月10日.
  102. Voice Recognition System. Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto, Europian Patent EP 1,818,909, Publication Date: 04/18/2012 Filing Date: 02/10/2005
  103. Speech recognition apparatus and method recognizing a speech from sound signals collected from outside. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, and Shunichi Yamamoto. Patent No. US 8,073,690, Date of Patent: Dec. 6, 2011. PCT Filed: Dec. 2, 2005. PCT No: PCT/JP2005/022601.
  104. 残響抑制装置,及び残響抑制方法. 発明者: 中臺一博, 武田 龍, 奥乃 博. 特開2011-232691号, 2011年11月17日. 特願2010-105369号, 2010年4月10日.
  105. 音声認識装置及び音声認識方法. 発明者: 中臺一博, 高橋 徹, 奥乃 博. 特開2011-191759号, 2011年9月29日. 特願2011-53124号, 2011年3月10日.
  106. ロボット、ロボット制御方法およびプログラム. 発明者: 中臺一博, 大塚琢馬, 奥乃 博. 特開2011-189439号, 2011年9月29日. 特願2010-56265号, 2010年3月12日.
  107. 楽譜位置推定装置、楽譜位置推定方法、及び楽譜位置推定プログラム. 発明者: 中臺一博, 大塚拓馬, 奥乃 博. 特開2011-180590号, 2011年9月15日. 特願2011-37526号, 2011年2月23日.
  108. Speech recognition apparatus and method recognizing a speech from sound signals collected from outside. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, and Shunichi Yamamto. Patent No. US 8,073,690, Date of Patent: Dec. 6, 2011. Date of Application: Dec. 2, 2005.
  109. Automatic system for temporal alignment of music audio signal with lyrics, Inventors: Masataka Goto, Hiromasa Fujihara, and Hiroshi Okuno. Patent No. US 8,005,666, Date of Patent: Aug. 23, 2011. Date of Application: Aug. 7, 2007.
  110. Robot. Inventors: Kazuhiro Nakadai, Yuji Hasewaga, Hiroshi Tsujino, Kazumasa Murata, Ryu Takeda, and Hiroshi Okuno. Patent No. US 7,999,168, Date of Patent: Aug. 16, 2011. Application Filed: July 15, 2009. Aplication No: 12/503,448.
  111. Sound-source separation system. Inventors: Ryu Takeda, Kazuhiro Nakadai, Hiroshi Tsujino, and Hiroshi Okuno. Patent No. US 7,987,090, Date of Patent: July 26, 2011. Application Filed: Aug. 7, 2008. Aplication No: 12/187,684.
  112. 音源探索装置. 発明者:堀邊 隆介, 梅田 修志, 田中 史記, 猪田 岳司, 奥乃 博, 高橋 徹. 特開2011-124749号, 2011年6月23日. 特願2009-280115号, 2009年12月10日.
  113. テルミン演奏ロボット. 発明者: 辻野 広司, 奥乃 博, 水本 武志. 特開2011-81380号, 2011年4月21日. 特願2010-226106号, 2010年10月5日.

2011年度 o 2010年度(奥乃・尾形研究室)o 2009年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 武田 龍: A Unified Framework of Blind Separation, Blind Dereverberation and Self-Voice Cancellation for Real-Time Robot Audition (実時間ロボット聴覚のためのブラインド分離,ブラインド残響除去,自己発話抑制の統一的枠組み), 博士論文 (指導教員: 奥乃博教授), Jan. 2011.
  2. 糸山 克寿: , Source Separation of Musical Instrument Sounds in Polyphonic Musical Audio Signal and Its Application (多重奏音楽音響信号に対する楽器音の分離とその応用), 博士論文 (指導教員: 奥乃博教授), Feb. 2011.

  3. 大塚 琢馬: Real-time Audio-to-Score Alignment using Particle Filter for Co-player Robots (共演者音楽ロボットのためのパーティクルフィルタを用いた実時間楽譜追従手法), 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
  4. 日下 航: 神経力学モデルを用いたロボットによる言語と感覚運動系の統合的認知, 修士論文 (指導教員: 尾形哲也准教授), Feb. 2011.
  5. 前澤 彰: Score-Aided Inference of Classical Music Interpretation (楽譜を援用したクラシック音楽解釈の推論), 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
  6. 松山 匡子: 発語行為レベルの情報をユーザの意図解釈に用いた音声対話システム, 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
  7. 安良岡 直希: 調波パラメトリックNMF及びIダイバージェンス規準残響推定に基づく音響信号モデリングとフレーズ置換への応用, 修士論文 (指導教員: 奥乃博教授), Feb. 2011.

  8. 糸原 達彦: ギター奏者と合奏する音楽ロボットのためのパーティクルフィルタを用いた 視聴覚統合ビートトラッキング, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2011.
  9. 佐野 正太郎: 神経力学モデルを用いた相槌タイミングの予測, 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2011.
  10. 柳楽 浩平: isFAを用いた時間周波数領域における実音声信号のブラインド音源分離, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2011.
  11. 信田 春満: 神経力学モデルによる予測可能性を用いた視野内動領域からの身体識別及び 身体図式獲得, 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2011.

  12. 張 陽: Prediction and Classification of Environmental Sounds using Recurrent Neural Network, Master Thesis (指導教員: 尾形哲也准教授), Sep. 2010.

    査読つきジャーナル論文

  13. Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno, Kazuyuki Aihara: Complex and Transitive Synchronization in a Frustrated System of Calling Frogs, Physical Review E, Vol.83, Issue 3. 031913 (2011) [5 pages], 21 Mar. 2011. doi:10.1103/PhysRevE.83.031913
  14. Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Query-by-Example Music Information Retrieval by Score-Informed Source Separation and Remixing Technologies, EURASIP Journal on Advances in Signal Processing, Vol.2010, Article ID 172961, 14 pages, Hindawi Pub., Jan. 2011. online page, doi:10.1155/2010/172961 IF: 0.81
  15. Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Audio-to-Score Alignment Using Particle Filter for Co-player Music Robots, EURASIP Journal on Advances in Signal Processing, Vol.2011, Article ID 384651, 13 pages, 2011, Hindawi Pub. online page, doi:10.1155/2011/384651 IF: 0.81
  16. Takuya Yoshioka, Tomohiro Nakatani, Masato Miyoshi, Hiroshi G. Okuno: Blind Separation and Dereverberation of Speech Mixtures by Joint Optimization, IEEE Transactions on Audio, Speech and Language Processing, Vol.19, Issue 1 (Jan. 2011) pp.69-84, IEEE. doi:10.1109/TASL.2010.2045183
  17. Mikio Nakano, Yuji Hasegawa, Kotaro Funakoshi, Yohane Takeuchi, Toyotaka Torii, Kazuhiro Nakadai, Naoyuki Kandai, Kazunori Komatani, Hiroshi G. Okuno, Hiroshi Tsujino: A multi-expert model for dialogue and behavior control of conversational robots and agents. Knowledge-Based Systems, Vol.24, No.2 (Mar. 2011) pp.248-256, Elsevier. doi:10.1016/j.knosys.2010.08.004, Preprint
  18. Kazunori Komatani, Yuichiro Fukubayashi, Satoshi Ikeda, Tetsuya Ogata, Hiroshi G. Okuno: Selecting Help Messages by Using Robust Grammar Verification for Handling Out-of-Grammar Utterances in Spoken Dialogue Systems. IEICE Transactions Information and Systems, Vol.E93-D, No.12 (Dec. 2010) pp.3359-3367. doi:10.1587/transinf.E93.D.3359
  19. 藤原 弘将, 後藤 真孝, 奥乃 博: 多重奏中の歌声の基本周波数と有声音素の同時推定手法, 情報処理学会論文誌, Vol.51, No.10 (Oct. 2010) pp.1995-2006. pdf, pdf, DL
  20. 水本 武志, 辻野 広司, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発, 情報処理学会論文誌, Vol.51, No.10 (Oct. 2010) pp.2007-2019. pdf, DL
  21. 吉田 尚水, 中臺 一博, 奥乃 博: ロボットを対象としたニ階層視聴覚情報統合音声認識システム, 日本ロボット学会誌, Vol.28, No.8 (Oct. 2010) pp.970-977. Abstract学会サーバ
  22. Tetsuya Ogata, Shun Nishide, Hideki Kozima, Kazunori Komatani, Hiroshi G. Okuno: Inter-modality Mapping in Robot with Recurrent Neural Network, Pattern Recognition Letters, Vol.31, Issue 12 (Sep. 2010) 1560-1569. doi:10.1016/j.patrec.2010.05.002
  23. 日下 航, 尾形 哲也, 小嶋 秀樹, 高橋 徹, 奥乃 博: RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーション の創発. 日本ロボット学会誌, Vol.28, No.4 (Apr. 2010) pp.532-543. Abstract学会サーバ
  24. 勝丸 真樹, 中野 幹生, 駒谷 和範, 船腰 孝太郎, 辻野 広司, 尾形 哲也, 奥乃 博: 複数の言語モデルと言語理解モデルによる音声理解の高精度化, 電子情報通信学会論文誌 D, 情報爆発特集号, Vol.J93-D, No.6 (Jun. 2010) pp.879-888, 電子情報通信学会. 学会サーバ
  25. Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino: Design and Implementation of Robot Audition System "HARK" - Open Source Software for Listening to Three Simulteaneous Speakers, Advanced Robotics, Vol.24, Issue 5-6 (Jan. 2010) pp. 739-761, VSP and Robotics Society of Japan. doi:10.1163/016918610X493561 IF: 0.510

    章分担・解説

  26. 奥乃 博, 中臺 一博: 多数の人の声を一度に聞き分ける聴覚技術 〜聖徳太子ロボットを目指して〜, 電気学会誌, 131巻3号 (Mar. 2011) pp.159-163. 電気学会.
  27. 尾形 哲也, 日下 航: ロボット間マルチモーダルコミュニケーションの記号過程, システム/制御/情報, Vol.54, No.11 (Nov. 2011) pp.434-439.
  28. Wataru Hinoshita, Horiaki Arie, Jun Tani, Tetsuya Ogata, Hiroshi G. Okuno: Recognition and Generation of Sentences through Self-organizing Linguistic Hierarchy using MTRNN, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6098, 42-51, Cordoba, Spain, June 1-4 (2), 2010. pdf
  29. Takuma Otsuka, Takeshi Mizumoto, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Music-ensemble robot that is capable of playing the theremin while listening to the accompanied music, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6096, 102-112, Cordoba, Spain, June 1-4 (2), 2010. pdf Best paper award, 平成22年度C&C若手優秀論文賞
  30. Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Violin Fingering Estimation Based on Violin Pedagogical Fingering Model Constrained by Bowed Sequence Estimation from Audio Input, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6098, 249-259, Cordoba, Spain, June 1-4 (3), 2010. pdf
  31. Kyoko Matsuyama, Kazunori Komatani, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Improving Identification Accuracy by Extending Acceptable Utterances in Spoken Dialogue System Using Barge-in Timing, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6097, 585-594, Cordoba, Spain, June 1-4 (3), 2010. pdf
  32. Shun Shiramatsu, Jun Takasaki, Tatiana Zidrasco, Tadachika Ozono, Toramatsu Shintani, Hiroshi G. Okuno: System for Supporting Web-based Public Debate Using Transcripts of Face-to-face Meeting, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6098, 311-320, Cordoba, Spain, June 1-4 (4), 2010. pdf
  33. Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno: An Improvement in Auido-Visual Voice Activity Detection for Automatic Speech Recognition, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6096, 51-61, Cordoba, Spain, June 1-4 (2), 2010. pdf

    国際会議論文

  34. Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno, Kazuyuki Aihara: Compelx Synchronization in a Frustrated System of Calling Frogs, The 1st International Symposium on Innovative Mathematical Modeling (ISIMM 2011), Feb. 28 - March 2, 2011. ISIMM 2011 BEST POSTER AWARD Silver Prize
  35. Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno: Method of Discriminating Known and Unknown Environmental Sounds using Recurrent Neural Network, Proceedings of oint 5th International Conference on Soft Computing and Intelligent Systems and 11th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2010), pp. 378-383, Okayama, JAPAN, December 8-12, 2010.
  36. Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Two-level Synchronization using Particle Filter for Co-player Music Robots, Proceedings of IEEE/RSJ-2010 Workshop on Robots and Musical Expression, CD-ROM, Oct. 18, 2010, Taipei, Taiwan. pdf
  37. Takeshi Mizumoto, Angelica Lim, Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno : Integration of flutist gesture recognition and beat tracking for human-robot ensemble, Proceedings of IEEE/RSJ-2010 Workshop on Robots and Musical Expression, CD-ROM, Oct. 18, 2010, Taipei, Taiwan. pdf
  38. Angelica Lim, Takeshi Mizumoto, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Programming by Playing and Approaches for Expressive Robot Performances, Proceedings of IEEE/RSJ-2010 Workshop on Robots and Musical Expression, CD-ROM, Oct. 18, 2010, Taipei, Taiwan. pdf
  39. Yasuharu Hirasawa, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Exploiting Harmonic Structures to Improve Separating Simultaneous Speech in Under-Determined Conditions (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.450-457 (49.1%), TuBT12.5, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5651078 pdf IEEE Robotics and Automation Society Japan Chapter Young Award
  40. Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: An Improvement in Automatic Speech Recognition Using Soft Missing Feature Masks for Robot Audition (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.964-969, TuCT12.2, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5650540 pdf
  41. Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno: Two-Layered Audio-Visual Speech Recognition for Robots in Noisy Environments (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.988-993, TuCT12.6, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5651205 pdf
  42. Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Speedup and Performance Improvement of ICA-based Robot Audition by Parallel and Resampling-based Block-wise Processing (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.1949-1954 (49.1%), TuET12.1, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5652757 pdf
  43. Takeshi Mizumoto, Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Human-Robot Ensemble between Robot Thereminst and Human Percussionist using Coupled Oscillator Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.1957-1962, TuET12.2, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5650364 pdf
  44. Angelica Lim, Takeshi Mizumoto, Lois-Kenzo Cahier, Takuma Otsuka, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Musical Accompaniment: Integrating Audio and Visual Cues for Real-time Synchronization with a Human Flutist (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.1964-1969, TuET12.3, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5650427 pdf IROS-2011NTF Award for Entertainment Robots and Systems.
  45. Shun Nishide, Tetsuya Ogata, Jun Tani, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Motion Generation Based on Reliable Predictability using Self-organized Object Features (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.3453-3458, WeCT13.2, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5652609 pdf
  46. Nobuhide Yamakawa, Tetsuro Kitahara, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Effects of modelling within- and between-frame temporal variations in power spectra on non-verbal sound recognition, Proceedings of International Conference on Spoken Language Processing (Interspeech 2010), 2342-2345, (oral), Makuhari, 29 Sep. 2010. pdf
  47. Kyoko Matsuyama, Kazunori Komatani, Ryu Takeda, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Analyzing User Utterances in Barge-in-able Spoken Dialogue System for Improving Identification Accuracy, Proceedings of International Conference on Spoken Language Processing (Interspeech 2010), 3050-3053, (acceptance rate 58.2%), Makuhari, 30 Sep. 2010. pdf
  48. Hideki Kawahara, Masanori Morise, Toru Takahashi, Hideki Banno, Ryuichi Nishimura, Toshio Irino: Simplification and extension of non-periodic excitation source representation for high-quality speech manipulation systems, Proceedings of International Conference on Spoken Language Processing (Interspeech 2010), 38-41, (oral), Makuhari, 27 Sep. 2010. pdf doi:10.1109/ICSMC.2010.5641924
  49. Kazunori Komatani, Hiroshi G. Okuno: Online Error Detection of Barge-In Utterances by Using Individual Users' Utterance Histories in Spoken Dialogue System, Proceedings of the 11th SIGDIAL Meeting on Discourse and Dialogue (SIGDIAL 2010), 289-296, Tokyo, Sep. 24-25, 2010. pdf pdf at SIGDial Server.
  50. Hiromitsu Awano, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Human-Robot Cooperation in Arrangement of Objects Using Confidence Measure of Neuro-dynamcal Systems, Proceeding of IEEE International Conference on Systems, Man, and Cybernetics (SMC 2010), pp. 2533-2538, June 2010.
  51. Shimpei Aso, Takuya Saitou, Masataka Goto, Katsutoshi Itoyama, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SpeakBySinging: Converting Singing Voices to Speaking Voices While Retaining Voice Timbre, Proceedings of the 13th International Conference on Digital Audio Effects (DAFx-10), 114-121, Graz, October, 2010, 公式pdf
  52. Kazunori Komatani, Masaki Katsumaru, Mikio Nakano, Kotaro Funakoshi, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Allocation of Training Data for Rapid Prototyping of Speech Understanding based on Multiple Model Combination, Proceedings of COLING 2010, accepted as poster presentation, (acceptance rate 42%), Beijing, China, September, 2010.
  53. Shun Shiramatsu, Tadachika Ozono, Toramatsu Shintani, Hiroshi G. Okuno: A Corpus-based Analysis of Coreferential Recency Effect in Japanese Discourse for Tracking Dynamic Topic. Proceedings of the 9th IEEE/ACIS International Conference on Computer and Information Science (ACIS-ICIS 2010), 645-650, Yamagata, Japan, Aug. 2010. doi:10.1109/ICIS.2010.65
  54. Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Query-by-Conducting: An interface to retrieve classical-music interpretations by real-time tempo input, Proceedings of 11th International Society for Musical Information Retrieval Conference (ISMIR-2010), 477-482, Dresden, Aug. 2010. 公式pdf
  55. Ikkyu Aihara, Takeshi Mizumoto, Ryu Takeda, Takuma Otsuka, Toru Takahashi, Kazuyuki Aihara, Hiroshi G. Okuno: Frustration in Synchronized Calling Behavior of Japanese Tree Frogs, Ninth International Congress of Neuroethology, P212 (poster), pp.328, pdf, Aug. 5-7 (6-7), 2010, Salamanca, Spain. (poster)
  56. Takeshi Mizumoto, Ikkyu Aihara, Takuma Otsuka, Ryu Takeda, Kazuyuki Aihara, Hiroshi G. Okuno: Sound imaging system for visualizing spatio-temporal behavior of calling nocturnal animals, Ninth International Congress of Neuroethology, P223 (poster), pp.339, pdf, Aug. 5-7 (6-7), 2010, Salamanca, Spain.
  57. Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Implementation of Two-level Synchronization for Interactive Music Robot, Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence (AAAI-10), 1138-1144 (26.9%, 264/982), July 11-15 (15), 2010, Atlanta, GA. pdf
  58. Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Improvement in Listening Capability for Humanoid Robot HRP-2. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2010), 470-475, (847/2062), May 3-8 (4), 2010, Anchorage, Aalaska, USA. pdf doi:10.1109/ROBOT.2010.5509830
  59. Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Upper-limit Evaluation of a Robot Audition based on ICA-BSS in Multi-source, Barge-in and Highly Reveberant Conditions. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2010), 4366-4371, (847/2062), May 3-8, 2010, Anchorage, Aalaska, USA. pdf doi:10.1109/ROBOT.2010.5509891

    口頭発表(研究会・全国大会)

  60. 松山 匡子, 駒谷 和範, 武田 龍, 尾形 哲也, 奥乃 博: 発語行為レベルの情報を用いた音声対話システム構築とデータ分析, 第61回言語・音声理解と対話処理研究会(SIG-SLUD), 人工知能学会, Mar. 25, 2011.
  61. 安良岡 直希, 吉岡 拓也, 亀岡 弘和, 奥乃 博: 補助関数法を用いたIダイバージェンス規準残響抑制, 音響学会春季講演会, 3-1-9, March 11, 2011.
  62. 前澤 陽, 後藤 真孝, 尾形 哲也, 奥乃 博: 拍長の連続性を考慮した潜在的調波配分法に基づくスコアアライメント手法, 音響学会春季講演会, 3-1-16, March 11, 2011.
  63. Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Kazuyuki Aihara, Hiroshi G. Okuno, Kazuyuki Aihara: Complex Synchronization In a Frustrated System of Calling Frogs, The First International Symposium on Onnovative Mathematical Modelling, P-118 (poster), Feb. 28, 2011, IIS, The University of Tokyo.
  64. 信田 春満, 尾形 哲也, 奥乃 博, 高橋 徹, 日下 航: 神経力学モデルによる予測可能性を用いた身体識別, 情報処理学会第73回全国大会, 2-125-126, 1Q-1, March 2, 2011. pdf
  65. 粟野 皓光, 尾形 哲也, 谷 淳, 高橋 徹, 奥乃 博: 再帰結合神経回路モデルへのスパース構造導入による学習能力の向上, 情報処理学会第73回全国大会, 2-131-132, 1Q-4, March 2, 2011. 学生奨励賞 pdf
  66. Louis-Kenzo Cahier, 高橋 徹, 尾形 哲也, 奥乃 博: Time-of-flight camera based Probabilistic Polygonal Mesh mapping, 情報処理学会第73回全国大会, 2-431-432, 1T-5, March 2, 2011. pdf
  67. 阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: F0・音韻長・パワー制御による歌声らしさ・話声らしさの変化の評価, 情報処理学会第73回全国大会, 2-255-256, 2R-6, March 2, 2011. 学生奨励賞 pdf
  68. 日下 航, 尾形 哲也, 高橋 徹, 奥乃 博: 神経回路モデルによる言語とロボット動作の相互連想学習, 情報処理学会第73回全国大会,2-165-166, 3Q-1, March 2, 2011. 学生奨励賞 pdf
    情報処理学会 第73回全国大会 学会推奨 修士論文認定, 2011年5月.
  69. 糸原 達彦, 大塚 琢馬, 水本 武志, 高橋 徹, 尾形 哲也, 奥乃 博: 視聴覚統合ビートトラッキングを用いた音楽ロボットとギターとの合奏システム, 情報処理学会第73回全国大会, 4-235-236, 1ZB-2, March 2, 2011. 学生奨励賞 pdf
  70. 松山 匡子, 駒谷 和範, 武田 龍, 尾形 哲也, 奥乃 博: 誤認識頻発状況下で選択肢列挙を行う音声対話システムとその評価, 情報処理学会第73回全国大会, 4P-4, March 3, 2011. pdf
  71. 佐野 正太郎, 尾形 哲也, 日下 航, 高橋 徹, 奥乃 博: 神経力学モデルの引込みによる相槌タイミング予測, 情報処理学会第73回全国大会, 4P-7, March 3, 2011. 学生奨励賞 pdf
  72. Uihyun Kim, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Speaker Localization Using Two-Channel Microphone on the SIG-2 Humanoid Robot, 情報処理学会第73回全国大会, 2-15-16, 4C-1, March 3, 2011. pdf
  73. JOOYOUNG AHN, 前澤 陽, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: Classification of Harmonic and Textural Keyboard Playing Style Using Acoustic Features, 情報処理学会第73回全国大会, 2-17-18, 4C-2, March 3, 2011. pdf
  74. 安良岡 直希, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: 調波パラメトリックNMFによる楽器演奏音響信号の分析合成, 情報処理学会第73回全国大会, 2-293-294, 5R-1, 2-293-244, March 4, 2011. pdf
    情報処理学会 第73回全国大会 学会推奨 修士論文認定, 2011年5月.
  75. 西川 直毅, 糸山 克寿, 藤原 弘将, 後藤 真孝, 高橋 徹, 尾形 哲也, 奥乃 博: 歌詞と音響特徴量を用いた楽曲の印象軌跡推定, 情報処理学会第73回全国大会, 2-297-298, 5R-3, 2-297-298, March 4, 2011. pdf
  76. 前澤 陽, 後藤 真孝, 尾形 哲也, 奥乃 博: 潜在的調波配分法に基づく隠れセミマルコフモデルを用いたベイズ的スコアアライメント, 情報処理学会第73回全国大会, 2-299-300, 5R-4,, March 4, 2011. 学生奨励賞 pdf
    情報処理学会 第73回全国大会 学会推奨 修士論文認定, 2011年5月.
  77. 阪上 大地, 安良岡 直希, 高橋 徹, 尾形 哲也, 奥乃 博: 伝達関数のスパース性仮定に基づく音楽音響信号中のディレイエフェクトブラインド推定, 情報処理学会第73回全国大会, 2-301-302, 5R-5, March 4, 2011. pdf
  78. 大塚 琢馬, 中臺 一博, 高橋 徹, 尾形 哲也, 奥乃 博: 累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従, 情報処理学会第73回全国大会, 2-305-306, 5R-7, March 4, 2011. pdf
    情報処理学会 第73回全国大会 学会推奨 修士論文認定, 2011年5月.
  79. Angelica Lim, 中村 圭佑, 中臺 一博, 尾形 哲也, 奥乃 博: Audio-visual musical instrument recognition 情報処理学会第73回全国大会, 2-309-310, 5R-9, March 3, 2011. pdf
  80. 柳楽 浩平, 高橋 徹, 尾形 哲也, 奥乃 博: 音源数同定とブラインド音源分離を同時に行うinfinite ICA, 情報処理学会第73回全国大会, 2-109-110, 6P-1, March 4, 2011. 学生奨励賞 pdf
  81. 平澤 恭治, 武田 龍, 高橋 徹, 尾形 哲也, 奥乃 博: L1ノルム最小化による劣決定音源分離のための線形計画と二次錐計画の比較評価 情報処理学会第73回全国大会, 2-111-112, 6P-2, March 4, 2011. pdf
  82. 山川 暢英, 高橋 徹, 北原 鉄朗, 尾形 哲也, 奥乃 博: ロボット聴覚のための Matching Pursuit による複数環境音の同定, 情報処理学会第73回全国大会, 2-113-114, 6P-3, March 4, 2011. pdf
  83. 中臺 一博, 奥乃 博: ロボット聴覚 〜高雑音下でのハンズフリー音声認識〜 (招待講演), 信学技法, 音声研究会, 電子情報通信学会, 27 Jan. 2011 pdf
  84. 合原 一究, 水本 武志, 大塚 琢馬, 武田 龍, 奥乃 博: Spatio-Temporal Dynamics on Synchronized Calling Behavior of Japanese Tree Frogs, 第15回聴覚研究フォーラム, P10, Dec. 2010.
  85. 佐藤 隼, 中野 幹生, 松山 匡子, 駒谷 和範, 船越 孝太郎, 奥乃 博: 拡張性の高いマルチドメイン対話システムのための2段ドメイン選択法, 第60回言語・音声理解と対話処理研究会(SIG-SLUD), 人工知能学会, Oct. 17, 2010.
  86. 駒谷 和範, 松山 匡子, 奥乃 博: 発話行為レベルの情報を活用した音声対話システムの研究, 第60回言語・音声理解と対話処理研究会(SIG-SLUD), 人工知能学会, Oct. 17, 2010.
  87. Angelica Lim, Takeshi Mizumoto, Louis-Kenzo Cahier, Takuma Otsuka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Multimodal gesture recognition for robot musical accompaniment, 日本ロボット学会第28回学術講演会, 1H2-3, 名古屋工業大学, Sep. 22, 2010. pdf
  88. 山川 暢英, 高橋 徹, 北原 鉄朗, 尾形 哲也, 奥乃 博: ロボット聴覚のための Matching-Pursuit による環境音の分離音認識, 日本ロボット学会第28回学術講演会, 1H2-4, 名古屋工業大学, Sep. 22, 2010. pdf
  89. Zhang Yang, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno: Dynamic Recognition of Environmental Sounds with Recurrent Neural Network, 日本ロボット学会第28回学術講演会, 1H2-7, 名古屋工業大学, Sep. 22, 2010. pdf
  90. 武田 龍, 中臺 一博, 高橋 徹, 尾形 哲也, 奥乃 博: リサンプル-ブロック処理と並列化に基づく ICA の実時間実装, 日本ロボット学会第28回学術講演会, 1H3-1, 名古屋工業大学, Sep. 22, 2010. pdf
  91. 水本 武志, 中臺 一博, 大塚 琢馬, 高橋 徹, 尾形 哲也, 奥乃 博: 打楽器とロボットの合奏のための結合振動子モデルに基づく打撃時刻予想手法, 日本ロボット学会第28回学術講演会, 1H3-2, 名古屋工業大学, Sep. 22, 2010. pdf
  92. Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Predictive Score Following user Particle Filter for Music Robots, 日本ロボット学会第28回学術講演会, 1H3-6, 名古屋工業大学, Sep. 22, 2010. pdf
  93. Louis-Kenzo Cahier, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Probabilistic polygonal mesh for 3D SLAM, 日本ロボット学会第28回学術講演会, 2B2-4, 名古屋工業大学, Sep. 23, 2010. pdf
  94. 粟野 皓光, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博: 確信度を用いた物体配置作業における人間ロボット協調, 日本ロボット学会第28回学術講演会, 3J1-6, 名古屋工業大学, Sep. 24, 2010. pdf
  95. 西出 俊, 尾形 哲也, 谷 淳, 奥乃 博: 能動知覚経験に基づく物体特徴量の自己組織化と予測信頼性に基づく動作生成, 日本ロボット学会第28回学術講演会, 3A2-5, 名古屋工業大学, Sep. 24, 2010. pdf
  96. 日下 航, 有江 浩明, 谷 淳, 尾形 哲也, 高橋 徹, 奥乃 博: MTRNNを用いた階層的言語構造の創発, 日本ロボット学会第28回学術講演会, 3A2-7, 名古屋工業大学, Sep. 24, 2010. pdf
  97. 奥乃 博, 中臺 一博, 高橋 徹: ロボット聴覚オープンソースソフトウエア HARK, 電子情報通信学会ソサイエティ大会, 依頼シンポジウムセッション AI-1: マルチモーダル信号処理とその応用, 大阪府立大学, Sep. 14, 2010.
  98. 高橋 徹, 中臺 一博, 奥乃 博: ロボット聴覚ソフトウエア HARK とそのロボットへの適用, 電気関係東海支部連合会大会, Sep., 2010.
  99. 安良岡 直希, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏音響信号中の歌唱音声の歌詞を自由に差し替える歌詞置換システム, 音響学会秋季学術講演会, , Sep. 14〜16, 2010. 関西大学千里山キャンパス. 日本音響学会第2回学生優秀発表賞 (内定)
  100. 阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: SpeakBySinging: 歌声を話声に変換する話声合成システム, 音楽情報科学研究会, Vol.2010-MUS-86, No., pp. つくば, 情報処理学会, Jul. 2010. pdf,
  101. 前澤 陽, 後藤 真孝, 奥乃 博: Query-by-Conducting: テンポ類似性に基づく同一楽曲における多様な解釈の検索インタフェース, 音楽情報科学研究会, Vol.2010-MUS-86, No.2, pp. つくば, 情報処理学会, Jul. 2010. pdf,
  102. 安良岡 直希, 糸山 克寿, 吉岡 拓也, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム, 音楽情報科学研究会, Vol.2010-MUS-, No., pp. つくば, 情報処理学会, Jul. 2010.
  103. 松山 匡子, 駒谷 和範, 武田 龍, 尾形 哲也, 奥乃 博: バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用, 第82回音声言語情報処理研究会, Vol.2010-SLP-82, No.21, 情処研報, 情報処理学会, Jul. 24, 2010.

    特許・ディジタルコンテンツ

  104. 楽譜位置推定装置、楽譜位置推定方法および楽譜位置推定ロボット. 発明者: 中臺 一博, 大塚 琢馬, 奥乃 博, 特開2011-39511号, 2011年2月24日. 特願2010-177968号, 2010年8月6日.
  105. 残響抑圧装置, 及び残響抑圧方法. 発明者: 中臺 一博, 中島 弘史, 奥乃 博, 武田 龍, 特開2010-282193号, 2010年12月16日. 特願2010-124873号, 2010年5月31日.
  106. Audio Source Detection System, Inventors: Hiroshi Tsujino, Kazuhiro Nakadai, Hiroshi Okuno, Takeshi Mizumoto, and Ikkyu Aihara. Publication No: 20100189271, Publication Date: 2010-07-29. Application No: 12/631434, Application Date: 2009-12-04.
  107. Language Understanding Device. Mikio Nakano, Hiroshi Okuno, Kazunori Komatani, Yuichiro Fukubayashi, Kotaro Funakoshi, Europian Patent EP 2,003,572, Publication Date: 04/18/2012 Filing Date: 02/10/2005
  108. Sound Source separation system, sound source separation method, and computer program for sound source separation, Inventors: Katsutoshi Itoyama, Hiroshi Okuno, Masataka Goto, US Patent Aapplication: Pub. No.: US 2010/0131086 A1, Pub. Date: May 27, 2010. PCT No.: PCT/JP2008/057310.
  109. 音声認識装置, 発明者: 中臺 一博, 辻野 広司, 奥乃 博, 山本 俊一, 特許第4516527号, 登録日2010年5月21日, 発行日2010年8月4日, 特開2010-170137号, 2010年8月5日. 特願2005-515466号, 2004年11月12日. pdf
  110. 音声理解装置, 発明者:中野 幹生, 勝丸 真樹, 船越 孝太郎, 奥乃 博, 特開2010-170137号, 2010年8月5日. 特願2005-515466号, 2004年11月12日.
  111. 音源位置推定システム, 発明者: 辻野 広司, 中臺 一博, 奥乃 博, 水本 武志, 合原 一究, 特開2010-133964号, 2010年6月17日. 特願2009-277075号, 2009年12月4日.
  112. Speech recognition system and method for generating a mask of the system, Kazuhiro Nakadai, Toru Takahashi, Hiroshi Okuno, Publication No: 20100082340, Publication Date: 2010-04-01. Application No: 12/543759, Application Date: 2009-08-19, U.S.A.

2010年度 o 2009年度(奥乃・尾形研究室)o 2008年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. Hiromasa Fujihara: Statistical Modeling for Recognizing Singing Voices in Polyphonic Music (統計的モデルによる多重奏音楽中の歌声の認識), 博士論文 (指導教員: 奥乃博教授), Feb. 2010.
  2. Takuya Yoshioka: Speech Enhancement in Reverberatn Environments (残響環境下での音声強調), 博士論文 (指導教員: 奥乃博教授), Feb. 2010.

  3. 勝丸 真樹: 複数の言語モデルと言語理解モデルによる音声理解の高精度化とそのラピッドプロトタイピングへの適用, 修士論文 (指導教員: 奥乃博教授), Feb. 2010.
  4. 水本 武志: ロボットによるテルミン演奏のための音高・音量特性のモデル化とフィードフォワード制御, 修士論文 (指導教員: 奥乃博教授), Feb. 2010.

  5. 穐山 空道: 文法検証を統合したPOMDPによる対話管理, 卒業特別研究報告書 (指導教員: 奥乃博教授), Feb. 2010.
  6. 阿曽 慎平: 音韻長・F0・振幅の制御により歌声を話声に変換する話声合成システム SpeakBySinging, 卒業特別研究報告書 (指導教員: 奥乃博教授), Feb. 2010.
  7. 粟野 皓光: 人間ロボットの作業確信度を利用した協調物体配置システム, 卒業特別研究報告書 (指導教員: 尾形哲也准教授), Feb. 2010.
  8. 平澤 恭治: 調波構造を用いた音源分離によるマイク数以上の同時発話認識, 卒業特別研究報告書 (指導教員: 奥乃博教授), Feb. 2010.

    査読つきジャーナル論文

  9. Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Soft missing-feature mask generation for robot audition, PALADYN Journal of Behavioral Robotics, Vol.1, No.1 (Mar. 2010) pp. 37-47, doi:10.2478/s13230-010-0005-1
  10. Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Voice-awareness control for a humanoid robot consistent with its body posture and movements, PALADYN Journal of Behavioral Robotics, Vol.1, No.1 (Mar. 2010) pp.80-88, doi:10.2478/s13230-010-0009-x
  11. Hiromasa Fujihara, Masataka Goto, Tetsuro Kitahara, Hiroshi G. Okuno: A Modeling of Singing Voice Robust to Accompaniment Sounds and Its Application to Singer Identification and Vocal-Timbre-Similarity-Based Music Information Retrieval, IEEE Transactions on Audio, Speech and Language Processing, Vol.18, No.3 (Mar. 2010) pp.638-648, IEEE. doi:10.1109/TASL.2010.2041386
  12. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Binaural active audition for humanoid robots to localise speech over entire azimuth range, Applied Bionics and Biomechanics, Special Issue on "Humanoid Robots", Vol.6, Issue 3-4 (Sep. 2009) pp.355-368, Taylor & Francis 2009. doi:10.1080/11762320903007430
  13. Hyun-Don Kim, Jinsung Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Target Speech Detection and Separation for Communication with Humanoid Robots in Noisy Home Environments, Advanced Robotics, Vol.23, Issue 15 (2009) 2093-2111, VSP and Robotics Society of Japan. doi:10.1163/016918609X12529300552105 IF: 0.510
  14. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Self-Organization of Dynamic Object Features based on Bi-Directional Training, Advanced Robotics, Vol.23, Issue 15 (2009) 2035-2057. doi:10.1163/016918609X12529289797027 VSP and Robotics Society of Japan. IF: 0.510
  15. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Autonomous Motion Generation based on Reliable Predictability, Journal of Robotics and Mechatronics, special issue on Kukanchi Interactive Human-Space Design and Intelligence Dedicated to Dr. Kazuo Tanie, Vol.21, No.4 (2009) 478-488. pdf,
  16. 武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博 : 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚, 日本ロボット学会誌, Vol.27, No.7 (2009) 782-792. pdf, pdf学会サーバ
  17. 村田 和真, 中臺 一博, 武田 龍, 奥乃 博, 長谷川 雄二, 辻野 広司: ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用, 日本ロボット学会誌, Vol.27, No.7 (2009) 793-801. pdf, pdf学会サーバ
  18. 神田 尚, 尾形 哲也, 駒谷 和範, 奥乃 博: 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション, 日本ロボット学会誌, Vol.27, No.7 (2009) 802-813. pdf, pdf学会サーバ
  19. Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Parameter Estimation for Harmonic and Inharmonic Models by Using Timbre Feature Distributions, IPSJ Journal, Vol.50, No.7 (Jul. 2009) 1757-1767, IPSJ. Journal of Information Processing, Vol.17 (2009) 191-201, IPSJ. pdf DL
  20. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Human Tracking System Integrating Sound and Face Localization Using an Expection-Maximization Algorithm in Real Environments, Advanced Robotics, Vol.23, Issue 6 (May 2009) 629-653, doi:10.1163/156855309X431659 VSP and Robotics Society of Japan. IF: 0.510

    編書・章分担・解説論文・翻訳

  21. 中臺 一博, 宮下 敬宏, 奥乃 博: 「ロボット聴覚」特集号について, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.1. pdf学会サーバ doi:10.7210/jrsj.28.1
  22. 奥乃 博: ロボット聴覚の現状と課題, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.2-5. pdf学会サーバ doi:10.7210/jrsj.28.2
  23. 奥乃 博, 中臺 一博: ロボット聴覚オープンソフトウエア HARK, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.6-9. pdf学会サーバ doi:10.7210/jrsj.28.6
  24. 奥乃 博: 編集後記, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.53. pdf学会サーバ (2010年7月よりアクセス許可)
  25. 尾形 哲也, 西出 俊: 神経回路モデルの感覚・行為予測に基づく空間認知モデル, 計測と制御, Vol.48, No.12 (Dec. 2009) pp.852-857.
  26. 尾形 哲也: 神経回路と声道モデルを用いた音素獲得シミュレーション, バイオメカニズム学会誌, Vol.33, No.4 (Nov. 2009) pp.257-263.
  27. 奥乃 博: 「ロボットと<こころ>」, 京都文化会議記念出版編集委員会川添信介, 高橋康夫, 吉澤健吉編『こころの謎 kokoroの未来』, pp.184-212, 京都大学学術出版会, Nov. 2009.
  28. 奥乃 博, 中臺 一博, 大塚 琢馬: 音楽ロボットのための実時間音楽情報処理, 特集「音楽処理技術の最前線」, 情報処理, Vol.50, No.8 (Aug. 2009) pp.729-734. 立ち読み 電子図書館
  29. Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Adjusting Occurrence Probabilities of Automatically-Generated Abbreviated Words in Spoken Dialogue Systems, B.-C. Chien, T.-P. Hong, S.-M. Chen, M. Ali (Eds.): Next-Generation Applied Intelligence, 22nd International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, Lecture Notes in Artificial Intelligence 5579, pp.481-490, Tainan, Taiwan, Jun. 24-27, 2009. doi:10.1007/978-3-642-02568-6_49
  30. Shun Shiramatsu, Yuji Kubota, Kazunori Komatani, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno: Visualization-based Approaches to Support Context Sharing towards Public Involment Support System, Opportunities and Challenges for Next-Generation Applied Intelligence, Studies in Computational Intelligence, Springer, Vol.214, pp.111--117, Tainan, Taiwan, Jun. 24-27, 2009. doi:10.1007/978-3-540-92814-0_18 IF: 1.853
  31. Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: A Model of Temporally Changing User Behaviors in a Deployed Spoken Dialogue System, G.-J. Houben et al. (Eds.): UMAP 2009, First and Seventeenth International Conference on User Modeling, Adaptation, and Personalization, Lecture Notes in Computer Science 5535, pp.408-414, Trento, Italy, Jun. 22-26, 2009. doi:10.1007/978-3-642-02247-0_45
  32. 合原 一究, 武田 龍, 水本 武志, 高橋 徹, 奥乃 博: ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析, 数解研講究録 1663, pp153-158, 2009年6月24日.
  33. 鹿野清宏, 武田一哉, 河原達也, 河原英紀, 猿渡洋, 徳田恵一, 李晃伸, 川波弘道, 西村竜一, Randy Gomez, 戸田智基, 西浦敬信, 高橋 徹, 板野秀樹, 全へい河: 総合報告 ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発, 電子情報通信学会誌, Vol.92, No.6 (June 2009) pp.475-491.

    査読つき国際会議論文

  34. Naoki Yasuraoka, Takuya Yoshioka, Tomohiro Nakatani, Aatsushi Nakamura, Hiroshi G. Okuno: MUSIC DEREVERBERATION USING HARMONIC STRUCTURE SOURCE MODEL AND WIENER FILTER, Proceedings of 2010 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2010), pp.53-56, (lecture), IEEE, Dallus, March, 2010. pdf doi:10.1109/ICASSP.2010.5496223
  35. Takuya Yoshioka, Tomohiro Nakatani, Hiroshi G. Okuno: NOISY SPEECH ENHANCEMENT BASED ON PRIOR KNOWLEDGE ABOUT SPECTRAL ENVELOPE AND HARMONIC STRUCTURE, Proceedings of 2010 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2010), pp.4270-4273, (lecture+poster 48.8%), IEEE, Dallus, March, 2010. pdf doi:10.1109/ICASSP.2010.5495681
  36. Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Bowed String Sequence Estimation of a Violin Based on Adaptive Audio Signal Classification and Context-Dependent Error Correction, Proceedings of IEEE International Symposium on Multimedia (ISM2009), pp.9-16, (acceptance rate for full papers, 19.6%), San Diego, Dec. 14-16, 2009. doi:10.1109/ISM.2009.30
  37. Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Estimation of Reverberation Time with Robot Speech to Improve ICA-based Robot Audition, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2009), pp.250-355, IEEE, Paris, Dec. 7-10, 2009. pdf doi:10.1109/ICHR.2009.5379572
  38. Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Voice quality manipulation for humanoid robots consistent with their head movements, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2009), pp.405-410, IEEE, Paris, Dec. 7-10, 2009. pdf. doi:10.1109/ICHR.2009.5379569
  39. Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno: Automatic Speech Recognition Improved by Two-Layered Audio-Visual, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008), pp.604-609, IEEE, Paris, Dec. 7-10, 2009. pdf. doi:10.1109/ICHR.2009.5379586
  40. Hiromasa Fujihara, Masataka Goto, Hiroshi G. Okuno: A NOVEL FRAMEWORK FOR RECOGNIZING PHONEMES OF SINGING VOICE IN POLYPHONIC MUSIC, Proceedings of 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), pp.17-20, Oct. 18-21, New Paltz, NY, 2009. doi:10.1109/IROS.2009.5354527
  41. Takuya Yoshioka, Hirokazu Kameoka, Tomohiro Nakatani, Hiroshi G. Okuno: Statistical models for speech dereverberation, Proceedings of 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), pp.145-148, Oct. 18-21, New Paltz, NY, 2009. doi:10.1109/ASPAA.2009.5346489
  42. Naoki Yasuraoka, Takehiro Abe, Katsutoshi Itoyama, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Changing Timbre and Phrase in Existing Musical Performances as You Like, ACM Multimedia 2009, 203-212 (16% 22/138), Beijing, China, Oct. 19-24, 2009. pdf, doi:10.1145/1631272.1631302
  43. Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Step-size Parameter Adaptation of Multi-channel Semi-blind ICA with Piecewise Linear Model for Barge-in-able Robot Audition (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2273-2282, (900/1650), IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. pdf doi:10.1109/IROS.2009.5354527
  44. Takuma Otsuka, Kazumasa Murata, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Incremental Polyphonic Audio to Score Alignment using Beat Tracking for Singer Robots (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2289-2296, IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. pdf doi:10.1109/IROS.2009.5354637
  45. Takeshi Mizumoto, Hiroshi Tsujino, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Thereminist Robot: Development of a Robot Theremin Player with Feedforward and Feedback Arm Control based on a Theremin's Pitch Model (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2297-2302, IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. pdf doi:10.1109/IROS.2009.5354473
  46. Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Missing-Feature-Theory-based Robust Simultaneous Speech Recognition System with Non-clean Speech Acoustic Model (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2730-2735, IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. pdf doi:10.1109/IROS.2009.5354201
  47. Wataru Hinoshita, Tetsuya Ogata, Hideki Kozima, Hisashi Kanda, Toru Takahashi, Hiroshi G. Okuno: Emergence of Evolutional Interaction with Voice and Motion between Two Robots using RNN, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.4196-4291, IEEE, RSJ, St. Louis, 12-14 (14) Oct. 2009. pdf doi:10.1109/IROS.2009.5354887
  48. Shun Nishide, Tetsuhiro Nakagawa, Tetsuya Ogata, Jun Tani, Toru Takahashi, Hiroshi G. Okuno: Modeling Tool-Body Assimilation using Second-order Recurrent Neural Network, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.5376-5381, (900/1650), IEEE, RSJ, St. Louis, 12-14 (14) Oct. 2009. pdf doi:10.1109/IROS.2009.5354655
  49. Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Phoneme Acquisition Model based on Vowel Imitation using Recurrent Neural Network, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.5388-5393, IEEE, RSJ, St. Louis, 12-14 (14) Oct. 2009. pdf doi:10.1109/IROS.2009.5354825
  50. Kazunori Komatani, Satoshi Ikeda, Yuichiro Fukubayashi, Tetsuya Ogata, Hiroshi G. Okuno: Ranking Help Message Candidates Based on Robust Grammar Verification Results and Utterance History in Spoken Dialogue Systems, Proceedings of the 10th SIGdial Workshop on Discourse and Dialogue (SigDial 2009), 314-321, Sep. 12, 2009.
  51. Kyoko Matsuyama, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Enabling A User To Specify An Item At Any Time During System Enumeration, Proceedings of International Conference on Spoken Language Processing (Interspeech-2009), Mon-Ses2-P4-1, (57.7%), Brighton, 6-10 Sep. 2009. pdf
  52. Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, Kotaro Funakoshi, Tetsuya Ogata, Hiroshi G. Okuno: Improving Speech Understanding Accuracy with Limited Training Data Using Multiple Language Models and Multiple Understanding Models, Proceedings of International Conference on Spoken Language Processing (Interspeech-2009), Thu-Ses1-P4-9, (57.7%), Brighton, 6-10 (10) Sep. 2009. pdf
  53. Hideki Kawahara, Masanori Morise, Toru Takahashi, Hideki Banno, Ryuichi Nishimura, Toshio Irino: Observation of empirical cumulative distribution of vowel spectral distances and its application to vowel based voice conversion, Proceedings of International Conference on Spoken Language Processing (Interspeech-2009), Thu-Ses1-P2-6, (57.7%), Brighton, 6-10 Sep. 2009. pdf
  54. Hiroshi G. Okuno, Kazuhiro Nakadai, Hyun-Don Kim: Robot Auditon: Missing Feature Theory Approach and Active Audition (Invited talk), Proceeding of the 14th International Symposium of Robotics Research (ISRR 2009), August 31 - September 3, 2009, Lucerne, Switzerland, International Foundation of Robotics Research. Springer STAR series.
  55. Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno: Synchronization in Frustrated Calling Behavior of Japanese Tree Frogs, Conference on Dynamics in Systems Biology, Univ. of Aberdeen, UK, Sep. 16, 2009. (oral)
  56. Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: QUERY-BY-EXAMPLE MUSIC RETRIEVAL APPROACH BASED ON MUSICAL GENRE SHIFT BY CHANGING INSTRUMENT VOLUME, Proceeding of the 12th International Conference on Digital Audio Effects (DAFx-09), accepted, Como, Italy, Sep.1-4. 2009.
  57. Shun Shiramatsu, Tadachika Ozono, Toramatsu Shintani, Kazunori Komatani, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno: Development of a Meeting Browser towards Supporting Public Involvement, Proceedings of the 12th IEEE International Conference on Computational Science and Engineering (CSE-09), pp.717-722, Vancouver, Canada, Aug., 2009. doi:10.1109/CSE.2009.362
  58. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Analysis of Motion Searching based on Reliable Predictability using Recurrent Neural Network, Proceedings of 2009 IEEE/ASME Conference on Advanced Intelligent Mechatronics (AIM 2009), 192-197, Singapore, July 14-19, 2009. doi:10.1145/10.1109/AIM.2009.5230015
  59. Kazunori Komatani, Alexander I. Rudnicky: Predicting Barge-in Utterance Errors by using Implicitly-Supervised ASR Accuracy and Barge-in Rate per User, Proceedings of the Fourth International Joint Conference on Natural Language Processing (ACL-IJCNLP 2009), pp.89-92, Jul. 2009.
  60. Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, Kotaro Funakoshi, Hiroshi G. Okuno: A Speech Understanding Framework that Uses Multiple Language Models and Multiple Understanding Models, Proceeding of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies (NAACL HLT) 2009 Conference, pp.133-136, (40%), Boulder, CO, May 31 - Jun. 5, 2009.
  61. Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Prediction and Imitation of Other's Motions by Reusing Own Forward-Inverse Model in Robots, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2009), pp.4144-4149, (699/1624), (May 12-17 (16), 2009), Kobe. pdf doi:10.1145/10.1109/ROBOT.2009.5152363
  62. Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Continuous Vocal Imitation with Self-organized Vowel Spaces in Recurrent Neural Network, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2009), pp.4438-4443, (May 12-17 (16), 2009), Kobe. pdf doi:10.1145/10.1109/ROBOT.2009.5152818
  63. Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: ICA-BASED EFFICIENT BLIND DEREVERBERATION AND ECHO CANCELLATION METHOD FOR BARGE-IN-ABLE ROBOT AUDITION, Proceedings of 2009 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2009), SS-L7.1, pp.3677-3680, (1178/2633), IEEE, Taipei, Taiwan, April 19--24 (23), 2009. pdf doi:10.1109/ICASSP.2009.4960424
  64. Hideki Kawahara, Ryuichi Nisimura, Toshio Irino, Masanori Morise, Toru Takahashi, Hideki Banno: TEMPORALLY VARIABLE MULTI-ASPECT AUDITORY MORPHING ENABLING EXTRAPOLATION WITHOUT OBJECTIVE AND PERCEPTUAL BREAKDOWN, Proceedings of 2009 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2009), pp. IEEE, April 23. pdf

    口頭発表(研究会・全国大会)

  65. Takuma Otsuka, Kazuhiro Nakadai, iToru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Score Following by Particle Filtering for Music Robots, 情報処理学会第72回全国大会, 1ZN-2, Mar. 9, 2010. pdf
  66. 松山 匡子, 駒谷 和範, 高橋 徹, 尾形 哲也, 奥乃 博, バージイン許容音声対話におけるLSMによる許容発話範囲の拡張, 情報処理学会第72回全国大会, 2ZN-2, Mar. 9, 2010. pdf
  67. 前澤 陽, 後藤 真孝, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, クラシック音楽理解能力拡張インターフェイスのための同音旋律音量推定手法と主旋律推定への応用, 情報処理学会第72回全国大会, 3T-1, Mar. 10, 2010. pdf 学生奨励賞
  68. 勝丸 真樹, 駒谷 和範, 中野 幹生, 船越 孝太郎, 辻野 広司, 尾形 哲也, 奥乃 博, 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用 情報処理学会第72回全国大会, 3U-2, Mar. 10, 2010. pdf
  69. 平澤 恭治, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, スペクトル推定を用いたマイク数以上の同時発話に対する音声認識, 情報処理学会第72回全国大会, 3U-7, Mar. 10, 2010. pdf
  70. 山川 暢英, 北原 鉄朗, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, 環境音から擬音語への自動変換における特徴量抽出法の検討, 情報処理学会第72回全国大会, 3U-9, Mar. 10, 2010. pdf 学生奨励賞
  71. 安良岡 直希, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, 調波非調波GMMに基づくMIDI演奏音響信号に対する音色・演奏表情操作, 情報処理学会第72回全国大会, 5T-5, Mar. 11, 2010. pdf 学生奨励賞
  72. 安良岡 直希, 吉岡 拓也, 中谷 智広, 中村 篤, 奥乃 博, 調波GMMとWienerフィルタに基づく音楽音響信号の残響抑圧, 情報処理学会第72回全国大会, 5T-4, Mar. 11, 2010. pdf
  73. 穐山 空道, 駒谷 和範, 高橋 徹, 尾形 哲也, 奥乃 博, ユーザの文法知識を状態に加えたPOMDPに基づく音声対話システム, 情報処理学会第72回全国大会, 5U-9, Mar. 11, 2010. pdf
  74. 粟野 皓光, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博, RNNを用いた行為予測による人間とロボットの協調物体配置, 情報処理学会第72回全国大会, 5V-6, Mar. 11, 2010. pdf
  75. Angelica Lim, 水本 武志, 大塚 琢馬, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博 : Robot Musical Accompaniment: Real-time Synchronization using Visual Cue Recognition, 情報処理学会第72回全国大会, 6T-7, Mar. 11, 2010. pdf
  76. 水本 武志, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, 複数自由度を用いて音高特性モデルに基づく音高制御を行うテルミン演奏ロボットの開発, 情報処理学会第72回全国大会, 6T-8, Mar. 11, 2010. pdf 学生奨励賞
  77. 阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, F0・振幅・音韻長の制御により歌声を話声に変換する話声合成システムSpeakBySinging, 情報処理学会第72回全国大会, 6U-1, Mar. 11, 2010. pdf 学生奨励賞
  78. 日下 航, 有江 浩明, 谷 淳, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博, MTRNNを用いた単語と文法の階層的自己組織化による文の認識・生成, 情報処理学会第72回全国大会, 6W-8, Mar. 11, 2010. pdf
  79. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博, 楽器音イコライザによる楽曲音響特徴変動と類似楽曲検索への応用, 情報処理学会第72回全国大会, 6J-6, Mar. 11, 2010. pdf
  80. 武田 龍, 中臺 一博, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博, ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル, 情報処理学会第72回全国大会, 6J-7, Mar. 11, 2010. pdf
  81. 高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博, 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング, 情報処理学会第72回全国大会, 6J-8, Mar. 11, 2010. pdf
  82. 駒谷 和範, 奥乃 博, 音声対話システムにおける各ユーザの利用履歴を活用したバージイン発話のエラー検出, 言語処理学会大会, C2-3, pp.218-221, Mar. 9, 2010. pdf
  83. 吉岡 拓也, 中谷 智広, 奥乃 博: スペクトル包絡の事前学習と調波構造モデルを併用した音声強調, 日本音響学会2010年春季研究発表会講演論文集, 3-5-9, Mar. 2010. 第28回粟屋潔学術奨励賞
  84. 高橋 徹, 辻 高明, フィールド情報学的アプローチによる複数発話音声認識ロボットの開発, 京都大学ICTイノベーション2010, Feb., 2010.
  85. 水本 武志: 最古の電子楽器テルミンを演奏するロボットの開発, 自然科学縦横無尽, 理学系異分野交流会, Jan. 2010. (oral)
  86. 水本 武志: 音声視覚化デバイス「カエルホタル」を用いた音源定位システム, 自然科学縦横無尽, 理学系異分野交流会, Jan. 2010. (poster)
  87. 合原 一究, 水本 武志, 武田 龍, 大塚 琢馬, 高橋 徹, 奥乃 博: アマガエルの多体系発声行動に潜む時空間ダイナミクス, 定量生物学の会・第2回年会, Jan. 2010.
  88. 張 陽, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博: MTRNNによる環境音の予測識別, 第10回システムインテグレーション部門講演会 (SI2009), 計測自動制御学会, Dec. 24-26, 2009.
  89. 前澤 陽, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: 弦の音響差異を考慮したバイオリン演奏音響信号に対する運指推定, 日本音響学会関西支部第12回若手研究者交流研究発表会, Dec. 5, 2009, 奨励賞
  90. 荒木 雅弘, 片桐 恭弘, 駒谷 和範, 堂坂 浩二, 中野 幹夫, 翠 輝久: SIGDial 2009, Young Researchers' Roundtable on Spoken Dialogue Systems 2009 参加報告, 第57回言語・音声理解と対話処理研究会(SIG-SLUD), 東京工業大学, Nov. 20, 2009.
  91. 駒谷 和範, Alexander I. Rudnicky: 音声対話システムにおける暗黙的な教師信号に基づく音声認識率の推定と それを用いたエラー予測, 情報処理学会音声言語情報処理研究会, Vol.2009-SLP-78, Oct. 23, 早稲田大学.
  92. Takeshi Mizumoto, Hiroshi Tsujino, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Thereminist Robot: Development of a Robot Theremin Player based on a Theremin's Pitch Model, Special SIGMUS Symposium, Nov 2, 2009.
  93. 吉岡 拓也, 中谷 智広, 奥乃 博: 重みつき予測誤差法におけるMIMO残響除去フィルタの効率的最適化法, 日本音響学会2009年秋季研究発表会講演論文集, Sep., 2009, pdf
  94. 吉岡 拓也, 亀岡 弘和, 中谷 智広, 奥乃 博: 少量データに頑健な残響抑圧のためのMSPP法, 日本音響学会2009年秋季研究発表会講演論文集, Sep., 2009, pdf
  95. 前澤 陽, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: 音響信号とコンテキスト制約を併用したバイオリン演奏弦系列の推定, 日本音響学会2009年秋季研究発表会講演論文集, 2-5-15, Sep., 2009,
  96. 尾形 哲也, 神田 尚, 高橋 徹, 駒谷 和範, 奥乃 博: 声道物理モデルの母音列繰り返し模倣による音素獲得シミュレーション (基調講演), 日本ロボット学会第27回学術講演会, 1I2-01, 横浜国立大学, Sep. 2009. pdf
  97. 高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: 頭部音響伝達関数を用いたGSSによる3話者同時発話認識 〜HARK 1.0.0 の新機能〜, 日本ロボット学会第27回学術講演会, 1I2-02横浜国立大学, Sep. 2009. pdf
  98. 大塚 琢馬, 中臺 一博, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: Voice-Awareness Control Consistent with Robot's Body Movements, 日本ロボット学会第27回学術講演会, 1I2-04, 横浜国立大学, Sep. 2009. pdf
  99. 水本 武志, 辻野 広司, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: テルミン演奏ロボットのための音高依存性を考慮した音量モデル. 日本ロボット学会第27回学術講演会, 1I3-01, 横浜国立大学, Sep. 2009. pdf
  100. 松山 匡子, 駒谷 和範, 武田 龍, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボット音声対話におけるバージン発話の指示対象同定, 日本ロボット学会第27回学術講演会, 1I3-02, 横浜国立大学, Sep. 2009. pdf
  101. 吉田 尚水, 中臺 一博, 奥乃 博: ロボット聴覚のための2階層視聴覚情報統合を用いた音声認識システムの検討, 日本ロボット学会第27回学術講演会, 1I3-04, 横浜国立大学, Sep. 2009. pdf
  102. 西出 俊, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 二次リカンレトニューラルネットワークを用いた道具身体化モデルの構築, 日本ロボット学会第27回学術講演会, 2S1-03, 横浜国立大学, Sep. 2009. pdf
  103. 日下 航, 神田 尚, 尾形 哲也, 小嶋 秀樹, 奥乃 博: RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションモデル, 日本ロボット学会第27回学術講演会, 3S2-03, 横浜国立大学, Sep. 2009. pdf
  104. 奥乃 博: ロボット聴覚が切り開く新たな可能性, 日本ロボット学会第27回学術講演会, 一般公開セッション 「サイボーグ技術は動き出すか? -- ロボット技術と人間機能の協調--」, 横浜国立大学, Sep. 17, 2009.
  105. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏楽曲の楽器音量バランス変化による音楽ジャンルシフト, 音楽情報科学研究会, Vol.2009-MUS-81, No.3, pp.1-6, 情報処理学会, Jul. 2009.
  106. 前澤 陽, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: 音響信号と音楽的制約を統合したバイオリンの演奏弦系列の推定, 音楽情報科学研究会, Vol.2009-MUS-81, No.5, pp.1-6, 情報処理学会, Jul. 2009.
  107. 安良岡 直希, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: 残差スペクトルモデルによる伴奏・残響成分抑制に基づいた楽器演奏分析合成の 高精度化, 音楽情報科学研究会, Vol.2009-MUS-81, No.10, pp.1-6, 情報処理学会, Jul. 2009.
  108. 藤原 弘将, 後藤 真孝, 奥乃 博: 多重奏中の歌声の基本周波数と音素を同時に推定可能な新たなフレームワーク, 音楽情報科学研究会, Vol.2009-MUS-, No.11, pp.1-8, 情報処理学会, Jul. 2009.
  109. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 複数楽器混合モデルのパラメータ推定と楽器名同定への応用, 音楽情報科学研究会, Vol.2009-MUS-81, No.13, pp.1-6, 情報処理学会, Jul. 2009.
  110. 駒谷 和範, 池田 智志, 福林 雄一朗, 尾形 哲也, 奥乃 博: 音声対話システムにおける文法検証結果と発話履歴に基づくヘルプメッセージ 候補のランキング, 情報処理学会音声言語情報処理研究会, Vol.2009-SLP-77, No.12, pp.1-6, 飯坂温泉, July 17-18, 2009, 情報処理学会.
  111. 松山 匡子, 駒谷 和範, 武田 龍, 尾形 哲也, 奥乃 博: バージイン発話タイミングを導入した指示対象同定, 情報処理学会音声言語情報処理研究会, Vol.2009-SLP-76, No.4, pp.1-7, 情報処理学会, May 2009. pdf 学生奨励賞

    特許・ディジタルコンテンツ

  112. Robot Auditory Apparatus. Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, Europian Patent EP 1,306,832, Publication Date: 02/24/2010 Filing Date: 06/08/2001
  113. 音楽音響信号生成システム 発明者: 安部 武宏, 糸山 克寿, 奥乃 博, 出願番号: PCT/JP2010/052293. 出願日: 2010年2月16日
  114. Sound source tracking system, method and robot. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Yuji Hasegawa, Hiroshi Okuno. Publication No: 20100034397, Publication Date: 2010-02-11. Application No: 12/293358, Application Date: 2007-05-09.
  115. 音声認識装置及び音声認識装置のマスク生成法, 発明者: 中臺 一博, 高橋 徹, 奥乃 博, 特開2010-49249号, 2010年3月4日. 特願2009-185164号, 2009年8月7日.
  116. ビートトラッキング装置, ビートトラッキング方法, 記録媒体, ビートトラッキング用プログラム, 及びロボット, 発明者: 中臺 一博, 長谷川 雄二, 辻野 広司, 村田 和真, 武田 龍, 奥乃 博, 特開2010-026512号, 2010年2月4日. 特願2009-166048号, 2009年7月14日.
  117. ビートトラッキング装置, ビートトラッキング方法, 記録媒体, ビートトラッキング用プログラム, 及びロボット, 発明者: 中臺 一博, 長谷川 雄二, 辻野 広司, 村田 和真, 武田 龍, 奥乃 博, 特開2010-026513号, 2010年2月4日. 特願2009-166049号, 2009年7月14日.
  118. 楽器音の音高・音長操作システム, 京都大学デジタルコンテンツ C46, Aug 2009. 開発者: 安部 武宏, 糸山 克寿, 奥乃 博
  119. 音楽音響信号の音源分離システム, 京都大学デジタルコンテンツ C45, May 2009. 開発者: 糸山 克寿, 奥乃 博, 後藤 真孝
  120. 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム. 発明者:後藤真孝, 吉井和佳, 奥乃 博, 特許第4318119号, 平成21年6月5日, 特願2004-181881号, 出願日 2004年6月18日, 登録日 2004年6月23日. pdf
  121. Robotics visual and auditory system, Patent No. US 7,526,361, Date of Patent: Apr. 28, 2009. Inventors: Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, PCT Files: Aug. 30, 2002. PCT No.: PCT/JP02/08827.

2009年度 o 2008年度(奥乃・尾形研究室)o 2007年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 西出 俊: Self-Organization of Invariants for Motion Generation based on Reliable Predictability (予測信頼性に基づく動作生成のための不変項の自己組織化), 博士論文 (指導教員: 奥乃博教授), Feb. 2009.
  2. Hyun-Don Kim: Binaural Active Audition for Humanoid Robots, (ヒューマノイドロボットのためのバイノーラルアクティブオーディション), 博士論文 (指導教員: 奥乃博教授), Sep. 2008.

  3. 安部 武宏: インハーモニシティを組み込んだ調波・非調波統合モデルに基づく 楽器音の音高・音長・音色操作, 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
  4. 池田 智志: 想定外発話に頑健なマルチドメイン音声対話システムのための ドメイン選択とヘルプ提示戦略, 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
  5. 神田 尚: 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく 音素獲得過程シミュレーション, 修士論文 (指導教員: 尾形哲也准教授), Feb. 2008.
  6. 久保田 祐史: 聴覚的アウエアネスの改善:顔動作による3次元音環境可視化システムの設計と実装, 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
  7. 王 凱平: Query-By-Example music retrieval approach based on music genre change by adjusting instrument volumes (楽器音量操作による楽曲ジャンル変化を利用した事例に基づく音楽検索法), 修士論文 (指導教員: 奥乃博教授), Feb. 2008.

  8. 大塚 琢馬: 歌唱ロボットのためのビートトラッキングを用いた多重奏音楽音響信号の 逐次的楽譜同期, 卒業特別研究報告, Feb. 2009.
  9. 日下 航: RNNを用いた2体のロボット間マルチモーダルインタラクションにおける モダリティマッピングの共有化, 卒業特別研究報告, Feb. 2009.
  10. 松山 匡子: 音声対話システムにおけるバージンタイミングと音声認識結果の統合に よる指示対象同定, 卒業特別研究報告, Feb. 2009.
  11. 安良岡 直希: 連続発音による生ずる音色特徴量変分の操作に基づく楽器演奏表情付け と音響信号の合成, 卒業特別研究報告, Feb. 2009.
  12. 中川 達裕: ロボットによる道具利用のための自己モデル変換を通じた道具身体化モデル, 卒業特別研究報告, Feb. 2009.

    査読つきジャーナル論文

  13. 安部 武宏, 糸山 克寿, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: 音色の音高依存性を考慮した楽器音の音高操作手法, 情報処理学会論文誌, Vol.50, No.3 (Mar., 2009) 1054-1066, 情報処理学会. pdf, DL
  14. 池田 智志, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチドメイン音声対話システムにおけるトピック推定と対話履歴の統合による ドメイン選択手法, 情報処理学会論文誌, Vol.50, No.2 (Feb., 2009) 488-500, 情報処理学会. pdf, DL
  15. 森勢 将雅, 高橋 徹, 河原 英紀, 入野 俊夫: 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析, 電子情報通信学会論文誌, 和文A分冊, Vol.J92-A, No.3 (Mar. 2009) 163-171.
  16. Shun Shiramatsu, Kazunori Komatani, Koiti Hasida, Tetsuya Ogata, Hiroshi G. Okuno: A Game-Theoretic Model of Referential Coherence and Its Empirical Verification Using Large Japanese and English Corpora, ACM Transactions on Speech and Language Processing, Vol.5, No.3 (Oct. 2008) Article 6, ACM. pdf doi:10.1145/1410358.1410360
  17. 藤原 弘将, 後藤 真孝, 奥乃 博: 歌声の統計的モデル化とビタビ探索を用いた多重奏中のボーカルパートに対する 音高推定手法, 情報処理学会論文誌, Vol.49, No.10 (Oct. 2008) pp.3682-3693, 情報処理学会. pdf, DL
  18. Chyon Hae Kin, Tetsuya Ogata, Shigeki Sugano: Reinforcement Signal Propagation Algorithm for Logic Circuit, Journal of Robotics and Mechatronics, Vol.20, No.5 (Oct. 2008) pp757-774.
  19. Kazunori Komatani, Satoshi Ikeda, Tetsuya Ogata, Hiroshi G. Okuno: Managing out-of-grammar utterances by topic estimation with domain extensibility in multi-domain spoken dialogue systems, Speech Communication, Vol.50, No.10 (2008) 836-870. doi:10.1016/j.specom.2008.05.010
  20. 武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: 独立成分分析に基づく適応フィルタのロボット聴覚への応用, 日本ロボット学会誌, Vol.26, No.6 (2008) pp.529-536. pdf, pdf学会サーバ
  21. Yuki Suga, Tetsuya Ogata, Shigeki Sugano: Human-Adaptive Robot Interaction using Interactive EC with Human-Machine Hybrid Evaluation, Journal of Robotics and Mechatronics, Vol.20, No.4 (Aug. 2008) pp.610-620.
  22. Hayeong Jeong, Shun Shiramatsu, Kiyoshi Kobayashi, and Tsuyoshi Hatori: Discourse Analysis of Public Debates Using Corpus Linguistic Methodologies, Journal of Computers, Vol.3, No.8 (Aug. 2008) pp.58--68.
  23. 福林 雄一朗, 駒谷 和範, 中野 幹生, 船越 孝太郎, 辻野 広司, 尾形 哲也, 奥乃 博: 音声対話システムにおけるラピッドプロトタイピングを指向したWFSTに基づく言語理解, 情報処理学会論文誌, Vol.49, No.8 (Aug. 2008) pp.2762--2772, 情報処理学会. pdf, DL
  24. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Predicting Object Dynamics from Visual Images through Active Sensing Experiences, Advanced Robotics, Vol.22, Issue 5 (May 2008) pp.527-546, doi:10.1163/156855308X294879 Online version, VSP and Robotics Society of Japan. IF: 0.510
  25. Hiroshi G. Okuno, Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata: A Portable Robot Audition Software System for Multiple Simultaneous Speech Signals, Journal of Acoustic Society of America, Vol.123, No.5 (May 2008) Pt.2, pp.3066-3067.
  26. Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Hideki Banno, Toshio Irino: A temporally stable representation of power spectra of periodic signals and its application to F0 and periodicity estimation, Journal of Acoustic Society of America, Vol.123, No.5 (May 2008) Pt.2, pp.3074-3075.

    編書・章分担・解説論文・翻訳

  27. Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SalienceGraph: Visualizing Salience Dynamics of Written Discourse by Using Reference Probability and PLSA, T. B. Ho and Z-H. Zhou (Eds.): PRICAI-2008: Trends in Artificial Intelligence, 890-902, (84/234, 35.8%), Lecture Notes in Computer Science, Vol.5351, Springer-Verlag, Dec. 2008. doi:10.1007/978-3-540-89197-0_83
  28. 合原一究: アマガエルの合唱に潜む非線形ダイナミクス, 科学, 78:11, pp.1267-1270, (Nov. 2008), 岩波書店.
  29. 奥乃 博: 多数の人の声を一度に聞き分ける聴覚センサ, 日経エレクトロニクス, 2008年9月22日号, 115-123.
  30. Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Integrating Topic Estimation and Dialogue History for Domain Selection in Multi-Domain Spoken Dialogue Systems, Ngoc Thanh Nguyen,Leszek Borzemski,Adam Grzech,Moonis Ali (Eds.): New Frontiers in Applied Artificial Intelligence, pp.294-304, Lecture Notes in Artificial Intelligence, Vol.5027, June, 2008. doi:10.1007/978-3-540-69052-8_31
  31. Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Vowel Imitation using Vocal Tract Model and Recurrent Neural Network, Masumi Ishikawa, Kenji Doya, Hiroyuki Miyamoto, Takeshi Yamakawa (Eds.): Neural Information Processing, 14th International Conference, ICONIP 2007, Revised Selected Papers, Part II, pp.222-232, Lecture Notes in Computer Science 4985, Springer-Verlag, June 2008. doi:10.1007/978-3-540-69162-4_24
  32. 奥乃 博: 洛書「触媒としての教員 -- 自学自習へのある試み」, 京大広報, No.634, 2008年5月.
  33. Tetsuya Ogata, Hideki Kojima, Hiroshi G. Okuno: Motion Emergence from Sound using Cross-Modal Mapping on Recurrent Neural Network, Aucouturier, J.-J. (ed.) Cheek to Chip: Dancing Robots and AI's Future, IEEE Intelligent Systems, Vol.23, No.2 (Apr. 2008), 74--84, doi:10.1109/MIS.2008.22

    査読つき国際会議論文

  34. Masato Onishi, Toru Takahashi, Toshio Irino, Hideki Kawahara: Vowel-based frequency alignment function design and recognition-based time alignment for automatic speech morphing, Proceedings of IEEE Workshop on Spoken Language Technology 2008 (SLT 2008), accepted, Goa, India, December, 15--18, 2008,
  35. Yuji Kubota, Masatoshi Yoshida, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Implementation of 3D Auditory Scene Visualizer towards Auditory Awareness with Face Tracking, Proceedings of IEEE International Symposium on Multimedia (ISM2008), pp.468-476 (acceptance rate for regular papers, 24%), Berkeley, Dec. 16. 2008. pdf doi:10.1109/ISM.2008.107
  36. Yuji Kubota, Shun Shiramatsu, Masatoshi Yoshida, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: 3D Auditory Scene Visualizer With Face Tracking: Design and Implementation For Auditory Awareness Compensation, Proceedings of 2nd International Symposium on Universal Communication (ISUC2008), pp.42-49, IEEE, Osaka, Dec. 15. 2008. pdf doi:10.1109/ISUC.2008.59
  37. Kazuhiro Nakadai, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino: An Open Source Software System For Robot Audition HARK and Its Evaluation, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008), pp.561-566, Daejeon, Korea, Dec. 3, 2008. pdf doi:10.1109/ICHR.2008.4756031
  38. Kazumasa Murata, Kazuhiro Nakadai, Ryu Takeda, Hiroshi G. Okuno, Toyotaka Torii, Yuji Hasegawa, Hiroshi Tsujino: A Beat-Tracking Robot for Human-Robot Interaction and Its Evaluation, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008), pp.79-84, Daejeon, Korea, Dec. 2, 2008. pdf doi:10.1109/ICHR.2008.4755935
  39. Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SalienceGraph: Visualizing Salience Dynamics of Written Discourse by Using Reference Probability and PLSA, <Proceedings of the Tenth Pacific Rim International Conference on Artificial Intelligence (PRICAI-08), 890-902, (84/234, 35.8%), Lecture Notes in Computer Science, Vol.5351, Springer-Verlag, Hanoi, Vienam, Dec. 15-19. 2008. doi:10.1007/978-3-540-89197-0_83
  40. Hiroshi G. Okuno: Computational Auditory Scene Analysis and Its Application to Robot Audition (Invited Talk), Proceedings of the Second International Symposium on Robotics and Artificial Intelligence, University of Electro-Communication and Shanghai Jiao Tong University, 9 Oct. 2008.
  41. Ikkyu Aihara: Synchronization and Frustration in Calling Behavior of Japanese Tree Frogs, Dynamics Days Asia Pacific 5 (DDAP5), September, 2008.(oral)
  42. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Analysis of Reliable Predictability based Motion Generation using RNNPB, Proceedings of Joint 4th International Conference on Soft Computing and Intelligent Systems and 9th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2008), pp.305-310, Nagoya, JAPAN, September 17-21, 2008.
  43. Hideki Kawahara, Masanori Morise, Hideki Banno, Toru Takahashi, Ryuichi Nishimura, Toshio Irino: Spectral Envelope Recovery beyond the Nyquist Limit for High-Quality Manipulation of Speech Sounds, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.22-26, Brisbane, Sept. 24, 2008.
  44. Toru Takahashi, Shun'ichi Yamamoto, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno:Soft Missing-Feature Mask Generation for Simultaneous Speech Recognition System in Robots, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.992-997, Brisbane, Sept. 24, 2008.
  45. Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Predicting ASR Errors by Exploiting Barge-In Rate of Individual Users for Spoken Dialogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.183--186, Brisbane, Sept. 2008.
  46. Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Expanding Vocabulary for Recognizing User\'s Abbreviations of Proper Nouns without Increasing ASR Error Rates in Spoken Dialogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.187-190, Brisbane, Sept. 2008.
  47. Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno:Extensibility Verification of Robust Domain Selection against Out-of-Grammar Utterances in Multi-Domain Spoken Dialogue System, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.487-490, Brisbane, Sept. 2008.
  48. Shun Nishide, Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Active Ssensing based Dynamical Object Feature Extraction, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), pp.1-7, TuAT1.1, IEEE, RSJ, Nice, 23 Sep. 2008. pdf doi:10.1109/IROS.2008.4650794
  49. Takeshi Mizumoto, Ryu Takeda, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: A Robot Listens to Music and Counts Its Beats Aloud by Separating Music from Counting Voice, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1538-1543, WeAT6.1 IEEE, RSJ, Nice, 24 Sep. 2008. pdf doi:10.1109/IROS.2008.4650821
    Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist.
  50. Hyun-Don Kim, Jinsung Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Target Speech Detection and Separation for Humanoid Robot in Sparse Dialogue with Noisy Home Environments (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1705-1711, WeAT10.4 IEEE, RSJ, Nice, 24 Sep. 2008. pdf doi:10.1109/IROS.2008.4650977
  51. Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Segmenting Acoustic Signal with Articulatory Movement using Recurrent Neural Network for Phoneme Aquisition (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1712-1717, WeAT10.5 IEEE, RSJ, Nice, 24 Sep. 2008. pdf doi:10.1109/IROS.2008.4651060
  52. Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Barge-in-able Robot Audition Based on ICA and Missing Feature Theory under Semi-Blind Situation (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1718-1723, WeAT10.6, IEEE, RSJ, Nice, 24 Sep. 2008. pdf doi:10.1109/IROS.2008.4650821
  53. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Evaluation of Two-Channel Sound Source Localization over Entire Azimuth Range for Moving Talker (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), pp.2197-2203 Sept. 2008 pdf IEEE, RSJ, Nice, Sept. 2008. doi:10.1109/IROS.2008.4650947
  54. Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotaka Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino: A Robot Uses Its Own Microphone to Synchronize Its Steps to Musical Beats While Scatting and Singing, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), pp.2459-2464, WeCT6.1, IEEE, RSJ, Nice, 24 Sep. 2008. pdf doi:10.1109/IROS.2008.4650596
    Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist.
  55. Kohei Sumi, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Chord Recognition Based on Probabilistic Integration of Chord Transition and Bass Pitch Estimation, Proceedings of 9th International Conference on Musical Information Retrieval (ISMIR-2008), 39-44, Philadelphia, 15 Sep. 2008. pdf
  56. Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrument Equalizer for Query-by-Example Retrieval: Improving Sound Source Separation based on Integrated Harmonic and Inharmonic Models, Proceedings of 9th International Conference on Musical Information Retrieval (ISMIR-2008),133-138, Philadelphia, 15 Sep. 2008. pdf
  57. Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotake Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino: A Robot Singer with Music Recognition Based on Real-Time Beat Tracking, Proceedings of 9th International Conference on Musical Information Retrieval (ISMIR-2008), 199-204, Philadelphia, 15 Sep. 2008. pdf
  58. Takehiro Abe, Katsutoshi Itoyama, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Synthesis Approach for Manipulating Pitch of a Musical Instrument Sound with Considering Timbral Characteristics, Proceeding of the 11th International Conference on Digital Audio Effects (DAFx-08), 249-256, Espoo, Finland, Sep.1-4. 2008. pdf
  59. Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Integrating Topic Estimation and Dialogue History for Domain Selection in Multi-Domain Spoken Dialogue Systems Proceeding of the 21st International Conference on Industrial, Engineering and Other Applications of Applied Intelligence Systems (IEA/AIE-2008), pp.294-304, (acceptance rate is about 30%), LNAI 5027, Wroclaw, Poland, Jun. 18, 2008. doi:10.1007/978-3-540-69052-8_31
  60. Hiroshi G. Okuno, Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata: A Portable Robot Audition Software System for Multiple Simultaneous Speech Signals, Proceedings of Acoustics'08, CD-ROM , 1pSCa8, June 30, 2008.
  61. Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Hideki Banno, Toshio Irino: A temporally stable representation of power spectra of periodic signals and its application to F0 and periodicity estimation, Proceedings of Acoustics'08, CD-ROM , 1pSCc24, June 30, 2008.
  62. Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Hideki Banno, Toshio Irino: A unified approach for F0 extraction and aperiodicity estimation based on a temporally stable power spectral representation, Proceedings of ISCA Tutorial and Research Workshop (ITRW) on "Speech Analysis and Processing for Knowledge Discovery", June 4, 2008, Aalborg, DK.
  63. Shun Nishide, Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Object Dynamics Prediction and Motion Generation based on Reliable Predictability, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008), 1608-1614, (May 20, 2008). pdf doi:10.1109/ROBOT.2008.4543431
  64. Kazuhiro Nakadai, Shun'ichi Yamamoto, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino: A Robot Referee for Rock-Paper-Scissors Sound Games, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008), 3469--3474, (May 20, 2008). pdf doi:10.1109/ROBOT.2008.4543741
  65. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Two-Channel-Based Voice Activity Detection for Humanoid Robots in Noisy Home Environments, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008), 3495-3501, (May 20, 2008). pdf doi:10.1109/ROBOT.2008.4543745
  66. Hiroshi G. Okuno, Kazuhiro Nakadai: COMPUTATIONAL AUDITORY SCENE ANALYSIS AND ITS APPLICATION TO ROBOT AUDITION, (invited talk), Proceedings of Hands-free Speech Communication and Microphone Arrays (HSCMA-2008), pp.123-127, May 7, 2008, Trento, Italy. pdf doi:10.1109/HSCMA.2008.4538702
  67. Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Toshio Irino, Hideki Banno: TANDEM-STRAIGHT: A Temporally Stable Power Spectral Representation for Periodic Signals and Applications to Interference-free Spectrum, F0, and Aperiodicity Estimation, Proceedings of 2008 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2008), pp.3933-3936, IEEE, Las Vegas, Nevada, USA, March 30 - April 4, 2008.

    口頭発表(研究会・全国大会)

  68. 合原 一究, 武田 龍, 水本 武志, 高橋 徹, 合原 一幸, 奥乃 博: ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析, ニューロコンピューティング研究会, 2009年3月13日.
  69. 鈴木 茉莉緒, 進矢 正宏 高橋 徹, 糸山 克寿, 奥乃 博, 小田 伸午: 西洋古典歌唱における発声時の頭部, 頸部, 胸部の姿勢変化, 京都体育学会, Mar. 2009.
  70. 合原 一究, 水本 武志, 武田 龍, 大塚 琢馬, 高橋 徹, 奥乃 博: Time-delayed model on frogs' calling behavior and novel device for localizing calling animals, 第14回聴覚研究フォーラム, P2, Mar. 2009.
  71. 高野 秀樹, 須見 康平, 糸山 克寿, 駒谷 和範, 尾形 哲也, 奥乃 博: ベース音高とクロマベクトルの相関に基づいた和音進行認識, 情報処理学会第71回全国大会, 5R-6, Mar. 2009. pdf
  72. 安良岡 直希, 安部 武宏, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: 連続発音中の音色変化に着目した未学習譜面情への演奏信号生成, 情報処理学会第71回全国大会, 4R-1, Mar. 2009. pdf 学生奨励賞
  73. 安部 武宏, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: 音色特徴量に基づく調波・非調波統合モデルによる楽器音モーフィング, 情報処理学会第71回全国大会, 4R-2, Mar. 2009. pdf
  74. 前澤 陽, 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博: Probabilistic Classification of Monophonic Instrument Playing Techniques, 情報処理学会第71回全国大会, 4R-3, Mar. 2009. pdf
  75. Wang Kaiping, 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: A Music Retrieval Approach from Alternative Genres of Query by Adjusting Instrument Volume, 情報処理学会第71回全国大会, 5R-5, Mar. 2009. pdf
  76. 井上 真大, 奥乃 博: 本質的に異なる数独解盤面の列挙と番号付け, 情報処理学会第71回全国大会, 5ZC-6, Mar. 2009. pdf
  77. 高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識, 情報処理学会第71回全国大会, 2D-1, Mar. 2009. pdf
  78. 水本 武志, 辻野 広司, 尾形 哲也, 高橋 徹, 奥乃 博: 楽器の内部モデルに基づくフィードフォワード制御によるテルミン演奏ロボットの 開発, 情報処理学会第71回全国大会, 4ZC-2, Mar. 2009. pdf
  79. 大塚 琢馬, 村田 和真, 武田 龍, 中臺 一博, 高橋 徹, 尾形 哲也, 奥乃 博, 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による 音楽音響信号と楽譜の実時間同期手法の開発, 情報処理学会第71回全国大会, 5R-7, Mar. 2009. pdf
  80. 水本 武志, 合原 一究, 高橋 徹, 尾形 哲也, 奥乃 博: フィールドにおける音源定位のための音声視覚化デバイス「カエルホタル」の設計, 情報処理学会第71回全国大会, 6U-5, Mar. 2009. pdf 学生奨励賞
  81. 久保田 祐史, 白松 俊: 駒谷 和範, 尾形 哲也, 奥乃 博: 顔追跡による音環境可視化システムのアウエアネスの改善, 情報処理学会第71回全国大会, 3Y-2, Mar. 2009. pdf
  82. 勝丸 真樹, 中野 幹生, 駒谷 和範, 成松 宏美, 船腰 孝太郎, 辻野 広司, 高橋 徹, 尾形 哲也, 奥乃 博: 音声認識と言語理解を動的に選択する音声理解フレームワーク, 情報処理学会第71回全国大会, 4Q-2, Mar. 2009. pdf
  83. 松山 匡子, 駒谷 和範, 白松 俊: 武田 龍, 尾形 哲也, 奥乃 博: 実環境音声対話システムにおけるバージイン発話タイミングを活用した 指示対象の同定, 情報処理学会第71回全国大会, 4Q-3, Mar. 2009. pdf
  84. 池田 智志, 駒谷 和範, 高橋 徹, 尾形 哲也, 奥乃 博: 音声対話システムにおける想定外発話の文法検証を用いた対話行為推定に基づくヘルプ生成, 情報処理学会第71回全国大会, 4Q-4, Mar. 2009. pdf
  85. 神田 尚, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博: 神経回路モデルを用いた音声模倣モデルによる音声バブリングと音声獲得過程 シミュレーション, 情報処理学会第71回全国大会, 5Q-3, Mar. 2009. pdf 学生奨励賞
  86. 日下 航, 神田 尚, 尾形 哲也, 小嶋 秀樹, 奥乃 博: RNNを備えた2対の小型ロボット間の首振り動作と音声によるインタラクションに おける共有シンボルの創発, 情報処理学会第71回全国大会, 5S-1, Mar. 2009. pdf 学生奨励賞 大会奨励賞
  87. 中川 達裕, 尾形 哲也, 谷 淳, 高橋 徹, 奥乃 博: ロボットによる卓上物体操作のためのRNNを用いた道具身体化モデルの構築, 情報処理学会第71回全国大会, 3D-3, Mar. 2009. pdf 大会奨励賞
  88. 合原 一究, 武田 龍, 水本 武志, 高橋 徹, 合原 一幸, 奥乃 博: ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析, 電子情報通信学会技術研究報告, NC, ニューロコンピューティング, 108(480), 335-339, 2009年3月4日.
  89. 白松 俊, 駒谷 和範, 尾形 哲也, 高橋 徹, 奥乃 博: 話題遷移図の可視化と話題遷移に応じた関連情報提示による議事録閲覧支援, 言語処理学会第15回年次大会, D2-1, Mar. 3, 2009.
  90. 武田 龍: 独立成分分析と雑音下音声認識技術によるロボット聴覚, 京都大学ICTイノベーション2009, 2009年2月20日.
  91. 高橋 徹: 聖徳太子ロボットから順風耳ロボットへ, 京都大学ICTイノベーション2009, 2009年2月20日.
  92. 合原 一究: アマガエルの同期した発声行動に関する数理的・実験的研究, 北陸応用数理研究会2009, 2009年2月12日.
  93. 勝丸 真樹, 中野 幹生, 駒谷 和範, 成松 宏美, 船腰 孝太郎, 辻野 広司, 高橋 徹, 尾形 哲也, 奥乃 博: 複数の言語モデル・言語理解方式を用いた音声理解の高精度化, 第75回音声言語情報処理研究会, 2009-SLP-75 (9), pp.45-50, 情処研報, Vol.2009, No.10, 情報処理学会, 越後湯沢, Feb. 7, 2009.
  94. 合原 一究, アマガエルの発声行動における同期現象, 第2回自己組織化討論会, 2008年1月12日.
  95. Ikkyu Aihara, Takeshi Mizumoto, Toru Takahashi, Ryu Takeda, Hiroshi G.Okuno: Complex Synchronization in Calling Behavior of Three Japanese Tree Frogs, 第13回聴覚研究フォーラム、2008年12月.
  96. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 楽器音イコライザ:楽器パートの音量を操作可能なオーディオプレイーヤ, (社)音響学会関西支部 第11回若手研究者交流研究発表会, 2008年12月17日. 優秀賞
  97. 神田 尚, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博: RNNを用いた構音運動分節化に基づく連続母音模倣モデル, (社)音響学会関西支部 第11回若手研究者交流研究発表会, 2008年12月17日.
  98. 合原 一究, 武田 龍, 高橋 徹, 水本 武志, 奥乃 博: アマガエルの同期した発声行動に関する実験的・数理的研究, (社)音響学会関西支部 第11回若手研究者交流研究発表会, 2008年12月17日. 最優秀賞
  99. 河原 英紀, 森勢 将雅, 高橋 徹, 坂野 秀樹, 西村 竜一, 入野 俊夫: 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの 時系列への拡張について, 第78回音楽情報科学研究会, 日本音響学会音楽音響研究会, pp.xx--xx, Dec. 19--20, 2008.(草津/滋賀), (発表日12月20日)
  100. 河原 英紀, 森勢 将雅, 高橋 徹 坂野 秀樹, 西村 竜一, 入野 俊夫: 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について, 電子情報通信学会技術研究報告, SP2008-xx, vol.xxx, no.xxx, pp.xx--xx, December, 9--10, 2008. (早稲田/東京), (発表日12月xx日)
  101. 神田 尚, 尾形 哲也, 高橋 徹, 駒谷 和範, 奥乃 博: 連続音響信号と構音情報の分節化に基づく母音音声模倣モデル, 第9回システムインテグレーション部門講演会(SI2008), pp. 639-640, 計測自動制御学会, Dec. 5-7, 2008.
  102. 西出 俊, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: ロボットによるRNNPBを用いた高予測信頼性動作探索とその解析, 第9回システムインテグレーション部門講演会(SI2008), pp. 81-82, 計測自動制御学会, Dec. 5-7, 2008.
  103. Ikkyu Aihara, Ryu Takeda, Toru Takahashi, Takeshi Mizumoto, Hiroshi G.Okuno: Experimental and Theoretical Studies on Synchronized Calling Behavior of Three Japanese Tree Frogs, 日本スロベニア共同セミナー, 2008年11月.
  104. 合原 一究, ニホンアマガエルの発声行動における時空間構造, 第66回形の科学シンポジウム, 2008年11月.
  105. 吉井 和佳, 後藤 真孝, 奥乃 博: HybridRecommender: 安心感と意外性を兼ね備えた音楽推薦システム, WISS2008 デモ・ポスターセッション, 2008年11月27日.
  106. Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Vocal Imitation Model with Segmenting and Composing Capability of Vowel Structure using Recurrent Neural Network, 第28回 AI チャレンジ研究会, SIG-Challenge-A802-2, pp.7--12, 人工知能学会, Nov. 2008.
  107. 村田 和真 中臺 一博, 武田 龍, 奥乃 博, 長谷川 雄二, 辻野 広司: ビートトラッキングロボットの構築と評価, 第28回 AI チャレンジ研究会, SIG-Challenge-A802-3, pp.13--20, 人工知能学会, Nov. 2008. (社)人工知能学会 2008年度研究会優秀賞
  108. 森勢 将雅, 坂野 秀樹, 高橋 徹, 河原 英紀, 片寄 晴弘: 歌唱モーフィングインタフェースにおける実時間インタラクションの検討, 日本音響学会2008年秋季研究発表会講演論文集, p.95, Sept. 10--12, 2008, (九州大学/福岡), (発表日 9月10日).
  109. 大西 壮登, 高橋 徹, 入野 俊夫, 河原 英紀: 母音情報を用いた自動化音声モーフィングの方式パラメータの評価について, 日本音響学会2008年秋季研究発表会講演論文集, p.53, Sep. 10--12, 2008, (九州大学/福岡), (発表日 9月10日).
  110. 河原 英紀, 森勢 将雅, 高橋 徹, 坂野 秀紀, 大西 壮登, 板垣 英恵, 西村 竜一, 入野 俊夫: 零周波数フィルタ信号に基づく基本周波数抽出法の評価と応用について, 日本音響学会2008年秋季研究発表会講演論文集, p.99, Sep. 10--12, 2008, (九州大学/福岡), (発表日 9月11日).
  111. 高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: ミッシングフィーチャ理論に基づく複数話者同時発話音声認識における 音響特徴量とマスクの検討, 日本音響学会 2008年秋季研究発表会講演論文集, p.95-06, 10-12 Sep. 2008.
  112. 高橋 徹, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボット聴覚のためのソフトマスク生成法による周辺話者音声認識率の改善, 日本ロボット学会第26回学術講演会, 1A1-01, pp.43-46, 9-11, Sep. 2008. pdf
  113. 水本 武志, 武田 龍, 吉井 和佳, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: 聴覚機能を持つ音楽ロボットのためのアーキテクチャの設計とビートカウントロボットへの適用, 日本ロボット学会第26回学術講演会, 1A1-02 , Sep. 2008. pdf
  114. 村田 和真, 中臺 一博, 武田 龍, 吉井 和佳, 奥乃 博, 鳥井 豊隆, 長谷川 雄二, 辻野 広司: 人・ロボットインタラクションに向けたビートトラッキングロボットの開発とその評価, 日本ロボット学会第26回学術講演会, 1A1-03 , Sep. 2008. pdf
  115. 神田 尚, 尾形 哲也, 駒谷 和範, 奥乃 博: RNNを用いた連続音響信号からの母音構造と遷移情報の抽出, 日本ロボット学会第26回学術講演会, 1A2-01, Sep. 2008. pdf
  116. 武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: 独立成分分析を応用したロボット聴覚による残響下におけるバージイン発話認識, 日本ロボット学会第26回学術講演会, 1A2-02, Sep. 2008. pdf
  117. 中臺 一博, 奥乃 博, 中島 弘史, 長谷川 雄二, 辻野 広司: ロボット聴覚オープンソースソフトウェアHARKの概要と評価, 日本ロボット学会第26回学術講演会, 1A2-04 , Sep. 2008. pdf
  118. 尾形 哲也, 横矢 龍之介, 谷 淳, 駒谷 和範, 奥乃 博: ロボットにおける自己身体の順逆モデルを再利用した他者行為の予測と模倣, 日本ロボット学会第26回学術講演会, 1J1-04, Sep. 2008. pdf
  119. 西出 俊, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 物体挙動予測モデルによる動画像特徴量の自己組織化, 日本ロボット学会第26回学術講演会, 2N2-04, Sep. 2008. pdf
  120. 近藤 裕樹, 奥出 京司郎, 岩丸 大二郎, 守 良真, 菅 佑樹, 尾形 哲也, 菅野重樹: 形態主張型コミュニケーションロボットにおける研究 〜形態主張行動の解かり易さのユーザへの影響にかんする研究〜, 日本ロボット学会第26回学術講演会, 3J2-02, Sep. 2008. pdf
  121. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 楽器音イコライザによる音色の類似度に基づく楽曲検索システム, 音楽情報科学研究会, 2008-MUS-78-24, Vol.2008, No.78, pp.143-148, 情報処理学会, 8 Aug. 2008.
  122. 安部 武宏, 糸山 克寿, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: 音高による音色変化を考慮した楽器音の音高・音長操作手法, 音楽情報科学研究会, 2008-MUS-78-26, Vol.2008, No.78, pp.155-160, 情報処理学会, 8 Aug. 2008.
  123. 白松 俊, 久保田 祐史, 駒谷 和範, 尾形 哲也, 奥乃 博: SalienceGraph: 参照確率に基づく話題遷移図の可視化, 第22回人工知能学会全国大会, 1H1-01, Jun. 11, 2008.
  124. 近藤, 坂上, 奥出, 岩丸, 菅 佑樹, 尾形 哲也, 菅野 重樹: ユーザのカスタマイズを受容・拒否できる機構を持つロボットシステムの開発, 2008 JSME Conference on Robotics and Mechatronics ロボッティクス・メカトロニクス講演会 (ROBOMEC'08), 1P1-G11, Jun. 6, 2008.
  125. 中臺 一博, 山本 俊一, 奥乃 博, 中島 弘史, 長谷川 雄二, 辻野 広司: ロボット聴覚用オープンソフトウェアHARKの概要, ROBOMEC'08, 1P1-G13, Jun. 6, 2008.
  126. 神田 尚, 尾形 哲也, 駒谷 和範, 奥乃 博: 音素獲得に向けたリカンレトニュ-ラルネットワ-クによる音響信号と 構音運動の分節化, ROBOMEC'08, 2P1-G03, Jun. 7, 2008.
  127. 菅 佑樹, 小林 大三, 尾形 哲也, 菅野 重樹: 神経調節機能を参考とした自律エージェントの神経制御器の開発, ROBOMEC'08, 2P1-G05, Jun. 7, 2008.
  128. 有江 浩明, 尾形 哲也, 谷 淳, 菅野 重樹: 物体操作に関する脳の情報処理構造を参考にした運動学習モデル, ROBOMEC'08, 2P1-G06, Jun. 7, 2008.
  129. 勝丸 真樹, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける簡略表現認識のための誤認識増加を 抑制する自動語彙拡張, 第185回自然言語処理研究会, 2008-NL-185 (11), 第71回音声言語情報処理研究会, 2008-SLP-71 (11), pp.71-76, 情処研報, Vol.2008, No.46, 情報処理学会, 横浜国立大学, May 23, 2008. 学生奨励賞

    特許・ディジタルコンテンツ

  130. Sound-source separation system, Application No. 20090043588. Filed: February 12, 2009. Inventors: Ryu Takeda, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno. PCT No.: PCT/JP05/22601.
  131. Sound-Spurce Sepation System. Ryu Takeda, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Europian Patent EP 2,023,343, Publication Date: 02/11/2009 Filing Date: 08/11/2008
  132. 音源分離システム, 発明者: 武田 龍, 中臺 一博, 辻野 広司, 奥乃 博, 特開2009-42754号, 2009年2月26日. 特願2008-191382号, 2008年7月24日.
  133. 音楽音響信号の音色変更システム, 発明者: 安部 武宏, 糸山 克寿, 奥乃 博, 特願2009-34664号, 2009年2月17日. 出願人: 国立大学法人京都大学
  134. 文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松 俊, 駒谷 和範, 奥乃 博, 国内出願 出願日: 2008年12月12日. PCT/JP2007/055448, 国際出願日:16 Mar. 2007. 出願者: 京都大学
  135. 言語理解装置, 発明者: 中野 幹生, 奥乃 博, 福林 雄一朗, 船越 孝太郎, 特開2008-293019号, 2008年12月4日. 特願2008-134401号, 2008年5月22日.
  136. Moving object equipped with ultra-directional speaker. Patent No. US 7,424,118, Date of Patent: Sep. 9, 2008. Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, and Hiroshi Tsujino. PCT Files: Feb. 10, 20052. PCT No.: PCT/JP2005/002043.
  137. Sound Source Separation System, Sound Source Separation Method, and Computer Program for Sound Source Separation, PCT/JP2008/057310, WO 2008/133097 国際公開日: 06.11.2008, Inventors: Katsutoshi Itoyama, Hiroshi Okuno, Masataka Goto. 京都大学, 産総研.
  138. 音源分離システム, 発明者: 武田 龍, 中臺 一博, 辻野 広司, 奥乃 博, 特願2008-191382号, 2008年7月24日.
  139. 音声認識装置, 発明者: 中臺 一博, 辻野 広司, 奥乃 博, 山本 俊一, 特許第4157581号, 登録日:2008年7月18日, 発行日:2008年10月1日. 国際公開 PCT/JP2005/022601, 2006年6月8日. 特願2006-546764号, 2005年12月2日. pdf
  140. 音データ記録再生装置および音データ記録再生方法, 発明者: 中臺 一博, 長谷川 雄二, 辻野 広司, 奥乃 博, 特開2008-197650号, 2008年8月28日. 特願2008-25678号, 2008年2月5日.
  141. Moving object equipped with ultra-directional speaker, Patent No. US 7,424,118, Date of Patent: Sep. 9, 2008. Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, PCT No.: PCT/JP2005/002043.
  142. Speech Recognition Apparatus, Application No. 20080167869. Filed: July 10, 2008. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto. PCT No.: PCT/JP05/22601.
  143. 音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法, 発明者: 藤原 弘将, 奥乃 博, 後藤 真孝, 特開2008-134606号, 2008年6月12日. 特願2007-233682号, 2007年9月10日.
  144. 会話システムおよび会話ソフトウエア, 発明者: 中野 幹夫, 奥乃 博, 駒谷 和範, 再表2006/093092, 国際公開番号: WO2006/093092, 国際公開日:2006年9月8日, 発行日:2008年8月7日. 特願2007-505922号, 国際出願番号:PCT/JP2006/303613 国際出願日:2006年2月27日.
  145. 音声認識装置, 発明者: 中臺 一博, 辻野 広司, 奥乃 博, 山本 俊一, 再表2006/059806, 国際公開番号: WO2006/059806, 国際公開日:2006年6月8日, 発行日:2008年6月5日. 特願2006-546764号, 国際出願番号:PCT/JP2005/022601. 国際出願日:2005年12月2日.
  146. 音源分離システム, 音源分離方法及び音源分離用コンピュータプログラム, 発明者: 糸山 克寿, 奥乃 博, 後藤 真孝, PCT/JP2008/057310, 国際出願日: 2008年4月14日.

  147. SalienceGraph (議事録閲覧システム), <\ttl> 京都大学デジタルコンテンツC32, Aug. 2009. 開発者: 白松 俊, 奥乃 博

2008年度 o 2007年度(奥乃・尾形研究室)o 2006年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 白松 俊: Salience-based Modeling of Discourse Context (顕現性に基づく談話文脈のモデル化), 博士論文, Feb. 2008. pdf
  2. 山本 俊一: Real-Time Robot Audition Software Based on Missing Feature Theory for Multiple Simultaneous Talkers in Real Environments (実環境における同時発話認識のためのミッシングフィーチャ理論に基づくリアルタイムロボット聴覚ソフトウェア), 博士論文, Feb. 2008.
  3. 吉井 和佳: Studies on Hybrid Music Recommendation Using Timbral and Rhythmic Features, 博士論文, Feb. 2008.

  4. 糸山 克寿: 調波・非調波統合モデルの制約付きパラメータ推定による多重奏音楽音響信号 の音源分離, 修士論文, Feb. 2008.
  5. 武田 龍 ロボット聴覚におけるICAとMFT-ASRに基づくバージイン発話認識, 修士論文, Feb. 2008.
  6. 福林 雄一朗: WFSTに基づくラピッドプロトタイピング向け音声言語理解と 想定外発話からのユーザ知識推定への応用, 修士論文, Feb. 2008.
  7. 徳田 浩一: 聴覚障害者支援のためのHMDを用いた音環境可視化システム, 修士論文, Feb. 2008.
  8. 横矢 龍之介: ロボットによる自己モデル投影に基づく他者の発見と模倣, 修士論文, Feb. 2008.

  9. 須見 康平: 音楽音響信号に対するベース音高推定を利用した確率的統合に基づく和音進行認識, 卒業特別研究報告, Feb. 2008.
  10. 勝丸 真樹: 音声対話システムにおける固有名詞簡略表現の認識のための誤認識増加を抑制する 語彙拡張, 卒業特別研究報告, Feb. 2008.
  11. 斎藤 博己: 音楽と映像の相関に基づくミュージックビデオのクロスメディア検索, 卒業特別研究報告, Feb. 2008.
  12. 張 陽: 人工神経回路モデルによる動作・言語変換を利用した人間ロボット音声協調の実装, 卒業特別研究報告, Feb. 2008.
  13. 水本 武志: 音楽と自発声を聞き分けながらビート構造に合わせて発声するロボットの研究, 卒業特別研究報告, Feb. 2008.

    査読つきジャーナル論文

  14. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 楽譜情報を援用した多重奏音楽音響信号の音源分離と 調波・非調波統合モデルの制約付パラメータ推定の同時実現, 情報処理学会論文誌, Vol.49, No.3 (Mar. 2008) pp.1465-1479, 情報処理学会. pdf, DL 第24回電気通信普及財団賞 (テレコム技術学生賞)
  15. 横矢 龍之介, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 自己モデルの投影に基づくロボットによる他者発見と動作模倣, ヒューマンインタフェース学会論文誌, Vol.10, No.1 (Feb. 2008) pp.59-72.
  16. Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: An Efficient Hybrid Music Recommender System Using an Incrementally Trainable Probabilistic Generative Model, IEEE Transactions on Audio, Speech and Language Processing, Vol.16, No.2 (Feb. 2008) pp.435-447, pdf, doi:10.1109/TASL.2007.911503
  17. 白松 俊, 駒谷 和範, 橋田 浩一, 尾形 哲也, 奥乃 博: ゲーム理論に基づく参照結束性のモデル化と日本語・英語の大規模コーパスを 用いた統計的検証, 自然言語処理, Vol.14, No.4 (Oct. 2007) pp.199-239.
  18. Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Experience Based Imitation Using RNNPB, Advanced Robotics, Vol.21, Issue 12 (2007) pp.1351-1367, doi:10.1163/156855307781746106, Online version, VSP and Robotics Society of Japan. IF: 0.510
  19. 金 天海, 出澤 純一, 尾形 哲也, 菅野重樹: 自己組織化回路素子SONEにおけるノイズの抑制, 日本ロボット学会誌, Vol.25, No.6 (Sep. 2007) pp.115-122. 学会サーバ
  20. 中臺 一博, 中島 弘史, 村瀬 昌満, 奥乃 博, 長谷川 雄二, 辻野 広司: 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡, 日本ロボット学会誌, Vol.25, No.6 (Sep. 2007) pp.181-191. pdf, pdf学会サーバ
  21. Jean-Marc Valin, Shun'ichi Yamamoto, Jean Rouat, Francois Michaud, Kazuhiro Nakadai, Hiroshi G. Okuno: Robust Recognition of Simultaneous Speech By a Mobile Robot, IEEE Transactions on Robotics, Vol.23, No.4 (Aug. 2007) pp.742--752. pdf, doi:10.1109/TRO.2007.900612
  22. 池田 智志, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチドメイン音声対話システムにおける想定外発話への対処のためのWebを用いたシステム知識の拡張, 情報技術レターズ (第6回情報科学技術フォーラム(FIT2007)講演論文集), LE-007, 2007.
  23. 福林 雄一朗, 駒谷 和範, 中野 幹生, 船越 孝太郎, 辻野 広司, 尾形 哲也, 奥乃 博: 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の 高精度化, 情報技術レターズ (第6回情報科学技術フォーラム(FIT2007)講演論文集), LE-008, 2007.
  24. Hiroaki Arie, Tetsuya Ogata, Jun Tani, and Shigeki Sugano: Reinforcement learning of continuous motor sequence with hidden state, Advanced Robotics, Special Issue on Robotic Platforms for Research in Neuroscience, VSP and Robotics Society of Japan, Vol.21, Issue 10 (July 2007), pp.1215-1229. Online version doi:10.1163/156855307781389365 IF: 0.510
  25. Taro Watanabe, Kenji Imamura, Eiichiro Sumita, Hiroshi G. Okuno: Statistical machine translation using hierarchical phrase alignment, Systems and Computers in Japan, Vol.38, No.6 (June 2007) pp.70-79, doi:10.1002/scj.20271
  26. 神田 直之, 駒谷 和範, 中野 幹生, 中臺 一博, 辻野 広司, 尾形 哲也, 奥乃 博: マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択, 情報処理学会論文誌, Vol.48, No.5 (May 2007) pp.1980-1989, 情報処理学会. pdf DL

    編書・章分担・解説論文・翻訳

  27. 奥乃 博, 溝口 博: ロボット聴覚のための情報統合の現状と課題 (韓国語訳), 自動化技術, Vol.24, No.3 (Mar. 2008) pp.60-63. www.chomdan.co.kr
  28. Koiti Hasida, Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Meaning Games, New Frontiers in Artificial Intelligence, Lecture Notes in Computer Science, Vol.4914, pp.228-241, Springer-Verlag, Feb. 2008. doi:10.1007/978-3-540-78197-4_21
  29. 奥乃 博, ロボットによる人の聴覚処理への構成的アプローチ, 特集 ロボットメディアによる人間情報処理研究, 情報処理, Vol.49 No.1 (Jan., 2008) 15-23, 情報処理学会. 電子図書館
  30. 尾形 哲也: 人工神経回路モデルによるインタラクション創発システム実現に向けて, 日本神経回路学会誌, Vol.14, No.4 (Dec. 2007) pp.282-292. オンライン
  31. 奥乃 博, 山本 俊一: 音環境理解コンピューティング, 人工知能学会誌, レクチャーシリーズ:「知能コンピューティングとその周辺」第5回, Vol.22, No.6 (Nov. 2007) pp.846-854.
  32. Hiroshi G. Okuno, Moonis Ali (Eds.): New Trends in Applied Artificial Intelligence (IEA/AIE-2007), Lecture Notes in Computer Science, Vol.4570, Springer-Verlag, 14 Jun. 2007, XXI, 1194p. ISBN: 978-3-540-73322-5. doi:10.1007/978-3-540-73325-6
  33. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Auditory and Visual Talker Tracking through integrating EM algorithm and Particle Filter, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.280-290, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_28
  34. Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Two Simultaneous Continous Speech Recognition with ICA BSS and MTF-based ASR, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.384-394, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_38
  35. 奥乃 博, 北原 鉄朗, 吉井 和佳: 楽曲の特徴量抽出と検索技術, 電気学会誌, 特集「音響機器は進歩している 6」, Vol.127, No.7 (Jul. 2007) pp.417--420.
  36. 奥乃 博, 溝口 博:ロボット聴覚のための情報統合の現状と課題, 計測と制御, 「ロボット聴覚のためのインテグレーション技術」特集, Vol.46, No.6 (Jun. 2007) pp.415-419.
  37. 山本 俊一, 武田 龍, 奥乃 博: ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識, 計測と制御, 「ロボット聴覚のためのインテグレーション技術」特集, Vol.46, No.6 (Jun. 2007) pp.447-452.
  38. 北原 鉄朗訳: 音楽情報検索, CACM 日本語版, Vol.6, No.2, pp.1-3
    原著: SPECIAL ISSUE: Music information retrieval, Introduction, by Bryan Pardo, CACM, Vol.49, No.8 (Aug. 2006) 29-31.
  39. 吉井 和佳訳: 音楽音響信号からの情報抽出, CACM 日本語版, Vol.6, No.2, pp.4-10
    原著: Extracting information from music audio, by Daniel P.W. Ellis, CACM, Vol.49, No.8 (Aug. 2006) 32-37.
  40. 藤原 弘将訳: 楽譜アラインメントとコンピュータ自動伴奏, CACM 日本語版, Vol.6, No.2, pp.11-16
    原著: Music score alignment and computer accompaniment, by Roger B. Dannerberg, Christoppher Raphael, CACM, Vol.49, No.8 (Aug. 2006) 38-43.
  41. 北原 鉄朗訳: Shazam 音楽認識サービス, CACM 日本語版, Vol.6, No.2, pp.17-21
    原著: The Shazam music recognition service, by Avery Wang, CACM, Vol.49, No.8 (Aug. 2006) 44-48.
  42. 藤原 弘将訳: VocalSsearchシステムによる鼻歌検索, CACM 日本語版, Vol.6, No.2, pp.22-26
    原著: Query by humming with the VocalSearch system, by William Birmingham, Roger Dannenberg, Bryan Pardo, CACM, Vol.49, No.8 (Aug. 2006) 49-52.
  43. 糸山 克寿訳: Variation2: 学術的環境における音楽の検索と利用, CACM 日本語版, Vol.6, No.2, pp.27-34
    原著: Variation2: retrieving and using music in an academic setting, by Jon W. Dunn, Donald Byrd, Mark Notess, Jenn Riley, RYan Scherle, CACM, Vol.49, No.8 (Aug. 2006) 53-58.
  44. Shinichi Ueno, Fumihiro Adachi, Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Bus Information System Based on User Models and Dynamic Generation of VoiceXML Scripts, New Frontiers in Artificial Intelligence (JSAI 2003/2004), LNAI 3609, pp.45-60, 2007. Springer-Verlag. doi:10.1007/978-3-540-71009-7_4

    査読つき国際会議論文

  45. Yuichiro Fukubayashi, Kazunori Komatani, Mikio Nakano, Kotaro Funakoshi, Hiroshi Tsujino, Tetsuya Ogata, Hiroshi G. Okuno: Rapid Prototyping of Robust Language Understanding Modules with Less Training Data for Spoken Dialogue Systems, Proceedings of the Third International Joint Conference on Natural Language Processing (IJCNLP 2008), pp.210-216, Jan. 2008, Hyderabad, India.
  46. Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Implementation of A Robot Audition System for Automatic Speech Recognition of Simultaneous Speech, Proceedings of IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU-2007), 111-116, acceptance rate (115/267), IEEE, Kyoto, Dec. 2007. pdf doi:10.1109/ASRU.2007.4430093
  47. Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Vocal Imitation using Vocal Tract Model and Recurrent Neural Network, Proceedings of International Conference on Neural Information Processing (ICONIP-2007), Vol.2, pp.222-232, Nov. 2007.
  48. Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Vocal Imitation Using Physical Vocal Tract Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1846-1851, IEEE, RSJ, San Diego, Oct. 2007. pdf doi:10.1109/IROS.2007.4399137
  49. Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Discovery of Other Individuals by Projecting a Self-Model Through Imitation, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1009-1014, IEEE, RSJ, San Diego, Oct. 2007. pdf doi:10.1109/IROS.2007.4399153
  50. Kazuyoshi Yoshii, Kazuhiro Nakadai, Toyotaka Torii, Yuji Hasegawa, Hiroshi Tsujino, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: A Biped Robot that Keeps Steps in Time with Musical Beats while Listening to Music with Its Own Ears, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1743-1750, IEEE, RSJ, San Diego, Oct. 2007. pdf doi:10.1109/IROS.2007.4399244
  51. Tetsuya Ogata, Masamitsu Murase, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno, Two-way Translation of Compound Sentences and Arm Motions by Recurrent Neural Networks, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1858-1863, IEEE, RSJ, San Diego, Oct. 2007. pdf doi:10.1109/IROS.2007.4399265
  52. Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Exploiting Known Sound Sources to Improve ICA-based Robot Audition in Speech Separation and Recognition, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1757-1762, IEEE, RSJ, San Diego, Oct. 2007. pdf
  53. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Auditory and Visual Integration based Localization and Tracking of Humans in Daily-life Environments, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.2021-2027, IEEE, RSJ, San Diego, Oct. 2007. pdf
  54. Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Hybrid Collaborative and Content-based Music Recommendation Using Probabilistic Model with Latent User Preferences, Proceedings of 8th International Conference on Musical Information Retrieval (ISMIR-2007), long paper (15.8% of 214 submissions), pp.89-94, Vienna, Sep. 2007.
  55. Kazunori Komatani, Yuichiro Fukubayashi, Tetsuya Ogata, Hiroshi G. Okuno: Introducing Utterance Verification in Spoken Dialogue System to Improve Dynamic Help Generation for Novice Users, Proceedings of the 8th SIGdial Workshop on Discourse and Dialogue, pp.202-205, Sep. 2007
  56. Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Topic Estimation with Domain Extensibility for Guiding User's Out-of-Grammar Utterance in Multi-Domain Spoken DIalogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2007), pp.2561-2564,, Antwerp, Sep. 2007. pdf
  57. Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Analyzing Temporal Transition of Real User's Behaviors in a Spoken Dialogue System, Proceedings of International Conference on Spoken Language Processing (Interspeech-2007), pp.142-145, Antwerp, Sep. 2007. pdf
  58. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Auditory and VIsual Integration based Localization and Tracking of Multiple Moving Sounds in Daily-life Environments, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man 2007), 399-404, IEEE, Jeju Island, Korea, Aug. 2007. pdf doi:10.1109/ROMAN.2007.4415117
  59. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Auditory and Visual Talker Tracking through integrating EM algorithm and Particle Filter, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.280-290, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_28
  60. Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Two Simultaneous Continous Speech Recognition with ICA BSS and MTF-based ASR, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.384-394, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_38
  61. Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: INTEGRATION AND ADAPTATION OF HARMONIC AND INHARMONIC MODELS FOR SEPARATING POLYPHONIC MUSICAL SIGNALS, Proceedings of 2007 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2007), pp.57-60, IEEE, Hawaii, April 2007, pp.57-60, (15.1% acceptance rate for lecture presentation) doi:10.1109/ICASSP.2007.366615
  62. Haruhiko Niwa, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Distance Estimation of Hidden Objects Based on Acoustical Holography by applying Acoustic Diffraction of Audible Sound, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), pp.423-428, (Apr. 2007). doi:10.1109/ROBOT.2007.363823
  63. Tetsuya Ogata, Shohei Matsumoto, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Human-Robot Cooperation using Quasi-symbols Generated by RNNPB Model, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), pp.2156-2161, (Apr. 2007). doi:10.1109/ROBOT.2007.363640
  64. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Predicting Object Dynamics from Visual Images through Active Sensing Experiences, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), pp.2501-2506, (Apr. 2007). doi:10.1109/ROBOT.2007.363841
  65. Chyon Hae Kim, Tetsuya Ogata, Shigeki Sugano: Enhancement of Self Organizing Network Elements for Supervised Learning, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), WeA3.5, (Apr. 2007).

    査読なし国際会議論文

  66. Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani: Robot Audition from the viewpoint of Computational Auditory Scene Analysis, Proceedings of the International Conference on Informatics Education and Research for Knowledge-Creation Society Infrastructure (ICKS'08), pp.35-40, Jan. 2008. doi:10.1109/ICKS.2008.10
  67. Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Structual Feature Extraction based on Active Sensing Experiences, Proceedings of the International Conference on Informatics Education and Research for Knowledge-Creation Society Infrastructure (ICKS'08), pp.169-172, Jan. 2008. doi:10.1109/ICKS.2008.9
  68. Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Two-Channel-Based Sound Source Localization using 3D Moving Sound Creation Tool, Proceedings of the International Conference on Informatics Education and Research for Knowledge-Creation Society Infrastructure (ICKS'08), pp.209-212. doi:10.1109/ICKS.2008.25

    口頭発表(研究会・全国大会)

  69. 藤原 弘将, 後藤 真孝, 奥乃 博: 歌声GMMとViterbi探索を用いた多重奏中のボーカルパートに限定した 基本周波数推定手法, 電子情報通信学会総合大会, スペシャルセッション「音響信号のモデリングと表現」, Mar. 2008.
  70. 北原 鉄朗, 後藤 真孝, 奥乃 博, 片寄 晴弘: Instrogram: 多重奏中の楽器構成に関する確率的表現法, 電子情報通信学会総合大会, スペシャルセッション「音響信号のモデリングと表現」, Mar. 2008.
  71. 河原 英紀, 森勢 将雅, 高橋 徹, 西村 竜一, 坂野 秀樹, 入野 俊夫: TANDEM およびSTRAIGHT スペクトルに基づく基本周波数および非周期性の表現について, 日本音響学会2008年春季研究発表会講演論文集, pp.563-564, March 17-19, 2008.
  72. 小林 憲昭, 森勢 将雅, 高橋 徹, 入野 俊夫, 河原 英紀: 時間窓と入力信号の持続時間に基づく音響イベント検出を利用した 音源位置推定法の一検討, 日本音響学会2008年春季研究発表会講演論文集, pp.775-776, March 17--19, 2008. (千葉工業大学/千葉), (発表日 3月17日).
  73. 大西 壮登, 高橋 徹, 森勢 将雅, 入野 俊夫, 河原 英紀: 母音情報に基づく声質変換法における連続発話音声からの母音テンプレートの設計, 日本音響学会2008年春季研究発表会講演論文集, pp.429-430, March 17--19, 2008. (千葉工業大学/千葉), (発表日 3月19日).
  74. 吉田 有里, 森勢 将雅, 高橋 徹, 入野 俊夫, 河原 英紀: 歌唱音声と会話音声のSTRAIGHT による分析と母音部におけるスペクトル変動の統計的性質の比較, 日本音響学会2008年春季研究発表会講演論文集, pp.279-280, March 17-19, 2008.
  75. 白松 俊, 駒谷 和範, 尾形 哲也, 奥乃 博: 新近性効果の減数曲線を加味した顕現性計算手法に基づく話題遷移の可視化, 言語処理学会第14回年次大会, Mar. 2008.
  76. 横矢 龍之介, 尾形 哲也, 西出 俊, 谷 淳, 駒谷 和範, 奥乃 博: ロボットの順逆モデルの変換による他者行為予測と模倣, 情報処理学会第70回全国大会, 1X3, Mar. 2008. pdf
  77. 須見 康平, 糸山 克寿, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: ベース音高を考慮したポピュラー音楽に対する和音進行認識, 情報処理学会第70回全国大会, 2X-5, Mar. 2008. pdf 大会優秀賞
  78. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 複数楽器個体による事前分布を用いた調波・非調波統合モデルの パラメータ推定, 情報処理学会第70回全国大会, 2X-6, Mar. 2008. pdf
  79. 安部 武宏, 糸山 克寿, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: 楽器固有の音響的特徴を考慮した楽器音の音高操作手法, 情報処理学会第70回全国大会, 2X-7, Mar. 2008. pdf
  80. 水本 武志, 武田 龍, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: 音楽と自分の声を聞き分けながらビートに合わせて発声するロボットの開発, 情報処理学会第70回全国大会, 2X-8, Mar. 2008. pdf
  81. 久保田 祐史, 吉田 雅敏, 駒谷 和範, 尾形 哲也, 奥乃 博: 顔の動作に追従したGUIインタフェースを持つ音環境可視化システム, 情報処理学会第70回全国大会, 2ZL-5, Mar. 2008. pdf
  82. 駒谷 和範, 福林 雄一朗, 池田 智志, 尾形 哲也, 奥乃 博: 音声対話システムにおける誤り原因の階層的分類とその推定に基づく発話誘導, 情報処理学会第70回全国大会, 3K-1, Mar. 2008. pdf
  83. 武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価, 情報処理学会第70回全国大会, 3U-1, Mar. 2008. pdf
  84. 池田 智志, 駒谷 和範, 尾形 哲也, 奥乃 博: トピック推定と対話履歴の統合によるドメイン選択を行うマルチドメイン 音声対話システム, 情報処理学会第70回全国大会, 3U-3, Mar. 2008. pdf
  85. 勝丸 真樹, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおけるユーザの固有名詞の簡略化に対処する語彙拡張, 情報処理学会第70回全国大会, 3U-5, Mar. 2008. pdf
  86. 福林 雄一朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおけるWFSTに基づく文法検証を利用した動的ヘルプ生成, 情報処理学会第70回全国大会, 3U-7, Mar. 2008. pdf 学生奨励賞
  87. 斎藤 博己, 糸山 克寿, 吉井 和佳, 駒谷 和範, 尾形 哲也, 奥乃 博: 音楽と映像の調和度計算モデルを用いたクロスメディア探索, 情報処理学会第70回全国大会, 3X-4, Mar. 2008. pdf
  88. 前田 一貴: 奥乃 博: 数独の問題作成支援システムの設計と開発, 情報処理学会第70回全国大会, 4ZH-4, Mar. 2008. pdf 学生奨励賞, 大会奨励賞
  89. 徳田 浩一, 駒谷 和範, 尾形 哲也, 奥乃 博: 音源定位結果と音声認識結果をHMDに統合呈示する聴覚障害者向け 音環境理解支援システム, 情報処理学会第70回全国大会, 5ZD-7, Mar. 2008. pdf 大会奨励賞
  90. 張 陽, 尾形 哲也, 谷 淳, 村瀬 昌満, 駒谷 和範, 奥乃 博: 神経回路モデルによる動作・言語変換を利用した人間ロボット音声協調, 情報処理学会第70回全国大会, 6X-1, Mar. 2008. pdf
  91. 神田 尚, 尾形 哲也, 駒谷 和範, 奥乃 博: RNNPBによる音響模倣・分節化を用いた音素獲得モデルの提案, 情報処理学会第70回全国大会, 6X-2, Mar. 2008. pdf 学生奨励賞
  92. 福林 雄一朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける動的ヘルプ生成を指向したWFSTに基づく文法検証に よるユーザ知識推定, 人工知能学会研究会資料 SIG-SLUD-AAA703-09 (3/7), pp.45--50, 人工知能学会, Mar, 2008.
  93. 吉田 有里, 森勢 将雅, 高橋 徹, 西村 竜一, 入野 俊夫, 河原 英紀: ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について, 音楽情報処理研究会, 2008-MUS-74 (3), 2008-SLP-70 (3), Vol.2008, No.12, pp.13-18, 情報処理学会, Feb. 2008.
  94. 奥乃 博: ロボット聴覚の課題と現状: 聖徳太子ロボットをめざして, 招待講演, 第12回関西大学先端科学技術シンポジウム講演集, pp.221-226, Jan. 2008.
  95. 池田 智志, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチドメインシステムにおけるトピック推定と対話履歴の統合による ドメイン選択の高精度化, 音声言語シンポジウム, 信学技法, NLC2007-80, SP2007-143, pp.277-282, Dec. 2007.
  96. 西出 俊, 尾形 哲也, 横矢 龍之介, 谷 淳, 駒谷 和範, 奥乃 博: 能動的知覚経験に基づく物体挙動連想と動作生成, 第8回システムインテグレーション部門 講演会 (SI2007), 1C1-3, 計測自動制御学会, Dec. 2007.
  97. 有江 浩明, 尾形 哲也, 谷 淳, 菅野 重樹: ニューラルネットによるけん駆動ロボットアームの制御, 第8回システムインテグレーション部門 講演会 (SI2007), 1B4-6, 計測自動制御学会, Dec. 2007.
  98. 尾形 哲也: インタラクション創発システム情報学の提案, (keynote), 第8回システムインテグレーション部門 講演会 (SI2007), 2C1-1, 計測自動制御学会, Dec. 2007.
  99. 横矢 龍之介, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 自己モデルの再利用に基づくロボットによる他者の発見と模倣, 第8回システムインテグレーション部門 講演会 (SI2007), 2C1-2, 計測自動制御学会, Dec. 2007.
  100. 中臺 一博, 山本 俊一, 奥乃 博, 中島 弘史, 長谷川 雄二, 辻野 広司: ロボット聴覚システムを用いた口じゃんけん判定ロボット, 第8回システムインテグレーション部門 講演会 (SI2007), 3K4-2, 計測自動制御学会, Dec. 2007. pdf
  101. 村田 和真, 吉井 和佳, 奥乃 博, 鳥井 豊隆, 中臺 一博, 長谷川 雄二: ロボットによるビートトラッキングにおける周期性自己発生音の影響評価, 第8回システムインテグレーション部門 講演会 (SI2007), 3K4-4, 計測自動制御学会, Dec. 2007. pdf
  102. 鄭 蝦榮, 羽鳥 剛史, 小林 潔司, 白松 俊: ファセット学習モデルを用いた公的討議のプロトコル分析, 第36回土木計画学研究発表会秋大会, 304, Nov. 2007.
  103. 山本 俊一, 複数の人の発話を聞き分ける聖徳太子ロボットの開発, 「自然科学縦横無尽」, 理学系異分野交流会, 京都大学, Nov. 3, 2007.
  104. 尾形 哲也, 村瀬 昌満, 谷 淳, 駒谷 和範, 奥乃 博: リカレントニューラルネットワークによる複数文章とロボット動作の 双方向変換, 日本ロボット学会第25回大会, 1C26 , Sep. 2007. pdf
  105. 武田 龍, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: 独立成分分析に基づく適応フィルタのロボット聴覚への応用, 日本ロボット学会第25回大会, 1N6 , Sep. 2007. pdf
  106. 神田 尚, 尾形 哲也, 駒谷 和範, 奥乃 博: 声道物理モデルとリカレントニューラルネットワークによる母音模倣, 日本ロボット学会第25回大会, 1N8 , Sep. 2007. pdf
  107. 西出 俊, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 物体挙動の予測信頼性に基づく自律的な動作生成, 日本ロボット学会第25回大会, 1C36, Sep. 2007. pdf
  108. 横矢 龍之介, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 自己モデルの投影に基づくロボットによる模倣動作の自律的獲得, 日本ロボット学会第25回大会, 3N27, Sep. 2007. pdf
  109. 菅 佑樹, 生熊 良規, 尾形 哲也, 菅野重樹: 対話型進化的計算による強化学習器の報酬系の獲得, 日本ロボット学会第25回大会, 2O18, Sep. 2007.
  110. 吉井 和佳, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 楽曲推薦システムの効率性とスケーラビリティの改善のための 確率的推薦モデルのインクリメンタル学習法, 音楽情報処理研究会, 2007-MUS-71, Vol.2007, No.71, pp.19-26, 情報処理学会, Aug. 2007.
  111. 藤原 弘将, 後藤 真孝, 奥乃 博: 歌声GMMとViterbi探索を用いた多重奏中のボーカルパートに限定した 基本周波数推定手法, 音楽情報処理研究会, 2007-MUS-71, Vol.2007, No.71, pp.119-126, 情報処理学会, Aug. 2007.
  112. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 音色特徴量分布の利用による調波・非調波併用モデルのパラメータ推定, 音楽情報処理研究会, 2007-MUS-71, Vol.2007, No.71, pp.161-166, 情報処理学会, Aug. 2007.
  113. 糸山 克寿, 後藤 真孝, 奥乃 博: 楽器音イコライザ:ハードウェアフェーダを用いた直感的操作の実現, デモンストレーション:若手による研究紹介V, 音楽情報科学研究会, 2007-MUS-71, Vol.2007, No.71, pp.130, 情報処理学会, Aug. 2007.
  114. 駒谷和範, 河原達也, 奥乃 博: 京都市バス運行情報案内システムにおける実ユーザのふるまいの 経時的変化の分析, 第67回音声言語情報処理研究会, 2007-SLP-67 (17), Vol.2007, No.75, pp.91--96, 情報処理学会, 21 July, 2007.
  115. 白松 俊, 駒谷 和範, 尾形 哲也, 奥乃 博: 会話文脈に応じた関連情報提示タスクのための文脈類似度計算手法の開発, 人工知能学会研究会資料 SIG-SLUD-A701-10 (7/23), pp.57-62, July 2007.
  116. 池田 智志, 駒谷 和範, 尾形 哲也, 奥乃 博: ドメイン拡張性を備えたトピック推定に基づく発話誘導を行う マルチドメイン音声対話システム, 人工知能学会研究会資料 SIG-SLUD-A701-10 (7/23), pp.83-88, July 2007.
  117. 糸山 克寿, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏音楽音響信号の音源分離のための調波・非調波モデルの 制約付きパラメータ推定, 音楽情報処理研究会, 2007-MUS-70 (13), 2007-EC-7 (13), Vol.2007, No.37, pp.81-88, 情報処理学会, May 2007.
  118. 福林 雄一朗, 駒谷 和範, 中野 幹生, 船越 孝太郎, 辻野 広司, 尾形 哲也, 奥乃 博: 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の 高精度化, 第66回音声言語情報処理研究会, 2007-SLP-66 (8), 2007-NL-179 (8), Vol.2007, No.47, pp.43--48, 情報処理学会, 25 May, 2007.

    特許・ディジタルコンテンツ

  119. Sentence Search Method, Sentence Search Engine, Computer Program, Recording Medium, and Document Storage. Shun Shiramatsu, Kazunori Komatani, Hiroshi Okuno, Europian Patent EP WO/2008/023470, Publication Date: 02/28/2008 Filing Date: 03/16/2007
  120. 超指向性スピーカ搭載型移動体, 発明者: 森 清文, 吉田俊治, 奥乃 博, 中臺一博, 辻野広司, 再表2005/076661, 国際公開番号: WO2005/076661, 国際公開日:2005年8月18日, 発行日:2008年1月10日. 特願2005-517825号, 国際出願番号:PCT/JP2005/002044, 国際出願日:2005年2月10日.
  121. 超指向性スピーカ搭載型移動体, 発明者: 森 清文, 吉田俊治, 奥乃 博, 中臺一博, 辻野広司, 再表2005/076660, 国際公開番号: WO2005/076660, 国際公開日:2005年8月18日, 発行日:2008年1月10日. 特願2005-517825号, 国際出願番号:PCT/JP2005/002043, 国際出願日:2005年2月10日.
  122. 楽器音認識方式, 楽器アノテーション方法, 及び楽曲検索方法, 発明者:北原 鉄朗, 奥乃 博. 特開2007-240552号. 公開日: 2007年9月20日. 特願2006-058649号. 出願日: 2006年3月3日.
  123. Robot acoustic device and robot acoustic system, Patent No. US 7,215,786, Date of Patent: May 8, 2007. Inventors: Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, Assignee: Japan Science and Technology Agency. PCT No.: PCT/JP2005/002043.
  124. EPO特許 (ドイツ, フランス, 英国, イタリア, スペイン, オランダ), 音源同定装置及びその同定方法, 発明者:奥乃 博, 北野宏明, 中川由紀子, 特許日:2007年3月12日.
  125. 音源分離システム, 音源分離プログラム及び音源分離装置, 発明者: 糸山克寿, 奥乃 博, 後藤真孝, 特願2007-106576号, 2007年4月13日.
  126. 音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法, 発明者: 藤原弘将, 奥乃 博, 後藤真孝, 特願2007-233682号, 2007年9月10日.
  127. 楽曲推薦システム, 楽曲推薦方法及び楽曲推薦用プログラム, 発明者: 後藤真孝, 吉井和佳, 奥乃 博, 特願2007-199936号, 2007年7月31日.
  128. Moving object equipped with ultra-directional speaker, Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, Application No. 20070172076. Filed: July 26, 2007. PCT No.: PCT/JP05/02043.

2007年度 o 2006年度(奥乃研究室)o 2005年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 北原 鉄朗: Computational Musical Instrument Recognition and Its Application to Content-based Music Information Retrieval (計算機による楽器音認識および内容に基づく音楽情報検索への応用), 博士論文, Feb. 2007 第2回京都大学総長賞

  2. 西山 正紘: マルチメディアコンテンツにおける音楽と映像の調和度計算モデル, 修士論文, Feb. 2007.
  3. 藤原 弘将: 調波構造の分離と歌声信頼度の推定に基づく歌声の認識に関する研究, 修士論文, Feb. 2007.
  4. 村瀬 昌満: RNNPBによる言語列と動作列の意味的結合と人間ロボットインタラクションへの応用, 修士論文, Feb. 2007.

  5. 池田 智志: マルチドメイン音声対話システムにおける想定外発話に対する発話誘導のためのトピック推定, 卒業特別研究報告, Feb. 2007.
  6. 神田 尚: 声道の身体拘束を反映した音声模倣モデル, 卒業特別研究報告, Feb. 2007.
  7. 清水 敬太: OnomaTree: 擬音語と木構造を併用した環境音探索インタフェース, 卒業特別研究報告, Feb. 2007.
  8. 吉田 雅敏: 音の視覚化機能を有した混合音録音再生システム, 卒業特別研究報告, Feb. 2007.

    査読つきジャーナル論文

  9. Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Drumix: An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening, IPSJ Journal, Vol.48, No.3 (Mar. 2007), 1229-1239, 情報処理学会. IPSJ Digital Courier, Vol.3 (2007), pp.134-144. 電子図書館 pdf, IPSJ Digital Courier 船井若手奨励賞
  10. Hyun-Don Kim, Jong-Suk Choi, and Munsang Kim: Human-robot interaction in real environments by audio-visual integration, International Journal of Control Automation and Systems, Vol.5, No.1 (Feb. 2007) pp.61-69.
  11. Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrogram: Probabilistic Representation of Instrument Existence for Polyphonic Music, IPSJ Journal, Vol.48, No.1 (Jan. 2007), pp.214-226, 情報処理学会. 電子図書館 IPSJ Digital Courier, Vol.3 (2007) pp.1-13. pdf, IPSJ Digital Courier 船井若手奨励賞
  12. 黒瀧 俊輔, 鈴木 紀章, 中臺 一博, 奥乃 博, 天野 英晴: 動的リコンフィギャラブルデバイス DRP を用いたロボット聴覚のための 音源分離フィルタ, 電子情報通信学会論文誌 D, Vol.J90-D, No.3, pp.897-907, Mar. 2007, 電子情報通信学会. 電子図書館
  13. 山本 俊一, 中臺 一博, 中野幹生, 辻野 広司, Jean-Marc Valin, 駒谷 和範, 尾形 哲也, 奥乃 博: 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく 同時発話音声認識, 日本ロボット学会誌, Vol.25, No.1 (Jan. 2007) 92-102. pdf, pdf学会サーバ
  14. Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectogram Templates with Harmonic Structure Suppression, IEEE Transactions on Audio, Speech and Language Processing, Vol.15, No.1 (Jan. 2007) pp.333-345, pdf, doi:10.1109/TASL.2006.876754 電気通信普及財団テレコム技術学生賞
  15. Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrument Identification in Polyphonic Music: Feature Weighting to Minimize Influence of Sound Overlaps, EURASIP Journal on Advanes in Signal Processing, Special issue on Music Information Retrieval Based on Signal Processing, Vol.2007, Article ID 51979, 15 pages, 2007, doi:10.1155/2007/51979 IF: 0.81
  16. 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏を対象とした音源同定:混合音テンプレートを用いた音の重なりに 頑健な特徴量への重みづけおよび音楽的文脈の利用, 電子情報通信学会論文誌, Vol.J89-D, No.12 (Dec. 2006), pp.2721-2733, 電子情報通信学会.
  17. 神田 直之, 駒谷 和範, 尾形 哲也, 奥乃 博: データベース検索タスクにおける対話文脈を利用した音声言語理解, 情報処理学会論文誌, Vol.47, No.6 (June 2006) pp.1802-1811, 情報処理学会. pdf, DL
  18. 藤原 弘将, 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 伴奏音抑制と高信頼度フレーム選択に基づく楽曲の歌手名同定手法, 情報処理学会論文誌, Vol.47, No.6 (June 2006) pp.1831-1843, 情報処理学会. pdf DL
  19. 山本 俊一, 中臺 一博, 中野 幹生, 辻野 広司, Jean-Marc Valin, 武田 龍, 駒谷 和範, 尾形 哲也, 奥乃 博: 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく 同時発話認識の向上, ヒューマンインタフェース学会論文誌, Vol.8, No.2 (Jun. 2006) pp.203-212.
  20. Takamichi Saito, Kentaro Umesawa, Hiroshi G. Okuno: A Privacy-Enhanced Access Control, Systems and Computers in Japan, (2006) A Privacy-Enhanced Access Control, Systems and Computers in Japan, Vol.37, No.5 (May 2006) pp.77-86. doi:10.1002/scj.10214
  21. 金 天海, 尾形 哲也, 菅野重樹: ローカルルールに基づいた論理回路の自己組織アルゴリズム, 計測自動制御学会論文誌, Vol.42, No.4 (Apr. 2006) pp.334-341.

    章分担・解説論文・翻訳

  22. 奥乃 博: 音環境理解から観たロボット聴覚, 日本音響学会誌, Vol.63, No.1 (Jan. 2007) pp.29-34.
  23. 奥乃 博: 複数の音を同時に聞き分ける聖徳太子ロボットの研究, TELECOM FRONTIER, SCAT Technical Journal, Vol.52, 2006 Summer, pp.12-20.
  24. 奥乃 博: 聖徳太子のような音声処理ロボットの開発, inrevium lab, inrevium, Vol.3, 2006 Summer, pp.1-4.
  25. Hiroaki Arie, Jun Namikawa, Tetsuya Ogata, Jun Tani, Shigeki Sugano: Reinforcement Learning Algorithm with CTRNN in Continuous Action Space, Neural Information Processing (ICONIP-2006), Part I, LNCS 4232, pp.387-396. Oct. 2006. doi:10.1007/11893028_44
  26. Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Recognition of Simultaneous Speech by Estimating Reliability of Separated Signals for Robot Audition, Qiang Yang, Geoffrey I. Webb (Eds.): PRICAI 2006: Trends in Artificial Intelligence, LNCS 4099, pp.484-494, accepted as regular paper for ORAL Presentation (14.1%), Springer-Verlag, Guilin, China, Aug. 2006. doi:10.1007/11801603_52
  27. Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Ryu Takeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Genetic Algorithm based Improvement of Robot's Hearing Capabilities in Separating and Recognizing Simultaneous Speech Signals, Moonis Ali, Richard Dapoigny (Eds.): Advances in Applied Artificial Intelligence (IEA/AIE-2006), LNAI 4031, pp.207-217, Springer-Verlag. Annecy, France, Jun. 2006. doi:10.1007/11779568_24

    査読つき国際会議論文

  28. Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani: Computational Auditory Scene Analysis and Its Application to Robot Audition: Five Years Experience, Proceedings of the 2nd International Conference on Informatics Research for Development of Knowledge Society Infrastructure (ICKS 2007), pp.69-76, Jan. 2007. doi:10.1109/ICKS.2007.7
  29. Shun Shiramatsu, Kazunori Komatani, Koiti Hasida, Tetsuya Ogata, Hiroshi G. Okuno: Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification Using Japanese and English Corpora, Proceedings of the 6th Discourse Anaphora and Anaphor Resolution Colloquium (DAARC2007), pp.121-126, Lisbon, Mar. 2007.
  30. Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Musical Instrument Recognizer ``Instrogram'' and Its Application to Music Retrieval based on Instrumentation Similarity, Proceedings of IEEE International Symposium on Multimedia (ISM2006), pp.265-272, San Diego, Dec. 2006. doi:10.1109/ISM.2006.113
  31. Hiromasa Fujihara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal signals, Proceedings of IEEE International Symposium on Multimedia (ISM2006), pp.257-264, San Diego, Dec. 2006. doi:10.1109/ISM.2006.38
  32. Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Hybrid Collaborative and Content-based Music Recommendation Using Probabilistic Model with Latent User Preferences, Proceedings of 7th International Conference on Musical Information Retrieval (ISMIR-2006), pp.296-301, Vancouver, CA, Sep. 2006. pdf
  33. Katsutoshi Itoyama, Tetsuro Kitahara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Feature Weighting in Automatic Transcription of Specified Part in Polyphonic Music, Proceedings of 7th International Conference on Musical Information Retrieval (ISMIR-2006), pp.172-175, Vancouver, CA, Sep. 2006. pdf
  34. Kazuhiro Nakadai, Hirofumi Nakajima, Masamitsu Murase, Satoshi Kaijiri, Kentaro Yamada, Yuji Hasegawa, Hiroshi G. Okuno, Hiroshi Tsujino: Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 852-859, IEEE, RSJ, Beijing, China, Sep. 2006. pdf, doi:10.1109/IROS.2006.281737
  35. Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 878-885, IEEE, RSJ, Beijing, China, Sep. 2006. pdf, doi:10.1109/IROS.2006.281741
    IEEE Robotics and Automation Society Japan Chapter Young Award,
    RSJ/SICE Award for IROS 2006 Best Paper Nomination Finalist (2nd to 5th Place) at IROS-2007.
  36. Haruhiko Niwa, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Multiple Acoustical Holography Method for Localization of Objects in Broad Range using Audible Sound, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 1146-1151, IEEE, RSJ, Beijing, China, Sep. 2006. pdf, doi:10.1109/IROS.2006.281844
  37. Chyon Hae Kim, Tetsuya Ogata, Shigeki Sugano: Efficient Organization of Network Topology based on Reinforcement Signals, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 3154-3159, IEEE, RSJ, Beijing, China, Sep. 2006. pdf
  38. Yuki Suga, Chihiro Endo, Daizo Kobayashi, Takeshi Matsumoto, Tetsuya Ogata, Shigeki Sugano: User-Adaptive Human-Robot Interaction System using Interactive EC, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 3663-3668, IEEE, RSJ, Beijing, China, Sep. 2006. pdf
  39. Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Experience Based Imitation Using RNNPB, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 3669-3674, IEEE, RSJ, Beijing, China, Sep. 2006. pdf, doi:10.1109/IROS.2006.281724 IEEE 関西支部学生研究奨励賞内定
  40. Jong-Suk Choi, Hyun-Don Kim, and Munsang Kim: Probabilistic Speaker Localization in Noisy Environment by Audio-Visual Integration, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 4704-4709, IEEE, RSJ, Beijing, China, Sep. 2006. pdf
  41. Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 5333-5338, IEEE, RSJ, Beijing, China, Sep. 2006. pdf, doi:10.1109/IROS.2006.282037
  42. Tetsuya Ogata, Yuya Hattori, Hideki Kojima, Kazunori Komatani, Hiroshi G. Okuno: Generation of Robot Motions from Environmental Sounds using Inter-modality Mapping by RNNPB, Proceedings of Sixth International Workshop on Epigenetic Robotics (EpiRobo-2006), 95-102, Paris, Sep., 2006.
  43. Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting, Proceedings of International Conference on Spoken Language Processing (Interspeech-2006), 1459-1462, Pittsburgh, Sep. 2006. pdf
  44. Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature Mask Generation, Proceedings of International Conference on Spoken Language Processing (Interspeech-2006), 2302-2305, Pittsburgh, Sep. 2006. pdf
  45. Yuichiro Fukubayashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2006), 1946-1949, Pittsburgh, Sep. 2006. pdf
  46. Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Leak Energy based Missing Feature Mask Generation for ICA and GSS and Its Evaluation with Simultaneous Speech Recognition, Proceedings of ISCA Tutorial and Research Workshop on Statistical and Perceptual Audition (SAPA2006), pp.42-46, pdf
  47. Kazunori Komatani, Naoyuki Kanda, Mikio Nakano, Kazuhiro Nakadai, Hiroshi Tsujino, Tetsuya Ogata, Hiroshi G. Okuno: Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors, Proceedings of SIGdial Workshop on Discourse and Dialogue, 9-17, Aug. 2006
  48. Hiroshi G. Okuno: Computational Auditory Scene Analysis - Towards Listening to Several Thinkgs at Once -, 50th Anniversary Summit of Artificial Intelligence (ASAI50) workshop and abstract booklet, accepted for inclusion, Monte Verita, Switzerland, July 2006.
  49. Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Robust Decomposition of Inverse Filter of Channel and Prediction Error Filter of Speech Signal for Dereverberation, Proceedings of the 14th European Signal Processing Conference (EUSIPCO 2006), CD-ROM Proceedings, Florence, 2006. pdf
  50. Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Robot Imitation from Active-Sensing Experiences, Proceedings of Fifth International Conference on Learning and Development (ICDL06), accepted, Bloomington, IN USA, May 2006.
  51. Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: AN ERROR CORRECTION FRAMEWORK BASED ON DRUM PATTERN PERIODICITY FOR IMPROVING DRUM SOUND DETECTION, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.V, pp.237-240, IEEE, Toulouse, May 2006. pdf, doi:10.1109/ICASSP.2006.11661256 IEEE 関西支部学生研究奨励賞
  52. Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: F0 ESTIMATION METHOD FOR SINGING VOICE IN POLYPHONIC AUDIO SIGNAL BASED ON STATISTICAL VOCAL MODEL AND VITERBI SEARCH, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.V, pp.253-256, IEEE, Toulouse, May 2006. pdf, doi:10.1109/ICASSP.2006.1661260
  53. Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrogram: A New Musical Instrument Recognition Technique Without Using Onset Detection Nor F0 Estimation, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.V, pp.229-232, IEEE, Toulouse, May 2006. pdf, doi:10.1109/ICASSP.2006.1661254 IEEE 関西支部学生研究奨励賞
  54. Kazuhiro Nakadai, Hirofumi Nakajima, Masamitsu Murase, Satoshi Kaijiri. Kentaro Yamada, Yuji Hasegawa, Hiroshi G. Okuno, Hiroshi Tsujino: ROBUST TRACKING OF MULTIPLE SOUND SOURCES BY SPATIAL INTEGRATION OF ROOM AND ROBOT MICROPHONE ARRAYS, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.IV, pp.929-932, IEEE, Toulouse, May 2006. pdf, doi:10.1109/ICASSP.2006.1661122
  55. Hyun-Don Kim, Jong-Suk Choi, and Munsang Kim: Speaker Localization among Multi-faces in Noisy Environment by Audio-Visual Integration, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2006), 1305-1310, (May 2006). 10.1109/ROBOT.2006.1641889

    口頭発表(研究会・全国大会)

  56. 白松 俊, 駒谷 和範, 尾形 哲也, 奥乃 博: コーパスからの関連語獲得に基づく連想を加味した顕現性の推定, 言語処理学会第13回年次大会, B3-6, Mar. 2007.
  57. 駒谷 和範, 河原 達也: 奥乃 博: 音声対話システムにおけるユーザのふるまいの経時的変化の分析, 言語処理学会第13回年次大会, E1-5, Mar. 2007.
  58. 中臺 一博, 中島 弘史, 村瀬 昌満, 奥乃 博, 長谷川 雄二, 辻野 広司: マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡, 電子情報通信学会総合大会, Mar. 2007. pdf
  59. 安部 武宏, 糸山 克寿, 北原 鉄朗, 柳田 益造: 撥弦の物理モデルを用いた音響信号からのパラメータ推定, 日本音響学会音楽音響研究会資料, MA2006-91, Mar. 2007.
  60. 藤原 弘将, 後藤 真孝, 緒方 淳, 駒谷 和範, 尾形 哲也, 奥乃 博: 歌声の分離と音響モデルの分離歌声への適用に基づく音楽音響信号と歌詞の 時間的対応付け手法, 音響学会春季講演会, 3-7-3, Mar. 2007. pdf
  61. 丹羽 治彦, 駒谷 和範, 尾形 哲也, 奥乃 博: 可聴域音波を用いたAcoustical Holography (AH) による遮蔽物の検出と距離計測法, 音響学会春季講演会, 1-10-7, Mar. 2007. pdf
  62. 神田 尚, 尾形 哲也, 駒谷 和範, 奥乃 博: 人間型声道モデルと神経回路モデルを利用した母音模倣, 情報処理学会第69回全国大会, 1Q-2, Mar. 2007. pdf
  63. 横矢 龍之介, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 自己身体モデルの投影に基づくロボットによる他者の動作予測, 情報処理学会第69回全国大会, 1R-3, Mar. 2007. pdf
  64. 村瀬 昌満, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: RNNPBによる自然言語列と動作列の意味的結合と人間ロボットインタラクション, 情報処理学会第69回全国大会, 1R-4, Mar. 2007. 学生奨励賞 pdf
  65. 糸山 克寿, 駒谷 和範, 尾形 哲也, 奥乃 博: 楽譜情報を用いたNMFによる音楽音響信号の音源分離, 情報処理学会第69回全国大会, 2N-1, Mar. 2007. pdf
  66. 西山 正紘, 北原 鉄朗, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチメディアコンテンツにおける音楽と映像の調和に関する分析, 情報処理学会第69回全国大会, 2N-6, Mar. 2007. 学生奨励賞 pdf
  67. 金 天海, 尾形 哲也, 菅野重樹: 自己組織化回路素子(SONE)への教師あり学習の付与, 情報処理学会第69回全国大会, 2Q-3, Mar. 2007.
  68. 清水 敬太, 北原 鉄朗, 駒谷 和範, 尾形 哲也, 奥乃 博: Onomatree:擬音語と木構造を併用した環境音検索インターフェース, 情報処理学会第69回全国大会, 3N-7, Mar. 2007. 学生奨励賞 pdf
  69. 徳田 浩一, 駒谷 和範, 尾形 哲也, 奥乃 博: 聴覚障害児の授業支援のためのHMDによる音声認識結果提示システムの設計, 情報処理学会第69回全国大会, 3ZB-4, Mar. 2007. pdf
  70. 金 鉉燉, 駒谷 和範, 尾形 哲也, 奥乃 博(京大): EMアルゴリズムとパーティクルフィルタの統合によるリアルタイム複数の人物追跡システム実現, 情報処理学会第69回全国大会, 4B-3, Mar. 2007. pdf
  71. 福林 雄一朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける発話検証を利用したシステム想定外発話の誤受理抑制, 情報処理学会第69回全国大会, 5Q-5, Mar. 2007. pdf
  72. 池田 智志, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチドメイン音声対話システムにおけるシステム想定外発話のトピック推定に基づく発話誘導, 情報処理学会第69回全国大会, 5Q-6, Mar. 2007. pdf
  73. 西出 俊, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 物体静止画像から動的特徴を抽出する神経回路モデルの学習と解析, 情報処理学会第69回全国大会, 6B-4, Mar. 2007. pdf
  74. 吉田 雅敏, 海尻 聡, 山本 俊一, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: 音環境を可視化する録音再生システム, 情報処理学会第69回全国大会, 6ZB-2, Mar. 2007. pdf 学生奨励賞
  75. 武田 龍, 山本 俊一, 駒谷 和範, 尾形 哲也, 奥乃 博: ICA と MFT に基づく音声認識における Soft Mask を用いた性能評価, 情報処理学会第69回全国大会, 6ZB-6, Mar. 2007. pdf
  76. 西山 正紘, 北原 鉄朗, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチメディアコンテンツにおける音楽と映像の調和度計算モデル, 音楽情報処理研究会, 2007-MUS-69, Vol.2007, No.15, pp.31--36, 情報処理学会, Feb. 23, 2007.
  77. 福林 雄一朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおけるヘルプ生成のためのシステム想定外発話の誤受理抑制, 第65回音声言語情報処理研究会, 2007-SLP-65, 2007-HI-122, Vol.2007, No.11, pp.61--66, 情報処理学会, 伊豆長岡, Feb., 2007.
  78. 西出 俊, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 能動知覚経験に基づく物体静止画像からの挙動推定, 第7回システムインテグレーション部門 講演会 (SI2006), 1B2-4, 計測自動制御学会, Dec. 2006. SI2006優秀講演賞
  79. 中臺 一博, 中島 弘史, 村瀬 昌満, 長谷川 雄二, 奥乃 博, 辻野 広司: 複数のマイクロフォンアレイのパーティクルフィルタに基づく統合による 音源追跡, 第7回システムインテグレーション部門 講演会 (SI2006), 2D2-4, 計測自動制御学会, Dec. 2006.
  80. 武田 龍, 山本 俊一, 駒谷 和範, 尾形 哲也, 奥乃 博: ICA による音源分離とMFTに基づく音声認識の同時発話認識による評価, 第24回 AI チャレンジ研究会, SIG-Challenge-0624-2, pp.9--16, 人工知能学会, Nov. 2006.
  81. 中臺 一博, 中島 弘史, 村瀬 昌満, 奥乃 博, 長谷川 雄二, 辻野 広司: 複数マイクロホンアレイのパーティクルフィルタ統合による実時間音源追跡, 第24回 AI チャレンジ研究会, SIG-Challenge-0624-7, pp.43--50, 人工知能学会, Nov. 2006.
  82. Hyun-Don Kim, 駒谷 和範, 尾形 哲也, 奥乃 博: 視聴覚情報統合及びEMアルゴリズムを用いた人物追跡システム実現, 第24回 AI チャレンジ研究会, SIG-Challenge-0624-8, pp.51--58, 人工知能学会, Nov. 2006.
  83. 尾形 哲也, 小嶋 秀樹, 駒谷 和範, 奥乃 博: RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現, 言語理解とコミュニケーション研究会他, TL2006-22 NLC2006-18 PRMU2006-99 pp.27-32(TL), pp.27-32(NLC), pp.45-50(PRMU), 電子情報通信学会, Oct. 2006.
  84. 丹羽 治彦, 駒谷 和範, 尾形 哲也, 奥乃 博: 可聴音を用いたAH法による遮蔽された物体の検出と距離計測, 応用電気音響研究会, EA2006-48, pp.1-6, 電子情報通信学会, Sep. 29, 2006.
  85. 中臺 一博, 中島 弘史, 村瀬 昌満, 奥乃 博, 長谷川 雄二, 辻野 広司: 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡, 日本ロボット学会第24回大会, 1B11, Sep. 2006.
  86. 山本 俊一, 中臺 一博, 中野 幹生, 辻野 広司, Jean-Marc Valin, 駒谷 和範, 尾形 哲也, 奥乃 博: パラメータ最適化による実環境同時発話認識向上とそのオンライン処理の実装, 日本ロボット学会第24回大会, 1B12, Sep. 2006.
  87. 武田 龍, 山本 俊一, 駒谷 和範, 尾形 哲也, 奥乃 博: ICAとミッシングフィーチャマスク自動生成によるロボット聴覚, 日本ロボット学会第24回大会, 1B13, Sep. 2006.
  88. 尾形 哲也, 服部 佑哉, 小嶋 秀樹, 駒谷 和範, 奥乃 博: リカレントニューラルネットワークによるロボットの異種感覚モダリティ変換, 日本ロボット学会第24回大会, 2L22, Sep. 2006.
  89. 村瀬 昌満, 松本 祥平, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: 人間ロボット協調のための RNNPB による擬似シンボルの獲得とその階層性の解析, 日本ロボット学会第24回大会, 3K24, Sep. 2006.
  90. 横矢 龍之介, 尾形 哲也, 谷 淳, 駒谷 和範, 奥乃 博: ロボットの身体経験に基づく RNNPB を用いた模倣動作の自律的獲得, 日本ロボット学会第24回大会, 3D34, Sep. 2006.
  91. 藤原 弘将, 後藤 真孝, 緒方 淳, 駒谷 和範, 尾形 哲也, 奥乃 博: 音楽音響信号と歌詞の時間的対応付け手法: 歌声の分離と 母音のViterbiアラインメント, 音楽情報処理研究会, 2006-MUS-66, Vol.2006, No.90, pp.37-44, 情報処理学会, Aug. 2006. 山下記念研究賞
  92. 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: Instrogram: 発音時刻検出とF0推定の不要な楽器音認識手法, 音楽情報処理研究会, 2006-MUS-66, Vol.2006, No.90, pp.69-76, 情報処理学会, Aug. 2006.
  93. 吉井 和佳, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: ユーザの評価と音響的特徴との確率的統合に基づくハイブリッド型 楽曲推薦システム 音楽情報処理研究会, 2006-MUS-66, Vol.2006, No.90, pp.45-72, 情報処理学会, Aug. 2006. ベストプレゼンテーション賞
  94. 福林 雄一朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける発話パターンを教示するヘルプの動的生成, 人工知能学会研究会資料, SIG-SLUD-A601-03, pp.13-18, 人工知能学会, Jul. 2006.

    特許・ディジタルコンテンツ

  95. 文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松 俊, 駒谷和範, 奥乃 博, OBPCT/JP2007/055448, 16 Mar. 2007.
  96. 音楽音響信号と歌詞の時間的対応づけ方法, 発明者: 藤原弘将, 奥乃 博, 後藤真孝, 特願2006-289289号, 24 Oct. 2006.
  97. ロボット視聴覚システム, 特許3843743号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67849号, 出願日 2001年3月9日.
  98. ロボット視聴覚システム, 特許3843742号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67848号, 出願日 2001年3月9日.
  99. ロボット視聴覚システム, 特許3843741号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67847号, 出願日 2001年3月9日.
  100. ロボット視聴覚システム, 特許3843740号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67846号, 出願日 2001年3月9日.
  101. 文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松 俊, 駒谷和範, 奥乃 博, 特願2006-224563号, 21 Aug. 2006.
  102. 情報処理システムおよび情報処理方法, 並びにプログラム, 発明者: 菅野重樹, 尾形哲也, 金 天海, 特願2006-172141号, 29 Jun. 2006. 特願2004-363742号, 15 Dec. 2005.
  103. 鍵盤楽器支援装置及び鍵盤楽器支援システム, 発明者: 武田 正之, 石田 克久, 北原 鉄朗, 特開2006-145681号, 8 Jun. 2006. 特願 2004-333279号, 17 Nov. 2004.
  104. Moving object equipped with ultra-directional speaker, Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, Application No. 20070172076. Filed: July 26, 2007. PCT No.: PCT/JP05/02043. OB
  105. Speech Recongition Device, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto, European Patent: EP1691344, Publication Date: 08/16/2006, Application number: EP20040818533, Filing Date: 11/12/2004
  106. Method and Apparatus for Determining Sound Source, Patent No. US 7,035,418, Issue date: Apr. 25, 2006. Filing date: June 7, 2000. Inventors: Hiroshi Okuno, Hiroaki Kitano, Yukiko Nakagawa, Assignee: Japan Science and Technology Agency. PCT/JP00/03695
    音源同定装置及びその同定方法, 米国特許第7,035,418号, 発明者:奥乃 博, 北野宏明, 中川由紀子, 特許日:2006年4月25日. 存続期限:2023年2月23日.
  107. Robot audiovisual system Patent No. US 7,016,505. Issue date: Mar 21, 2006. Filing date: Nov 1, 2000. Inventors: Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, Assignee: Japan Science and Technology Agency.
  108. ロボット聴覚装置及びロボット聴覚システム. 発明者:中臺一博, 奥乃 博, 北野宏明, 特許第3780516号, 登録日 2006年3月17日. 発行日 2006年5月31日. 特願2002-502769号, 出願日: 2001年6月8日. pdf

  109. メロディーと歌詞の時間的対応付けプログラム, 京都大学デジタルコンテンツC20, Nov. 2006. 開発者: 藤原弘将, 後藤真孝, 奥乃 博
  110. Drumix: ドラムパートのリアルタイム編集機能つきオーディオプレイアー, 京都大学デジタルコンテンツC18, Jun. 2006. 開発者: 吉井和佳, 後藤真孝, 奥乃 博

2006年度 o 2005年度(奥乃研究室)o 2004年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 神田 直之: マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択法, 修士論文, Feb. 2006.
  2. 田崎 豪: 人間親密度の空間マッピングによるロボットと複数人とのインタラクション, 修士論文, Feb. 2006.
  3. 服部 佑哉: モダリティ間マッピングに基づく環境音を表現するロボット動作生成, 修士論文, Feb. 2006.
  4. 松本 祥平: 人間ロボット協調のためのRNNPBを用いた疑似シンボルの獲得, 修士論文, Feb. 2006.
  5. 吉岡 拓也: 室内伝達系と音声生成系の逆フィルタの同時推定によるブラインド残響除去, 修士論文, Feb. 2006.

  6. 糸山 克寿: 多重奏中特定パートの自動採譜のための複数特徴量の重み自動推定, 卒業特別研究報告, Feb. 2006.
  7. 田口 明裕: 擬音語・抑揚・リズムに基づく環境音記述用XMLタグの設計と自動付与, 卒業特別研究報告, Feb. 2006.
  8. 武田 龍: ICAによる音源分離とミッシングフィーチャマスクの自動生成による同時発話認識, 卒業特別研究報告, Feb. 2006.
  9. 福林 雄一朗: 音声対話システムにおけるドメイン概念木に基づく動的ヘルプ生成 , 卒業特別研究報告, Feb. 2006.
  10. 横矢 龍之介: アクティブセンシングに基づくロボットによる模倣動作の自律的獲得, 卒業特別研究報告, Feb. 2006.

    査読つきジャーナル論文

  11. Yasuhiro Akiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Using Multiple Edit Distances to Automatically Grade Outputs from Machine Translation Systems, IEEE Transactions on Audio, Speech and Language Processing, Vol.14, No.2, (Mar. 2006) 393--402. doi:10.1109/TSA.2005.860770
  12. Mototaka Suzuki, Kuniaki Noda, Yuki Suga, Tetsuya Ogata, and Shigeki Sugano: Dynamic Perception after Visually-Guided Grasping by a Human-Like Autonomous Robot, Advanced Robotics, Vol.20, Issue 2 (Feb. 2006) 233-254. VSP and Robotics Society of Japan. doi:10.1163/156855306775525785 IF: 0.510
  13. Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Common Acoustical Pole Estimation from Multi-Channel Musical Audio Signals, IEICE Trans. on Fundamentals of Electronics, Communications, and Computer Sciences, Vol.E89-A, No.1 (Jan. 2006) 240-247, IEICE.
  14. Tetsuya Ogata, Hayato Ohba, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Extracting Multi-Modal Dynamics of Objects using RNNPB, Journal of Robotics and Mechatronics, Vol.17, No.6 (Dec. 2005) pp.681-688, Special Issue on Human Modeling in Robotics. pdf,
  15. Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Pitch-Dependent Identification of Musical Instrument Sounds, Applied Intelligence, Vol.23, No.3, pp.267-275, Springer-Verlag (formerly Kluwer Publishers). doi:10.1007/s10489-005-4612-1 IF: 1.853
  16. 小鷹 研理, 尾形 哲也, 奥乃 博: 非線形振動子による引き込みを利用した仮想空間における歩行, ヒューマンインタフェース学会論文誌, Vol.7, No.4, 26-36, 2005.
  17. 山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博: ミッシングフィーチャ理論を利用した音源分離と 音声認識のインターフェースと複数ロボットへの適用, 日本ロボット学会誌, Vol.23, No.6 (Aug. 2005) 743-751. pdf, pdf学会サーバ
  18. 白松 俊, 宮田 高志, 奥乃 博, 橋田 浩一: ゲーム理論による中心化理論の解体と実言語データに基づく検証. 自然言語処理, Vol.12, No.3 (July 2005) 91-110.
  19. Tetsuya Ogata, Shigeki Sugano, and Jun Tani: Open-end Human-Robot Interaction from the Dynamical Systems Perspective - Mutual Adaptation and Incremental Learning, Advanced Roboics, Vol.19. No.6, pp.651-670, VSP and Robotics Society of Japan. doi:10.1163/1568553054255655 IF: 0.510
  20. 石田 克久, 北原 鉄朗, 武田 正之: N-gram による旋律の音楽適否判定に基づいた即興演奏支援システム, 情報処理学会論文誌, Vol.46, No.7 (July 2005) pp.1548-1559, 情報処理学会. in html

    章分担・解説論文・翻訳

  21. Masahiro Nisiyama, Hiroaki Kawashima, Takatsugu Hirayama, Takashi Matsuyama: Facial Expression Representation based on Timing Structures in Faces, Proceedings of IEEE International Workshop on Analysis and Modeling of Faces and Gestures (AMFG 2005), LNCS 3723, pp.139-153, Beijing, Oct. 2005.
  22. Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Distance-Based Dynamic Interaction of Humanoid Robot with Multiple People. Innovations in Applied Artificial Intelligence (IEA/AIE-2005), LNAI 3533, 111-120, Best paper award, Springer-Verlag. Bari, Italy, Jun. 2005. Paper pdf doi:10.1007/11504894_18
  23. 内山 勝利, 応地 利明, 岡 真理, 奥乃 博, 鈴木 博之, 深谷 賢治, モジュタバ・サドリア, ユベール・デュルト: ワークショップ1「こころとトボス--こころのよりどころ」, 京都文化会議2005報告集, pp.64-73, Mar. 2006.
  24. Katsutoshi Uchiyama, Toshiaki Ohji, Mari Oka, Hiroshi G. Okuno, Hiroyuki Suzuki, Kenji Fukaya, Modjtaba Sadria, Hubert Durt Kokoro and Topos -- Bastions of Kokoro, Kyoto Inernational Culture Forum 2005, pp.62-73, Mar. 2006.
  25. 吉岡 拓也訳: センサネットワークによる生息環境モニタリング, CACM 日本語版, Vol.5, No.1 (Aug., 2005) pp.4-12
    原著: Habitat Monitoring with Sensor Networks, by Robert Szewczyk, Eric Osterwell Joseph Polastre, Michael Hamilton, Alan Mainwaring, and Deborah Estrin, CACM, Vol.47, No.6 (June 2004) 34 - 40.
  26. 服部 佑哉訳: ワイヤレスセンサネットワークを実現するプラットフォーム, CACM 日本語版, Vol.5, No.1 (Aug. 2005) pp.13-20
    原著: The Platforms Enabling Wireless Sensor Networks, by Jason Hill, Mike Horton, Ralph Kling, and Lakshman Krishnamurthy, CACM, Vol.47, No.6 (June 2004) 34 - 40.
  27. 神田直之訳: センサネットワークにおける問い合わせ処理のネットワークサポート, CACM 日本語版, Vol.5, No.1 (Aug. 2005) pp.21-29
    原著: Networking Support for Query Processing in Sensor Networks, by Alec Woo, Sam Madden, and Ramesh Govindan, CACM, Vol.47, No.6 (June 2004) 47 - 52.
  28. 田崎 豪訳: ワイヤレスセンサネットワークにおけるセキュリティ, CACM 日本語版, Vol.5, No.1 (Aug. 2005) pp.30-36
    原著: Security in Wireless Sensor Networks, by Adrian Perrig, Jhn Stankovic, and David Wagner, CACM, Vol.47, No.6 (June 2004) 53 - 57.
  29. 奥乃 博 丹羽 治彦, 尾形 哲也: 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識, 超音波テクノ, pp.79-84, 2005年9-10月号.

    査読つき国際会議論文

  30. Shun Shiramatsu, Kazunori Komatani, Takashi Miyata, Koiti Hasida, Hiroshi G. Okuno: Empirical Verification of Meaning-Game-based Generalization of Centering Theory with Large Japanese Corpus, Proceedings of the 19th Pacific Asia Conference on Language, Information, and Computation (PACLIC 19), 192-210, Taipei, Dec. 2005.
  31. Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: INTER:D A Drum Sound Equalizer for Controlling Volume and Timbre of Druams, Proceedings of 2nd European Workshop on the Integration of Knowledge, Semantic and Digital Media Technologies (EWIMT 2005), pp.205--212, EU Commission, IEE Savoy Place, London, Nov. 2005. IEEE
  32. Kenri Kodaka, Tetsuya Ogata, Hiroshi G. Okuno: Walking with Body-sense in Virtual Space Using the Nonlinear Oscillator, Proceedings of the International Conference on Systems, Man and Cybernetics (SMC-2005), 324--329, IEEE, Hawaii, Oct. 10-12, 2005. Finalist for Best Student Paper doi:10.1109/ICSMC.2005.1571166
  33. Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: AdaMast: A Drum Sound Recognizer based on Adaptation and Matching of Spectrogram Templates, Proceedings of MIREX 2005, London, Sep. 2005. Paper pdf. Best in Class Award.
  34. Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SINGER IDENTIFICATION BASED ON ACCOMPANIMENT SOUND REDUCTION AND RELIABLE FRAME SELECTION, Proceedings of 6th International Conference on Musical Information Retrieval (ISMIR-2005), 329-336, London, Sep. 2005.
  35. Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: INSTRUMENT IDENTIFICATION IN POLYPHONIC MUSIC: FEATURE WEIGHTING WITH MIXED SOUNDS, PITCH-DEPENDENT TIMBRE MODELING, AND USE OF MUSICAL CONTEXT, Proceedings of 6th International Conference on Musical Information Retrieval (ISMIR-2005), 558-563, London, Sep. 2005.
  36. Kazunori Komatani, Naoyuki Kanda, Tetsuya Ogata, Hiroshi G. Okuno: Contextual Constraints based on Dialogue Models in Database Search Task for Spoken Dialogue Systems, Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005), 877-880, Lisboa, Sep. 2005. pdf.
  37. Masamitsu Murase, Shun'ichi Yamamoto, Jean-Marc Valin, Kazuhiro Nakadai, Kentaro Yamada, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Multiple Moving Speaker Tracking by Microphone Array on Mobile Robot, Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005), 249-252, Lisboa, Sep. 2005. pdf.
  38. Tetsuro Kitahara, Katsuhisa Ishida, Masayuki Takeda: ism: Improvisation Supporting Systems with Melody Correction and Key Vibration, Proceedings of International Conference on Entertainment Computing (ICEC 2005), Mita, Hyogo, Sep. 2005.
  39. Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean-Marc Valin, Jean Rouat, Francois Michaud, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Making A Robot Recognize Three Simultaneous Sentences in Real-Time, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.4040-4045, IEEE, RSJ, Edmonton, Aug. 2005. pdf. doi:10.1109/IROS.2005.1545094
  40. Syunsuke Kurotaki, Noriaki Suzuki, Kazuhiro Nakadai, Hiroshi G. Okuno, Hideharu Amano: Implementation of Active Direction-Pass Filter on Dynamically Reconfigurable Processor, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.3175-3180, IEEE, RSJ, Edmonton, Aug. 2005. pdf. doi:10.1109/IROS.2005.1545033
  41. Tsuyoshi Tasaki, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Spatially Mapping of Friendliness for Human-Robot Interaction, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.1277-1282, IEEE, RSJ, Edmonton, Aug. 2005. pdf. doi:10.1109/IROS.2005.1545034
  42. Mikio Nakano, Naoyuki Kanda, Yuji Hasegawa, Toyotaka Torii, Yohane Takeuchi, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G. Okuno: A Two-Layer Model for Behavior and Dialogue Planning in Conversational Service Robots, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.3329-3335, IEEE, RSJ, Edmonton, Aug. 2005. pdf. doi:10.1109/IROS.2005.1545198
  43. Tetsuya Ogata, Hayato Ohba, Kazunori Komatani, Jun Tani, Hiroshi G. Okuno: Extracting Multi-Modal Dynamics of Objects using RNNPB Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.966-971, IEEE, RSJ, Edmonton, Aug. 2005. pdf. doi:10.1109/IROS.2005.1544975
  44. Kazunori Komatani, Ryoji Hamabe, Tetsuya Ogata, Hiroshi G. Okuno: Generating Confirmation to Distinguish Phonologically Confusing Word Pairs in Spoken Dialogue Systems Proceedings of 4th IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems, pp.40-45, July 2005.
  45. Yuya Hattori, Hideki Kojima, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Gesture Generation from Environmental Sounds Using Inter-modality Mapping, Proceedings of Fifth International Workshop on Epigenetic Robotics (EpiRobo-2005), 139-140, Nara, July 2005.
  46. Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Blind Estimation of Room Resonances Using Popular, Classical, and Jazz Music. Proceedings of AES 118th Convenvion, 6632, Audio Engineering Society, Barcelona, Spain, May 28-31, 2005.
  47. Shun'ichi Yamamoto, Jean-Marc Valin Kazuhiro Nakadai, Hiroshi Tsujino, Jean Rouat, Francois Michaud, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Enhanced Robot Speech Recognition Based on Microphone Array Source Separation and Missing Feature Theory. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2005), 1477-1482, IEEE, Barcelona, Apr. 2005.

    口頭発表(研究会・全国大会)

  48. 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: Introgram: 楽器存在確率に基づく音楽視覚表現法, 音響学会春季講演会, 2-2-13, 715-716, Mar. 2006. pdf
  49. 藤原 弘将, 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 調波構造抽出と高信頼度フレーム選択を用いた雑音下での話者識別, 音響学会春季講演会, 1-11-17, 55-56, Mar. 2006. pdf
  50. 白松 俊, 駒谷 和範, 尾形 哲也, 奥乃 博: ゲーム理論に基づく中心化理論の再定式化と日英コーパスを用いた統計的検証, 言語処理学会第12回年次大会, A2-1, Mar. 2006. pdf
  51. 駒谷 和範, 河原 達也, 奥乃 博: 京都市バス運行情報案内システムにおける実ユーザのふるまいの分析 言語処理学会第12回年次大会, B1-5, Mar. 2006. pdf
  52. 横矢 龍之介, 駒谷 和範, 尾形 哲也, 谷 淳, 奥乃 博: アクティブセンシングを用いたロボットによる模倣動作の自律的獲得, 情報処理学会第68回全国大会, 7L-7, Mar. 2006. pdf 学生奨励賞
  53. 松本 祥平, 駒谷 和範, 尾形 哲也, 谷 淳, 奥乃 博: RNNPB を用いて獲得した疑似シンボルによる人間とロボットの協調の実現, 情報処理学会第68回全国大会, 7L-6, Mar. 2006. pdf
  54. 服部 佑哉, 駒谷 和範, 尾形 哲也, 小嶋 秀樹, 奥乃 博: RNNPBを用いたモダリティ間マッピングによるロボットの動作生成, 情報処理学会第68回全国大会, 6L-8, Mar. 2006. pdf 学生奨励賞
  55. 村瀬 昌満, 中臺 一博, 奥乃 博: パーティクルフィルタによる音源追跡の性能評価, 情報処理学会第68回全国大会, 5M-9, Mar. 2006. pdf
  56. 武田 龍, 山本 俊一, 駒谷 和範, 尾形 哲也, 奥乃 博: ICAによる音源分離とミッシングフィーチャマスクの自動生成による同時発話認識, 情報処理学会第68回全国大会, 5M-8, Mar. 2006. pdf
  57. 福林 雄一朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおけるユーザの誤り原因推定に基づく動的ヘルプ生成, 情報処理学会第68回全国大会, 5M-2, Mar. 2006. pdf
  58. 神田 直之, 駒谷 和範, 中野 幹生, 中臺 一博, 辻野 広司, 尾形 哲也, 奥乃 博: 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化, 情報処理学会第68回全国大会, 5M-1, Mar. 2006. pdf
  59. 田崎 豪, 駒谷 和範, 尾形 哲也, 奥乃 博: 強化学習による人間位置に基づいたロボットの挙動選択, 情報処理学会第68回全国大会, 4S-4, Mar. 2006. pdf
  60. Hyun-Don Kim, 駒谷 和範, 尾形 哲也, 奥乃 博: 音源定位及び唇の動き検出による複数ユーザ環境における発話者認識, 情報処理学会第68回全国大会, 4B-4, Mar. 2006. pdf
  61. 山本 俊一, 中臺 一博, 中野幹生, 辻野 広司, Jean-Marc Valin, 武田 龍, 駒谷 和範, 尾形 哲也, 奥乃 博: GAによる話者位置への同時発話認識システムの最適化, 情報処理学会第68回全国大会, 4B-3, Mar. 2006. pdf
  62. 田口 明裕, 北原 鉄朗, 石原 一志, 駒谷 和範, 尾形 哲也, 奥乃 博: 擬音語表現を利用した環境音のためのXMLタグの設計と自動付与, 情報処理学会第68回全国大会, 3L-7, Mar. 2006. pdf 学生奨励賞
  63. 西山 正紘, 北原 鉄朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 標題音楽アノテーションのための階層的物語タグの設計, 情報処理学会第68回全国大会, 3L-6, Mar. 2006. pdf
  64. 糸山 克寿, 北原 鉄朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏中特定パートの自動採譜における複数特徴量の自動重み付け, 情報処理学会第68回全国大会, 2L-4, Mar. 2006. pdf
  65. 吉井 和佳, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: Drumix: ドラムパートのリアルタイム編集機能付きオーディオプレイヤー, インタラクション2006, インタラクティブセッション, 207-208, 情報処理学会, Mar. 2006. インタラクティブ発表賞
  66. 丹羽 治彦, 駒谷 和範, 尾形 哲也, 奥乃 博: 可聴域音波の広指向性と回折を利用した同時複数物体定位と遮蔽物検出, 音響学会超音波研究会, USs2005-110, Jan. 26, 2006.
  67. 神田 直之, 駒谷 和範, 中野 幹生, 中臺 一博, 辻野 広司, 尾形 哲也, 奥乃 博: 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の 高精度化, 情報処理学会第60回音声言語処理研究会, SLP, Feb. 2006.
  68. 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏の音源同定における音の重なりに対する頑健性の改善, (社)音響学会関西支部 第8回若手研究者交流研究発表会 , 2005年12月16日. 奨励賞
  69. 丹羽 治彦, 駒谷 和範, 尾形 哲也, 奥乃 博: 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識, (社)音響学会関西支部 第8回若手研究者交流研究発表会 , 2005年12月16日.
  70. 山本 俊一, 中臺 一博, 中野 幹生, 辻野 広司, Jean-Marc Valin, 駒谷 和範, 尾形 哲也, 奥乃 博: 音源分離と音声認識を統合した同時発話認識システムの同時発話文による評価, 第6回システムインテグレーション部門 講演会 (SI2005), 計測自動制御学会, Dec. 2005.
  71. 海尻 聡, 石原 一志, 北原 鉄朗, Jean-Marc Valin, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボットによる周囲状況把握のための雑音下での環境音認識, 第6回システムインテグレーション部門 講演会 (SI2005), 計測自動制御学会, Dec. 2005.
  72. 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 混合音からの特徴量テンプレート作成と音楽的文脈の利用による多重奏の音源同定, 音響学会秋季研究発表会, 3-10-15, pp.-, Sep. 2005.
  73. 山本 俊一, Jean-Marc Valin, 中臺 一博, 中野 幹生, 辻野広司, 駒谷 和範, 尾形 哲也, 奥乃 博: ミッシングフィーチャ理論を適用した同時発話認識システムの同時発話文による評価, 第22回 AI チャレンジ研究会, SIG-Challenge-0522-17, pp.101--106, 人工知能学会, Nov. 2005.
  74. 川嶋 宏彰, 西山 正紘, 松山 隆司: 表情譜:タイミング構造に基づく表情の記述・生成・認識, 第4回情報科学技術フォーラム, LI-006, pp.153-156, Sep. 2005 PDF. FIT2005 船井ベストペーパー賞
  75. 服部 佑哉, 小嶋 秀樹, 駒谷 和範, 尾形 哲也, 奥乃 博: モダリティ間マッピングを用いた環境音を表現するロボットジェスチャー生成, 日本ロボット学会第23回大会, 1H14, Sep. 2005.
  76. 松本 祥平, 大谷 拓, 駒谷 和範, 尾形 哲也, 谷 淳, 奥乃 博: 人間との対話のためのロボットによる疑似シンボル獲得とリアルタイム表情認識, 日本ロボット学会第23回大会, 1H15, Sep. 2005.
  77. 田崎 豪, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボットによる複数人同時インタラクションのための人間密度空間マッピング, 日本ロボット学会第23回大会, 2H16, Sep. 2005.
  78. 村瀬 昌満, 山本 俊一, Jean-Marc Valin, 中臺 一博, 山田 健太郎, 駒谷 和範, 尾形 哲也, 奥乃 博: 複数のカルマンフィルタを用いた複数移動話者追跡と精度評価. 日本ロボット学会第23回大会, 3C26, Sep. 2005.
  79. 黒瀧 俊輔, 鈴木 紀章, 中臺 一博, 奥乃 博, 天野 英晴: アクティブ方向通過型フィルタの動的リコンフィギュラブルデバイスによる実装, 日本ロボット学会第23回大会, 3C34, Sep. 2005.
  80. 山本 俊一, Jean-Marc Valin, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: ミッシングフィーチャー理論に基づく音源分離と音声認識のインターフェースの評価, 日本ロボット学会第23回大会, 3C35, Sep. 2005.
  81. 吉井 和佳, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: ドラムパターン推定によるドラム音認識誤り補正手法, 音楽情報科学研究会, 2005-MUS-61, Vol.2005, No.82, pp.91-96, 情報処理学会, Aug. 2005. 山下記念研究賞
  82. 石原 一志, 北原 鉄朗: 擬音語を用いた音素材検索システム, デモンストレーション:若手による研究紹介II, 音楽情報科学研究会, 2005-MUS-61, Vol.2005, No.82, pp.29, 情報処理学会, Aug. 2005.
  83. 藤原 弘将, 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 伴奏音抑制と高信頼度フレーム選択に基づく楽曲中の歌声の歌手名同定手法, 音楽情報科学研究会, 2005-MUS-61, Vol.2005, No.82, pp.97-104, 情報処理学会, Aug. 2005.
  84. 奥乃 博, 中臺 一博: 聖徳太子ロボット - 視聴覚統合によるロボット聴覚, 画像センシングシンポジウム, 人間共存・協調ロボットセッション招待講演 (Jun. 2005), pp.87-92.
  85. 駒谷 和範: 音声対話システムにおける対話のモデル, チュートリアル, 人工知能学会研究会資料, SIG-SLUD-A501-05, pp.27--32, 人工知能学会, Jun. 2004.
  86. 浜辺 良二, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける音韻的類似表現の混同を防ぐための確認の自動生成. 第56回音声言語情報処理研究会 2005-NL-167 (13), 2005-SLP-56 (13), Vol.2005, No.50, pp.89-94, 情報処理学会, May 27, 2005.
  87. 北原 鉄朗, 石田 克久, 武田 正之: 振動機能付鍵盤楽器「ぶるぶるくん」を用いた即興演奏支援システム, 音楽情報処理研究会, 2005-MUS-60 (1), Vol.2005, No.45, pp.25-30, 情報処理学会, May 2005.
  88. 黒瀧 俊輔, 鈴木 紀章, 中臺 一博, 奥乃 博, 天野 英晴: 動的リコンフィギュラブルデバイスDRPを用いた音源分離フィルタの実装と評価, リコンフィギュラブルシステム研究会, RECONF2005-26 (2005-5), 信学技報 Vol.105, No.43, pp.67-72, 電子情報通信学会, May 2005.
  89. 西山 正紘, 川嶋 宏彰, 松山 隆司: 表情譜: 顔パーツ間のタイミング構造の記述とその自動獲得. コンピュータビジョンとイメージメディア研究会 2005-CVIM-149-25, Vol.2005, 情報処理学会, May 13, 2005. 卒論セッション優秀賞

    特許

  90. 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及び コンピュータプログラム. 特開2006-5807号, 公開日 2006年1月5日, 発明者:後藤真孝, 吉井和佳, 奥乃 博, 特願2004-181881号, 出願日 2004年6月18日, 登録日 2004年6月23日.
  91. 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及び コンピュータプログラム. 発明者:吉井和佳, 奥乃 博, 後藤真孝, 米国特許公開 US2005/0283361 A1, 公開日 2005年12月22日, 出願日 2004年12月21日.
  92. Robot audiovisual system Patent No. US 6,967,455. Filing date: Mar 8, 2002. Issue date: Nov 22, 2005. Inventors: Kazuhiro Nakadai, Ken-ichi Hidai, Hiroshi Okuno, Hiroaki Kitano. Assignee: Japan Science and Technology Agency
  93. Speech Recongition Device, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto, Wipo Patent: WO/2005/048239, Application Number: PCT/JP2004/016883, Publication Date: 05/26/2005, Filing Date: 11/12/2004.

2005年度 o 2004年度(奥乃研究室)o 2003年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

学位論文

  1. 秋葉 泰弘: Automatic Evaluation Methods for Machine Translation Systems (機械翻訳システムの自動評価法), 博士論文, Jan. 2005.

  2. 石原 一志: 環境音からの擬音語への自動変換と環境音検索システムへの応用, 修士論文, Feb. 2005
  3. 小鷹 研理: 一次反射音と身体的ダイナミクスを利用した仮想空間上の移動間隔提示, 修士論文, Feb. 2005
  4. 山本 俊一: 音源分離との統合によるミッシングフィーチャーマスク自動生成に基づく同時発話音声認識, 修士論文, Feb. 2005
  5. 山口 健: 唇画像を用いた母音認識における方向と距離の多用性に対する顔健化, 修士論文, Feb. 2005
  6. 吉井 和佳: Drum Sound Recognition for Polyphonic Audio Signals by Adaptation of Spectral Templates and Suppression of Harmonic Structure, 修士論文, Feb. 2005

  7. 大庭 隼人: ロボット動作生成のための RNNPB による物体ダイナミクスの能動知覚, 卒業特別研究報告, Feb. 2005
  8. 大谷 拓: 人とロボットの協調作業のためのRNNPBによる疑似シンボルの獲得, 卒業特別研究報告, Feb. 2005
  9. 海尻 聡: ロボットによる周囲状況把握のための雑音下での環境音認識 , 卒業特別研究報告, Feb. 2005
  10. 浜辺 良二: 音声対話システムにおける音韻的類似表現の混同を防ぐための確認の自動生成, 卒業特別研究報告, Feb. 2005
  11. 藤原 弘将: 調波構造抽出に基づいた歌声再合成による歌手名の同定, 卒業特別研究報告, Feb. 2005
  12. 村瀬 昌満: 複数のカルマンフィルタと音響的特徴を用いた複数移動話者の追跡, 卒業特別研究報告, Feb. 2005

    査読つきジャーナル論文

  13. Tetsuya Ogata, Shigeki Sugano, and Jun Tani: Acquisition of Motion Primitives of Robot in Human-Navigation Task: Towards Human-Robot Interaction based on "Quasi-Symbol", 人工知能学会論文誌, Vol.20, No.3, pp.188-196. Mar. 2005. オンライン論文誌 doi:10.1527/tjsai.20.188
  14. Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Shun'ichi Yamamoto, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance, 人工知能学会論文誌, Vol.20, No.3, pp.209-219, Mar. 2005. オンライン論文誌 doi:10.1527/tjsai.20.209
  15. 秋葉 泰弘, 今村 賢治, 隅田 英一郎, 中岩 浩巳, 山本 誠一, 奥乃 博: 複数の編集距離を用いた口語翻訳文の自動評価. 人工知能学会論文誌, Vol.20, No.3,pp.139-148 (2005). オンライン論文 doi:10.1527/tjsai.20.139
  16. 石原 一志, 駒谷 和範, 尾形 哲也, 奥乃 博: 環境音を対象とした擬音語自動認識. 人工知能学会論文誌, Vol.20, No.3, pp.229-236, Mar. 2004. オンライン論文誌 doi:10.1527/tjsai.20.229
  17. 翠 輝久, 駒谷 和範, 清田 陽司, 河原 達也: 音声対話によるソフトウェアサポートタスクのための効果的な確認戦略, 電子情報通信学会論文誌, Vol.88-D2, No.3 (Mar. 2005) 499-508, 電子情報通信学会. pdf
  18. Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: User Modeling in Spoken Dialogue Systems to Generate Flexible Guidance, User Modeling and User-Adapted Interaction, Special Issue on Language-Based Interaction: User Modeling and Adaptation, Vol.15, No.1-2 (2005) pp.169-183, Kluwer. Abstract doi:10.1007/s11257-004-5659-0
  19. Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino: Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots, Speech Communication, Vol.44, Issues 1-4 (Oct. 2004) 97--112, Elsevier. doi:10.1016/j.specom.2004.10.010
  20. Tino Lourens, Hiroshi G. Okuno, Hiroshi Tsujino: A computational model of monkey cortical grating cells. Biological Cybernetics, Vol.92, No.1 (Jan. 2005) 61--70. Springer-Verlag. pdf doi:10.1007/s00422-004-0522-2
  21. Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Effects of increasing modalities in recognizing three simultaneous speeches, Speech Communication, Vol.43, Issue 4, pp.347-359, Sep. 2004. doi:10.1016/j.specom.2004.03.008
  22. Yasuhisa Hayakawa, Tetsuya Ogata, and Shigeki Sugano: Flexible Assembly Work Cooperating System based on Work State Identifications by Self-Organizing Map, IEEE/ASME Transactions on Mechatronics, Vol.9, No.3, accepted, Sept. 2004.
  23. 駒谷和範, 上野晋一, 河原達也, 奥乃 博: 音声対話システムにおける適応的な応答生成を行うためのユーザモデル, 電子情報通信学会論文誌, Vol.87-D2, No.10 (Oct. 2004) 1921-1928, 電子情報通信学会. pdf
  24. Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid Robot, Applied Intelligence, Vol.20, No.3 (May/June, 2004), 253-266, doi:10.1023/B:APIN.0000021417.62541.e0 (accepted in Oct. 2002), Kluwer Publishers. IF: 1.853
  25. 渡邊太郎, 今村, 隅田英一郎, 奥乃 博: 階層的句アライメントを用いた統計的機械翻訳, 電子情報通信学会論文誌, Vol.J87-D2, No.4 (Apr. 2004) 978-986, 電子情報通信学会. pdf

    章分担・解説論文・翻訳

  26. セップ・リンハルト, 伊東久重, 奥乃 博, 後藤靜夫, 帚木蓬生, 宮台真司, 山極寿一: ワークショップ2「こころの病理」, 京都文化会議2004報告集, pp.124-145, Mar. 2005
  27. Kazushi Ishihara, Tomohiro Nakatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Sound-Imitation Word Recognition from Environmental Sounds Focusing on Ambiguity Problem in Determining Phonemes. PRICAI 2004: Trends in Artificial Intelligence, LNAI 3157, pp.909-918, Springer-Verlag, Auckland, Aug. 2004. doi:10.1007/b99563 html
  28. Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: User Modeling in Spoken Dialogue Systems for Flexible Guidance Generation. Post-Proceedings of JSAI, LNAI 3609, in print, Springer-Verlag. doi:10.1007/3-540-45324-5_19
  29. Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani, Kazuhiro Nakadai: Computational Auditory Scene Analysis and Its Application to Robot Audition, Post-Proceedings of the International Conference on Informatics Research for Development of Knowledge Society Infrastructure, pp.73-80, IEEE Computer Society Press, Jun. 2004, doi:10.1109/ICKS.2004.1313411
  30. Kazunori Komatani, Ryosuke Itoh, Tatsuya Kawahara, Hiroshi G. Okuno: Recognition of Emotional States in Spoken Dialogue with a Robot. Innovations in Applied Artificial Intelligence (IEA/AIE-2004), LNAI 3029, 413-423, Springer-Verlag. Ottawa, May. 2004, doi:10.1007/978-3-540-24677-0_43
  31. Tetsuya Ogata, Jun Tani: Open-end Human Robot Interaction from the Dynamical Systems Perspective: Mutual Adaptation and Incremental Learning. Innovations in Applied Artificial Intelligence (IEA/AIE-2004), LNAI 3029, 435-444, Springer-Verlag. Ottawa, May. 2004, Springer-Verlag
  32. 奥乃 博: Lisp, 人工知能学事典, 共立出版, 2005.
  33. 奥乃 博: 巻頭言, Webプロ年鑑'04, アルファ企画, 2004.
  34. 北原鉄朗訳: デジタル音楽配信のコンテンツ管理, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.1-6
    原著: Content management for electronic music distribution. by Franc,ois Pachet, CACM, Vol.46, No.4 (April 2003) 71 - 75.
  35. 吉井和佳訳: セイレーンの歌と白鳥の歌 音楽のよるデバッグ, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.7-14
    原著: Siren songs and swan songs debugging with music. by Paul Vickers, James L. Alty, CACM, Vol.46, No.7 (July 2003) 86-93.
  36. 山本俊一訳: デジタル音楽とオンライシェアリング:ソフトウェアの著作権侵害2.0? CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.15-21
    原著: Digital music and online sharing: software piracy 2.0? by Sudip Bhattacharjee, Ram D. Gopal, G. Lawrence Sanders, CACM, Vol.46, No.7 (July 2003) 101 - 111.
  37. 櫻庭洋平訳: デジタル音楽に対する代替配信戦略, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.22-29
    原著: Alternate distribution strategies for digital music. by G. Prem Premkumar, CACM, Vol.46, No.9 (September 2003) 71 - 75.
  38. 小鷹研理訳: MP3オープン標準とインターネット著作権侵害に対する音楽業界の対応, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.36-41
    原著: The MP3 open standard and the music industry's response to Internet piracy. by Easley, John G. Michel, Sarv Devaraj, CACM, Vol.46, No.11 (November 2003) 71 - 75.

    査読つき国際会議論文

  39. Hiroshi G. Okuno: Robot Audition: Its Issues and State of the Art (invited talk), Proceedings of 2nd International Symposium on Life Science, Kyoto, Feb. 2005.
  40. Tetsuya Ogata, Shigeki Sugano, and Jun Tani: Acquisition of Motion Primitives of Robot in Human-Navigation Task: Towards Human-Robot Interaction based on "Quasi-Symbol", Proceedings of 2nd International Workshop on Man-Machine Symbiotic Systems, 315-326, Kyoto, Nov. 2004.
  41. Tsuyoshi Tasaki, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Motion Control using Listener's Back-Channels and Head Gesture Information. Proceedings of 2nd International Workshop on Man-Machine Symbiotic Systems, 327-338, Kyoto, Nov. 2004.
  42. Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Communication of Humanoid Robot with multiple people based on Interaction Distance, Proceedings of 2nd International Workshop on Man-Machine Symbiotic Systems, 385-392, Kyoto, Nov. 2004.
  43. Yuki Suga, Hiroaki ARIE, Tetsuya Ogata, and Shigeki Sugano: Constructivist Approach to Human-Robot Emotional Communication: Design of Evolutionary Function for WAMOEBA-3, Proceedings of IEEE/RAS Interanational Conference on Humanoid Robots (Humanoids 2004), No.76, Los Angels, Nov. 2004.
  44. Yuki Suga, Tetsuya Ogata, and Shigeki Sugano: Development of Emotional Communication Robot, WAMOEBA-3, Proceedings of International Conference on Advanced Mechatronics (ICAM 2004), 413-418, Oct. 2004.
  45. Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: Automatic Drum Sound Description for Real-World Music Using Template Adaptation and Matching Methods Proceedings of 5th International Conference on Musical Information Retrieval (ISMIR-2004), 184-191, Barcelona, Spain, Oct. 2004. pdf
  46. Takuya Yoshioka, Tetsuro Kitahara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Chord Transcription with Concurrent Recognition of Chord Symbols and Boundaries. Proceedings of 5th International Conference on Musical Information Retrieval (ISMIR-2004), 100-105, Barcelona, Spain, Oct. 2004. pdf
  47. Tsuyoshi Tasaki, Takeshi Yamaguchi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Motion Control using Listener's Back-Channels and Head Gesture Information. Proceedings of 2004 International Conference on Spoken Language Processing (ICSLP-2004), 1033-1036, ASA, ASJ, and ESCA, Korea, Oct. 2004.
  48. Kazushi Ishihara, Yuya Hattori, Tomohiro Nakatani, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Disambiguation in Determining Phonemes of Sound-Imitation Words for Environmental Sound Recognition. Proceedings of 2004 International Conference on Spoken Language Processing (ICSLP-2004), 1485-1488, ASA, ASJ, and ESCA, Korea, Oct. 2004.
  49. Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: Drum Sound Identification for Polyphonic Music Using Template Adaptation and Matching Methods Proceedings of ISCA Tutorial and Research Workshop on Statistical and Perceptual Audio Processing (SAPA-2004), accepted, ASA, ASJ, and ESCA, Korea, Oct. 2004.
  50. Shun'ichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G. Okuno: Assessment of General Applicability of Robot Audition System by Recognizing Three Simultaneous Speeches. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.2111-2116, IEEE, RSJ, Sendai, Sep. 2004. IEEE 関西支部学生研究奨励賞 doi:10.1109/IROS.2004.1389721
  51. Tetsuya Ogata, Masaki Matsunaga, Shigeki Sugano, and Jun Tani: Human Robot Collaboration Using Behavioral Primitives, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.1592-1597, IEEE, RSJ, Sendai, Sep. 2004. doi:10.1109/IROS.2004.1389721
  52. Yuki SUGA, Tetsuya Ogata, and Shigeki Sugano: Aquisition of Reactive Motion for Communication Robots Using Interactive EC: Proc. of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2004), accepted, Sept. 2004. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.1198-1203, IEEE, RSJ, Sendai, Sep. 2004. doi:10.1109/IROS.2004.1389721
  53. Yoshihiro Sakamoto, Tetsuya Ogata, and Shigeki Sugano: Human-Robot Communication Using Multiple Recurrent Neural Networks, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.1574-1579, IEEE, RSJ, Sendai, Sep. 2004.
  54. Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Communication of Humanoid Robot with multiple people based on Interaction Distance, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2004), 71-76, IEEE, Kurashiki, Sep. 2004. pdf doi:10.1109/ROMAN.2004.1374732
  55. Yuya Hattori, Kazushi Ishihara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Repeat Recognition for Environmental Sounds, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2004), 83-88, IEEE, Kurashiki, Sep. 2004. pdf doi:10.1109/ROMAN.2004.1374734
  56. Yusuke Akiwa, Yuki Suga, Tetsuya Ogata, and Shigeki Sugano: Imitation based Human-Robot Communication: Roles of Joint Attention and Motion Prediction, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2004), 283-288, IEEE, Kurashiki, Sep. 2004.
  57. Yasuhiro Akiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Using a Mixture of N Best Lists from Multiple MT Systems in Rank-Sum-Based Confidence Measure for MT Outputs. Proceedings of the 20th International Conference on Computational Linguistics (Coling-2004), 322-328, Geneva, Aug. 2004.
  58. Kazunori Komatani, Teruhisa Misu, Tatsuya Kawahara, Hiroshi G. Okuno: Efficient Confirmation Strategy for Large-scale Text Retrieval Systems with Spoken Dialogue Interface. Proceedings of the 20th International Conference on Computational Linguistics (Coling-2004), 1100-1106, Geneva, Aug. 2004.
  59. Katsuhisa Ishida, Masayuki Takeda, Tetsuro Kitahara: ism: Improvisation Supporting Systems with Melody Correction, Proceedings of the International Symposium on Musical Acoustics (NIME2004), 177-180, Hamamatsu, Jun. 2004.
  60. Yasuhiro Akiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Incremental Methods to Select Test Sentence for Evaluating Translation Ability. Proceedings of the fourth international conference on Language Resources and Evaluation (LREC-2004), pp.2015-2018, Lisbon, Portugal, May 2004. pdf
  61. Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Category-level Identification of Non-registered Musical Instrument Sounds. Proceedings of 2004 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004), Vol.IV, 253-256, Montreal, IEEE, May 2004. pdf doi:10.1109/ICASSP.2004.1326811
  62. Yohei Sakuraba, Tetsuro Kitahara, Hiroshi G. Okuno: Comparing Features for Forming Music Streams in Automatic Music Transcription. Proceedings of 2004 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004), Vol.IV, 273-276, IEEE, Montreal, May 2004. pdf
  63. Shun'ichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Toshio Yokoyama, Hiroshi G. Okuno: Improvement of Robot Audition by Interfacing Sound Source Separation and Automatic Speech Recognition with Missing Feature Theory, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2004), 1517-1523, IEEE, New Orleans, May. 2004. pdf IEEE Robotics and Automation Society Japan Chapter Young Award doi:10.1109/ROBOT.2004.1308039
  64. Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Acoustical-similarity-based Musical Instrument Hierarchy and Its Application to Musical Instrument Identification, Proceedings of the International Symposium on Musical Acoustics (ISMA2004), 297-300, Nara, Apr. 2004.

    口頭発表(研究会・全国大会)

  65. 奥乃 博, 中臺 一博: ロボット聴覚の課題と現状 (招待講演), 音響学会春季研究発表会, 3-7-7, pp.633-636, Mar. 2005.
  66. 吉岡 拓也, 引地孝文, 三好正人, 駒谷 和範, 尾形 哲也, 奥乃 博: 音楽音響信号による室内音場共振周波数のブラインド推定. 音響学会春季研究発表会, 3-6-9, pp.501-502, Mar. 2005.
  67. 丹羽 治彦, 駒谷 和範, 尾形 哲也, 奥乃 博: 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識, 音響学会春季研究発表会, 3-9-17, pp.969-970, Mar. 2005.
  68. 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 多重奏の音源同定のための混合音からのテンプレート作成法, 情報処理学会第67回全国大会, 3G-4, Mar. 2005. 大会奨励賞 (平成17年5月26日)
  69. 吉井 和佳, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 調波構造の抑制によるドラムス発音時刻検出の頑健化. 情報処理学会第67回全国大会, 3R-7, Mar. 2005. 学生奨励賞
  70. 藤原 弘将, 北原 鉄朗, 後藤 真孝, 駒谷 和範, 尾形 哲也, 奥乃 博: 歌声の調波構造抽出を用いた歌手名の同定. 情報処理学会第67回全国大会, 3R-8, Mar. 2005.
  71. 小鷹 研理, 駒谷 和範, 尾形 哲也, 奥乃 博: 簡易的インタフェースを用いた仮想空間移動のための歩行感覚の補償. 情報処理学会第67回全国大会, 1Z-8, Mar. 2005. 学生奨励賞, 大会優秀賞 (平成17年5月26日)
  72. 石原 一志, 服部 佑哉, 駒谷 和範, 尾形 哲也, 奥乃 博: 擬音語自動認識に基づいた環境音検索システム. 情報処理学会第67回全国大会, 4R-1, Mar. 2005.
  73. 服部 佑哉, 小嶋 秀樹, 駒谷 和範, 尾形 哲也, 奥乃 博: ドメイン間マッピングによる環境音に呼応したロボット動作生成. 情報処理学会第67回全国大会, 6X-6, Mar. 2005.
  74. 山本 俊一, Jean-Marc Valin, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: マイクロフォンアレイによるお分離音声認識のてのミッシングフィーチャー マスク自動生成, 情報処理学会第67回全国大会, 4R-4, Mar. 2005.
  75. 村瀬 昌満, 山本 俊一, Jean-Marc Valin, 駒谷 和範, 尾形 哲也, 奥乃 博: カルマンフィルタによる音声の時系列特徴を用いた複数移動話者の追跡. 情報処理学会第67回全国大会, 4R-8, Mar. 2005.
  76. 海尻 聡, 石原 一志, Jean-Marc Valin, 駒谷 和範, 尾形 哲也, 奥乃 博: マイクロフォンアレイを用いて分離した環境音による状況認識. 情報処理学会第67回全国大会, 4R-3, Mar. 2005.
  77. 山口 健, 駒谷 和範, 尾形 哲也, 奥乃 博: 方向と距離の変化に対してロバストな唇認識, 情報処理学会第67回全国大会, 4R-5, Mar. 2005.
  78. 田崎 豪, 松本 祥平, 大庭 隼人, 村瀬 昌満, 大谷 拓, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボットによる人間親密度の空間マッピングとインタラクションへの適用. 情報処理学会第67回全国大会, 6X-5, Mar. 2005.
  79. 松本 祥平, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声情報と顔画像情報の統合によるパラ言語レベルの感情認識. 情報処理学会第67回全国大会, 4X-5, Mar. 2005. 学生奨励賞
  80. 大谷 拓, 駒谷 和範, 尾形 哲也, 谷 淳, 奥乃 博: ロボットとの協調作業のためのRNNによる疑似シンボルの獲得. 情報処理学会第67回全国大会, 1M-4, Mar. 2005. 学生奨励賞
  81. 大庭 隼人, 駒谷 和範, 尾形 哲也, 谷 淳, 奥乃 博: RNNによるロボットの物体操作のための物体ダイナミクスの抽出. 情報処理学会第67回全国大会, 2M-2, Mar. 2005. 学生奨励賞
  82. 神田 直之, 駒谷 和範, 尾形 哲也, 奥乃 博: データベース検索タスクの文脈的制約を用いた音声対話システムの実験的評価. 情報処理学会第67回全国大会, 4R-7, Mar. 2005.
  83. 浜辺 良二, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける音韻的類似表現の混同を防ぐための確認の生成. 情報処理学会第67回全国大会, 4R-6, Mar. 2005. 学生奨励賞
  84. 神田 直之, 駒谷 和範, 尾形 哲也, 奥乃 博: データベース検索タスクの文脈的制約を用いた音声対話システムの実験的評価. 音声言語情報処理研究会 2004-SLP-, Vol.2005, No.12, pp.107-112, 情報処理学会, Feb. 2005.
  85. 奥乃 博: 視聴覚統合による音の認識と生成 (キーノート講演), 第5回システムインテグレーション部門 講演会 (SI2004), 1I3-1 (キーノート講演), 計測自動制御学会, Dec. 2004.
  86. 山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博: ロボット聴覚におけるミッシングフィーチャ理論を応用した音源分離と 音声認識の統合, 第5回システムインテグレーション部門 講演会 (SI2004), 1I3-2, 計測自動制御学会, Dec. 2004. SI2004ベストセッション講演賞
  87. 山本 俊一, Jean-Marc Valin, 中臺 一博, 奥乃 博: ロボットに装着したマイクロフォンアレイによる音源分離と ミッシングフィーチャ理論に基づく音声認識, 第20回 AI チャレンジ研究会, SIG-Challenge-0420-5, pp.27--32, 人工知能学会, Dec. 2004.
  88. 石田 克久, 北原 鉄朗, 武田 正之: 演奏者に振動で情報提示する鍵盤楽器「ぶるぶるくん」, Proceedings of the 12th Workshop on Interactive Systems and Software (WISS 2004), pp.59-64, Dec. 2004.
  89. 翠 輝久, 清田 陽司, 駒谷 和範, 河原 達也, 黒橋 禎夫, 木戸 冬子: 音声版ダイアログナビ:音声対話によるソフトウェアサポート, 音声言語情報処理研究会 2004-SLP-, Vol.2004, No., pp.-, 情報処理学会, Oct. 2004.
  90. 田崎 豪, 松本 祥平, 大庭 隼人, 戸田 充彦, 駒谷 和範, 尾形 哲也, 奥乃 博: ヒューマノイドロボット SIG2 の近接学に基づく複数の人とのインタラクション, 日本ロボット学会第22回大会, 1E33, Sep. 2004. pdf
  91. 松本 祥平, 山口 健, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボットでの利用を目的とした顔画像情報と音声情報の統合による感情認識, 日本ロボット学会第22回大会, 3D14, Sep. 2004. pdf
  92. 尾形 哲也, 菅野 重樹, 谷 淳: 動作プリミティブを介した人間とロボットの協調, 日本ロボット学会第22回大会, 3E11, Sep. 2004.
  93. 山本 俊一, 中臺 一博, 辻野 広司, 駒谷 和範, 尾形 哲也, 奥乃 博: ミッシングフィーチャ理論に基づく音源分離と音声認識のインタフェースの評価, 日本ロボット学会第22回大会, 1C33, Sep. 2004. pdf
  94. 吉井 和佳, 後藤 真孝, 奥乃 博: 実世界の音楽音響信号に対するドラムスの音源同定手法を利用したドラ ムイコライズシステムINTER:Dの開発, FIT-2004 「情報科学技術レターズ」, LG-005, Sep. 2004. FIT2004論文賞 pdf
  95. 神田 直之, 駒谷 和範, 尾形 哲也, 奥乃 博: データベース検索タスクにおける文脈的制約を用いた音声対話システム, FIT-2004 「情報科学技術レターズ」, LG-001, Sep. 2004. pdf
  96. 山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博: ミッシングフィーチャ理論による音源分離と混合音声認識の統合型インターフェース, FIT-2004, G-007, Sep. 2004. pdf
  97. 石田 克久, 北原 鉄朗, 武田 正之: 統計モデルに基づく旋律妥当性判定手法を用いた即興演奏支援, 日本音響学会2004年秋季研究発表会講演論文集,2-6-8,pp.783−784, Sep., 2004.
  98. 北原 鉄朗, 後藤 真孝, 奥乃 博: 混合音テンプレートを用いた多重奏の音源同定, 音楽情報科学研究会, 2004-MUS-56-9, Vol.2004, No.84, pp.57-64, 情報処理学会, Aug. 2004.
  99. 吉井 和佳, 後藤 真孝, 奥乃 博: 単一テンプレート適応法による音楽音響信号を対象とした ハイハットシンバルの音源同定, 音楽情報科学研究会, 2004-MUS-56, Vol.2004, No.84, pp.49-56, 情報処理学会, Aug. 2004.
  100. 吉岡 拓也, 北原 鉄朗, 駒谷 和範, 尾形 哲也, 奥乃 博: 和音区間検出と和音名同定の相互依存性を解決する和音認識手法, 音楽情報科学研究会, 2004-MUS-56-6, Vol.2004, No.84, pp.33-40, 情報処理学会, Aug. 2004.
  101. 浜中 雅俊, 北原 鉄朗, 石田 克久, 谷井 章夫, 竹川 佳成, 吉井 和佳, 宮下 芳明, 上田 健太郎* デモンストレーション:若手による研究紹介, 音楽情報科学研究会, 2004-MUS-56, Vol.2004, No.84, pp.27-32, 情報処理学会, Aug. 2004.
  102. 小鷹 研理, 尾形 哲也, 奥乃 博: 一次反射音が移動の感覚に与える影響について, 日本認知科学会第21回大会, R-22, Jul. 2004.
  103. 翠 輝久, 駒谷 和範, 清田 陽司, 河原 達也, 木戸 冬子: 音声対話による大規模知識ベース検索システム - 音声版ダイアログナビ -. ヒューマンインタフェース研究会, 2004-HI-109, 音声言語情報処理研究会 2004-SLP-52, Vol.2004, No.74, pp.21-26, 情報処理学会, Jul. 2004.
  104. 北原 鉄朗, 後藤 真孝, 奥乃 博: TimbreTree:音色の類似度に基づいた楽器の階層的分類, 日本音響学会音楽音響研究会資料, MA2004-7, Vol.23, No.2, pp.13-18, Jun. 2004.
  105. 吉岡 拓也, 北原 鉄朗, 尾形 哲也, 奥乃 博: 音楽音響信号を対象とした和音進行の認識, 日本音響学会音楽音響研究会資料, MA2004-8, Vol.23, No.2, pp.19-24, Jun. 2004.
  106. 神田 直之, 駒谷 和範, 尾形 哲也, 奥乃 博: データベース検索タスクにおける文脈的制約を用いた音声対話システム 第41回 言語・音声理解と対話処理研究会, 人工知能学会.
  107. 山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博: ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識. 人工知能学会第18回全国大会, 1E2-01, 282-285, Jun. 2004.
  108. 山口 健, 山本 俊一, 駒谷 和範, 尾形 哲也, 奥乃 博: 多方向の唇画像を利用した音声認識. 人工知能学会第18回全国大会, 1E2-02, 279-281, Jun. 2004.
  109. 石原 一志, 中谷 智広, 駒谷 和範, 尾形 哲也, 奥乃 博: 環境音の擬音語変換のための環境音用音素の設計. 人工知能学会第18回全国大会, 1E2-03, 274-277, Jun. 2004.
  110. 菅佑樹, 秋和祐介, 尾形 哲也, 菅野重樹: Interactive EC を用いた自動自律ロボットの進化に関する基礎研究, 日本機械学会ロボティクス・メカトロニクス講演会, 2PL2-L1-24, Jun. 2004.
  111. 菅佑樹, 秋和祐介, 尾形 哲也, 菅野重樹: 動作模倣による人間とロボットのインタラクション - 手先軌道データを用いた動作予測システムの構築, 日本機械学会ロボティクス・メカトロニクス講演会, 2A1-H-61, Jun. 2004.

    特許

  112. ロボット視聴覚システム, 特許3632099号, 発明者:中臺一博, 奥乃 博, 北野宏明, 登録日 2005年1月7日. 発行日 2005年3月23日. 特願2002-365764号, 出願日: 2002年12月17日.
  113. 情報処理システムおよび情報処理方法, 並びにプログラム, 発明者: 菅野重樹, 尾形哲也, 金 天海, 特願2004-363742号, 15 Dec. 2005.
  114. 鍵盤楽器支援装置及び鍵盤楽器支援システム, 特願2004-333279号, 発明者:武田正之, 石田克久, 北原鉄朗, 出願日 2004年11月17日.
  115. ロボット視聴覚システム, 特許3627058号, 発明者:中臺一博, 奥乃 博, 北野宏明, 登録日 2004年12月17日. 発行日 2005年3月9日. 特願2002-056670号, 出願日 2002年3月1日.
  116. 鳴き声による音声ガイドシステム, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 特許第3590869号, 登録日 2004年9月3日. 発行日 2004年11月17日. pdf
  117. ロボット視聴覚システム, 特開2004-198656号, 発明者:中臺一博, 奥乃 博, 北野宏明, 公開日 2004年7月15日. 特願2002-365764号, 出願日 2002年12月17日.
  118. 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及び コンピュータプログラム. 発明者:吉井和佳, 奥乃 博, 後藤真孝, 特願2004-181881号, 出願日 2004年6月18日, 登録日 2004年6月23日.
  119. 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及び コンピュータプログラム. 発明者:吉井和佳, 奥乃 博, 後藤真孝, 米国特許出願 11/020, 030, 出願日 2004年12月21日.

2004年度 o 2003年度(奥乃研究室)o 2002年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 渡邊 太郎 : Example-Based Statistical Machine Translation (用例に基づく統計的機械翻訳の研究), 博士論文, Feb. 2004.

  2. 北原 鉄朗: 音高による音色変化と未知楽器を考慮した楽器音の音源同定の研究, 修士論文, Feb. 2004.
  3. 桜庭 洋平: 音色・定位・音楽知識を用いた多重奏の自動採譜, 修士論文, Feb. 2004.
  4. 戸田 充彦: 距離を利用したマルチモーダル情報統合によるヒューマノイドロボットの挙動選択, 修士論文, Feb. 2004.

  5. 神田 直之: 音声対話システムにおける話題の構造を用いた効率的な対話管理, 卒業特別研究報告, Feb. 2004.
  6. 田崎 豪: 相槌認識による聞き手の理解状態推定を利用した協調的ロボット ヒューマンインタラクション, 卒業特別研究報告, Feb. 2004.
  7. 松本 祥平: ロボット挙動選択を目的とした顔画像信号と音声信号の感情空間 へのマッピング, 卒業特別研究報告, Feb. 2004.
  8. 服部 佑哉: 環境音の繰返し構造の認識, 卒業特別研究報告, Feb. 2004.
  9. 吉岡 拓也: 音楽音響信号を対象とする和音進行仮説を用いた和音認識, 卒業特別研究報告, Feb. 2004.

    査読つきジャーナル論文

  10. 北原 鉄朗, 後藤 真孝, 奥乃 博: 音響的類似性を反映した楽器の階層表現の獲得とそれに基づく未知楽器のカテゴリレベルの音源同定, 情報処理学会論文誌, Vol.45, No.3 (Mar. 2004) pp.680-689, 情報処理学会. pdf DL
  11. 石田 克久, 北原 鉄朗, 武田 正之: N-gramによる即興演奏の旋律補正. 情報処理学会論文誌 (テクニカルノート), Vol.45, No.3 (Mar. 2004) pp.743-746, 情報処理学会. 電子図書館
  12. 山肩 洋子, 河原 達也, 奥乃 博, 美濃 導彦: 音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消. 人工知能学会誌, Vol.19, No.1 F (2004) pp.47-56 . オンライン論文誌 doi:10.1007/s11257-004-5659-0
  13. 渡邊太郎, 隅田英一郎, 奥乃 博: 生成方向を考慮した統計的機械翻訳のためのデコーディングアルゴリズム, 情報処理学会論文誌, Vol.44, No.12 (Dec. 2003) 3202-3210, 情報処理学会. pdf DL
  14. 北原 鉄朗, 後藤 真孝, 奥乃 博: 音高による音色変化に着目した楽器音の音源同定: F0依存多次元正規分布に基づく識別手法. 情報処理学会論文誌, Vol.44, No.10 (Oct. 2003) 2448-2458, 情報処理学会. pdf DL 電気通信普及財団テレコム技術学生賞
  15. 中臺 一博, 日台 健一, 奥乃 博, 溝口 博, 北野 宏明: ヒューマノイドを対象にした視聴覚統合による実時間人物追跡: アクティブオーディションと顔認識の統合. 日本ロボット学会誌, Vol.21, No.5 (Jul. 2003), pp.517--525. pdf, pdf学会サーバ
  16. 駒谷 和範, 鹿島 博晶 田中 克明, 河原 達也: 複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム 情報処理学会論文誌, Vol.44, No.5 (May 2003) 1333-1342. in html
  17. Hiroshi G. Okuno, Kazuhiro Nakadai, Active audition for humanoid robots that can listen to three simultaneous talkers. Journal of the Acoustical Society of America, Vol.113, No.4, Pt.2 of 2, Apr. 2003, pp.2230. Abstract at ASA.

    章分担・解説論文

  18. 菅野 重樹, 尾形 哲也: "情"が作る真のコミュニケーション, 特集「ロボットから人間を読み解く」, 日経サイエンス, , Jan. 2004. アブストラクト
  19. 奥乃 博, 中臺 一博: ロボット聴覚の課題と現状. OA情報処理, Vol.44, No.11 (Nov. 2003) pp.1138-1144, 情報処理学会. Article PDF
  20. Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Pitch-dependent Musical Instrument Identification and Its Application to Musical Sound Ontology. In Chung, P,W.H., Hinde, C. and Ali, M. (Eds.) Developments in Applied Artificial Intelligence (IEA/AIE-2003), LNAI 2718, 112-122, Springer-Verlag. Loughborough, UK, Jun. 2003, doi:10.1007/3-540-45034-3_12
  21. Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Design and Implementation of Personality of Humanoids in Human Humanoid Non-verbal Interaction. In Chung, P,W.H., Hinde, C. and Ali, M. (Eds.) Developments in Applied Artificial Intelligence (IEA/AIE-2003), LNAI 2718, 662-673, Springer-Verlag. Loughborough, UK, Jun. 2003, doi:10.1007/3-540-45034-3_67
  22. Hiroshi G. Okuno, Kazuhiro Nakadai: Real-time Sound Source Localization and Separation based on Active Audio-Visual Integration. In Jose Mira and Jose R. Alvarez (Eds.): Computational Methods in Neural Modeling (IWANN 2003), Part 1, LNCS 2686, 118-125, Springer-Verlag. Ma\'{o}, Menorca,, Spain, June 2003, pdf doi:10.1007/3-540-44868-3_16
  23. 奥乃 博: 土屋 俊編, 『AI事典』, ファイゲンバウム, マッカーシ. 共立出版, 2003.

    査読つき国際会議論文

  24. Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani: Computational Auditory Scene Analysis and Its Application to Robot Audition, Proceedings of the International Conference on Informatics Research for Development of Knowledge Society Infrastructure (ICKS 2004), pp.73-80, Mar. 2004, doi:10.1109/ICKS.2004.1313411
  25. Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroaki Kitano: Applying Scattering Theory to Robot Audition System Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2003), 1147-1152, IEEE, Las Vegas, Oct. 2003. pdf
  26. Tetsuya Ogata, Shigeki Sugano, Jun Tani: Interactive Learning in Human-Robot Collaboration, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2003), 162-167, IEEE, Las Vegas, Oct. 2003. pdf
  27. Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroaki Kitano: Active audition based humanoid system and ist evaluation: Localization, Seperation and Recognition of Simultaneous Speech. Proceedings of IEEE/RSJ International Conference on Humanoids (Humanoids-2003), Springer-Verlag, IEEE, Munchen, Oct. 2003.
  28. Yohei Sakuraba, Hiroshi G. Okuno: Note Recognition of Polyphonic Music by Using Timbre Similarity and Direction Proximity. Proceedings of International Computer Music Conference (ICMC2003), 167-170, Singapore, Oct. 2003. pdf
  29. Yasuhiro AKiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Experimental Comparison of MT Evaluation Methods: RED vs. BLEU. Proceedings of MT Summit IX, 1-8, New Orleans, Sep. 2003.
  30. Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Realizing Personality in Audio-Visually Triggered Non-verbal Behaviors. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2003), 392-397, IEEE, Sep. 2003. pdf
  31. Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Robot Recognizes Three Simultaneous Speech By Active Audition. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2003), 398-403, IEEE, Sep. 2003. pdf
  32. Yasuhiro AKiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, and Hiroshi G. Okuno: Experimental Comparison of MT Evaluation Methods: RED vs. BLEU. Proceedings of MT Summit IX, 1-8, New Orleans, Sep. 2003. pdf
  33. Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino: Improvement of Three Simultaneous Speech Recognition by Using AV Integration and Scattering Theory for Humanoid. Proceedings of Audio Visual Spoken Processing (AVSP-2003), 157-162, St. Jorioz, France, Sep. 2003. pdf
  34. Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: User Modeling in Spoken Dialogue Systems for Flexible Guidance Generation. Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), 745-748, Geneva, Sep. 2003.
  35. Kazushi Ishihara, Yasushi Tsubota, Hiroshi G. Okuno: Automatic Transformation of Environmental Sounds into Sound-Imitation Words Based on Japanese Syllable Structure. Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), 3185-3188, Geneva, Sep. 2003.
  36. Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino: Three Simultaneous Speech Recognition by Integration of Active Audition and Face Recognition for Humanoid, Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), 2705-2708, Geneva, Sep. 2003.
  37. Tatsuya Kawahara, Ryosuke Ito, Kazunori Komatani: Spoken Dialogue System for Queries on Appliance Manuals using Hierarchical Confirmation Strategy. Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), accepted for presentation, Geneva, Sep. 2003.
  38. Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: Flexible Guidance Generation using User Model in Spoken Dialogue Systems, Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics (ACL 2003), pp.256-263, Sapporo, Jul. 2003.
  39. Taro Watanabe, Eiichiro Sumita, and Hiroshi G. Okuno: Chunk-based statistical translation, Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics (ACL 2003), pp.303-310, Sapporo, Jul. 2003.
  40. Yasuhiro AKiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, and Hiroshi G. Okuno: A Statistical-Informmation-Based Selector of the Best among Multiple Outputs, Exhibition Brochure of the 41st Annual Meeting of the ACL (ACL 2003), 16, Sapporo, Jul. 2003.
  41. Yoji Kiyota, Sadao Kurohashi, Teruhisa Misu, Kazunori Komatani, Tatsuya Kawahara, Fuyuko Kido: Dialog Navigator''A Spoken Dialog Q-A System based on Large Text Knowledge Base. ACL03 Interactive Poster/Demo Session, pp.149--152 (Companion Volume), 2003.
  42. Kazunori Komatani, Fumihiro Adachi, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: Flexible Spoken Dialogue System based on User Models and Dynamic Generation of VoiceXML Scripts. 4th SIGdial Workshop on Discourse and Dialogue, pp.87--96, 2003.
  43. Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Musical Instrument Identification based on F0-dependent Multivariate Normal Distribution. Proceedings of 2003 International Conference on Muotimedia and Expo (ICME 2003), IEEE, Vol.III, pp.405-409, Baltimore, MD, Jul. 2003.
  44. Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Musical Instrument Identification based on F0-dependent Multivariate Normal Distribution. Proceedings of 2003 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2003), Vol.5, pp.421--424, IEEE, Hong Kong, Apr. 2003. pdf

    口頭発表(研究会・全国大会)

  45. 駒谷 和範, 翠 輝久, 河原 達也, 奥乃 博: 大規模知識ベースの検索を行う音声対話システムの確認戦略の評価. 言語処理学会第10回年次大会, 87-90, Mar. 2004.
  46. 北原 鉄朗, 後藤 真孝, 奥乃 博: 未知楽器のカテゴリーレベルの音源同定, 情報処理学会第66回全国大会, 3ZA-3, Mar. 2004. 学生奨励賞
  47. 櫻庭 洋平, 尾形 哲也, 奥乃 博: 自動採譜における音色と定位と音楽知識を統合したパート形成, 情報処理学会第66回全国大会, 3ZA-2, Mar. 2004.
  48. 吉井 和佳, 後藤 真孝, 奥乃 博: 音楽音響信号を対象としたドラムスの音源同定におけるテンプレート適応手法, 情報処理学会第66回全国大会, 3ZA-5, Mar. 2004.
  49. 吉岡 拓也, 吉井 和佳, 北原 鉄朗, 櫻庭 洋平, 尾形 哲也, 奥乃 博: 音楽音響信号を対象とした和音変化時刻と和音名の同時認識, 情報処理学会第66回全国大会, 3ZA-4, Mar. 2004.
  50. 小鷹 研理, 尾形 哲也, 奥乃 博: 反射音が自己運動感覚に与える影響の考察, 情報処理学会第66回全国大会, 3P-8, Mar. 2004.
  51. 石原 一志, 服部 佑哉, 中谷 智広, 尾形 哲也, 奥乃 博: 環境音の擬音語変換における音素決定曖昧性の解消, 情報処理学会第66回全国大会, 3Y-5, Mar. 2004. 学生奨励賞
  52. 服部 佑哉, 石原 一志, 尾形 哲也, 奥乃 博: 連続環境音の繰り返し構造の認識, 情報処理学会第66回全国大会, 3Y-2, Mar. 2004.
  53. 山本 俊一, 中臺 一博, 辻野 広司, 駒谷 和範, 尾形 哲也, 奥乃 博: ミッシングフィーチャ理論による三話者同時発話認識の向上, 情報処理学会第66回全国大会, 3Y-6, Mar. 2004.
  54. 戸田 充彦, 中臺 一博, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチモーダル情報統合によるヒューマノイドロボットの挙動選択, 情報処理学会第66回全国大会, 1X-5, Mar. 2004. 学生奨励賞
  55. 山口 健, 駒谷 和範, 尾形 哲也, 奥乃 博: 唇情報を利用した混合音声の分離, 情報処理学会第66回全国大会, 1X-7, Mar. 2004.
  56. 田崎 豪, 山口 健, 戸田 充彦, 駒谷 和範, 尾形 哲也, 奥乃 博: マルチモーダル情報による相槌の認識とロボット対話への応用, 情報処理学会第66回全国大会, 1X-6, Mar. 2004.
  57. 松本 祥平, 山口 健, 駒谷 和範, 尾形 哲也, 奥乃 博: ロボットの挙動選択のための顔情報と音声情報を統合した感情判別, 情報処理学会第66回全国大会, 1X-8, Mar. 2004.
  58. 神田 直之, 駒谷 和範, 尾形 哲也, 奥乃 博: 音声対話システムにおける話題の構造を用いた効率的な対話管理, 情報処理学会第66回全国大会, 4T-5, Mar. 2004. 学生奨励賞
  59. 石田 克久, 北原 鉄朗, 武田 正之: ism: 即興演奏の不自然な旋律を補正する演奏支援システム, Proceedings of the 11th Workshop on Interactive Systems and Software (WISS 2003), pp.19-24, Dec. 2003.
  60. 秋葉泰弘,隅田英一郎,中岩浩巳,山本誠一 奥乃 博: 試験文数自動削減手法 --- 学習者の翻訳能力評価に向けて, 思考と言語研究会, 2003-TL- , 電子情報通信学会, Dec. 2003.
  61. 吉井 和佳, 後藤 真孝, 奥乃 博: テンプレート適応を利用した実世界の音楽音響信号に対するドラムスの 音源同定. 音楽情報処理研究会, 2003-MUS-53 情処研報, Vol.2003, No.127, pp.55-60, 情報処理学会, Dec. 2003.
  62. 中臺 一博, 奥乃 博, 辻野広司: ロボットを対象とした散乱理論による三話者同時発話の定位・分離・認識の向上. 第18回 AI チャレンジ研究会, SIG-Challenge-0318-6, pp.33--38, 人工知能学会, Nov. 2003.
  63. 石田 克久, 北原 鉄朗, 武田 正之: ism: 即興演奏支援のためのリアルタイム旋律補正システム. 音楽情報処理研究会, 2003-MUS-52-2, Vol.2003, No.111, pp.9-15, 情報処理学会, Nov. 2003.
  64. 中臺 一博, 松浦大輔, 奥乃 博, 辻野広司: 階層的な視聴覚統合と散乱理論を利用したロボットによる三話者同時発話認識の向上. 日本ロボット学会大会, 2K14, Sep. 2003.
  65. 戸田 充彦, 中臺 一博, 宮下 敬宏, 奥乃 博: ヒューマノイドロボットにおける挙動選択の設計と実装. 日本ロボット学会大会, 3F23, Sep. 2003.
  66. 石原 一志, 坪田 康, 奥乃 博: 聴者依存性に着目した環境音の擬音語へのシンボルグランディング 日本ソフトウェア科学会第20回大会, Sep. 2003.
  67. 駒谷 和範, 翠 輝久, 河原 達也, 奥乃 博: ソフトウェアサポートタスクにおける効率的な確認を行うための対話戦略, FIT (情報科学技術フォーラム), LF-2, pp.95--96, 情報処理学会, 電子情報通信学会, Sep. 2003.
  68. 後藤 真孝, 平田 圭司, 片寄 晴弘, 平井 重行,浜中 雅俊, 武田 春登, 北原 鉄朗: パネルディスカッション「音楽情報処理研究者{に,が}望むこと」, 音楽情報科学研究会, 2003-MUS-51, Vol.2003, No.82, pp.25-28, 情報処理学会, Aug. 2003.
  69. 櫻庭 洋平, 奥乃 博: 自動採譜におけるパート形成処理のための特徴量の検討. 音楽情報科学研究会, 2003-MUS-51, Vol.2003, No.82, pp.35-42, 情報処理学会, Aug. 2003.
  70. 吉井 和佳, 北原 鉄朗, 櫻庭 洋平, 奥乃 博: 自己組織化マップによる教師なしクラスタリングを利用したドラム演奏の自動採譜. 音楽情報科学研究会, 2003-MUS-51, Vol.2003, No.82, pp.43-50, 情報処理学会, Aug. 2003.
  71. 北原 鉄朗, 後藤 真孝, 奥乃 博: 音響的類似性に基づく楽器の階層表現の獲得とそれに基づくカテゴリー レベルの楽器音認識の検討. 音楽情報科学研究会, 2003-MUS-51-9, Vol.2003, No.82, pp.51-58, 情報処理学会, Aug. 2003.
  72. 駒谷和範, 上野晋一, 河原達也, 奥乃 博: ユーザモデルを導入したバス運行情報案内システムの実験的評価. 音声言語処理研究会, 情報処理学会研究会資料, 2003-SLP-47 (12), Vol.2003, No.75, pp.59-64, Jul. 2003. 山下記念研究賞
  73. 翠 輝久, 駒谷和範, 河原達也, 奥乃 博, 木戸 冬子: 音声対話によるソフトウェアサポートタスクのための確認戦略. 音声言語処理研究会, 情報処理学会研究会資料, 2003-SLP-47 (11), Vol.2003, No.75, 53-58, Jul. 2003.
  74. 上野晋一, 駒谷和範, 河原達也, 奥乃 博: 京都市バス運行情報案内システムの試験評価とユーザモデルの導入, 人工知能学会第16回全国大会, Jun. 2003. 優秀論文賞
  75. 石原 一志, 坪田 康, 奥乃 博: 日本語の擬音語表現に着目した環境音自動認識, 音声研究会, Jun. 2003.
  76. 北出 祐, 南條 浩輝, 河原 達也, 奥乃 博: 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出. 音声言語情報処理研究会, 2003-NL-155 (13), 2003-SLP-46 (2) Vol.2003, No.58, pp.7-12, 情報処理学会, May 2003.
  77. 山本 俊一, 和田 俊和, 奥乃 博: 色競合における適応的事例収集法, 2003-CVIM, pp.1--6, Vol.2003, No.41, 情報処理学会, May 2003. 電子図書館
  78. 山口 健, 波部 斉, 松山 隆司: ドーム型ディスプレイによる全方位ビデオのインタラクティブ表示, 2003-CVIM, 情報処理学会, May 2003.
  79. 吉田 尚史, 中谷 智広, 奥乃 博, 三好 正人: 調波構造と音源方向に基づく音源分離法における残響耐性の改善, 音声研究会, 応用音響研究会, Apr. 2003.

    特許

  80. ロボット視聴覚システム, 特開2003-251583号, 発明者:中臺一博, 奥乃 博, 北野宏明, 公開日 2003年9月9日. 特願2002-56670号, 出願日 2002年3月1日.

2003年度 o 2002年度(奥乃研究室)o 2001年度

    学位論文

  1. 天野 眞家: Studies on Natural Language Processing for Kana-to-Kanji Conversion and Machine Translation (仮名漢字変換及び機械翻訳のための自然言語処理の研究), 博士論文, Feb. 2003.
  2. 駒谷 和範: Spoken Dialogue Systems for Information Retrieval with Domain-Independent Dialogue Strategies (ドメイン非依存な対話戦略を備えた情報検索音声対話システム), 博士論文, Oct. 2002.

  3. 伊藤 亮介: 音声対話における感情の自動判別と会話ロボットへの実装, 修士論文, Feb. 2003.
  4. 住吉 貴志: 情報検索HTMLフォームへの音声入力機能を有するWebブラウジングシステム, 修士論文, Feb. 2003.
  5. 長谷川 将宏: 討論・講演音声に対するMPEG-7タグの設計と自動付与, 修士論文, Feb. 2003.
  6. 吉田 尚史: 調波構造と音源方向に基づく音源分離システムにおける残響耐性の改善, 修士論文, Feb. 2003.
  7. Ian R. Lane: Language Model Switching Based on Topic Detection for Multi-Domain Dialog Speech Recognition (話題同定に基づく言語モデル切替えによる複数ドメインの対話音声認識), 修士論文, Feb. 2003.
  8. 秋田 祐也: 討論音声を対象とした教師なし話者インデキシングとそれに基づいた自動書き起こし, 修士論文, Aug. 2002.

  9. 石原 一志: 日本語のモーラ構造に着目した環境音の擬音語への自動変換, 卒業特別研究報告, Feb. 2003.
  10. 北出 祐: 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出, 卒業特別研究報告, Feb. 2003.
  11. 翠 輝久: 音声言語による大規模知識ベース検索システムのための対話戦略, 卒業特別研究報告, Feb. 2003.
  12. 山本 俊一: 実時間人物追跡のための情報統合に基づく肌色の動的学習, 卒業特別研究報告, Feb. 2003.
  13. 吉井 和佳: 教師なしクラスタリングと認識誤り補正による打楽器演奏の音源同定, 卒業特別研究報告, Feb. 2003.

    査読つきジャーナル論文

  14. Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid Robot. Applied Intelligence, Kluwer Publisher, accepted for publication, International Society for Applied Intelligence, 2003. doi:10.1007/3-540-45324-5_19 IF: 1.853
  15. Hiroshi G. Okuno, Kazuhiro Nakadai, Ken'ichi Hidai, Hiroshi Mizoguchi, Hiroaki Kitano: Human-Robot Non-Verbal Interaction Empowered by Real-Time Auditory and Visual Multiple-Talker Tracking Advanced Robotics, Vol.17, Issue 2, pp.115-130, VSP and Robotics Society of Japan, 2003. doi:10.1163/156855303321165088 Online version, pdf IF: 0.510
  16. 中臺 一博, 奥乃 博, 北野 宏明: ヒューマノイドロボットを対象としたアクティブオーディション. 人工知能学会誌, Vol.18, No.2 F, pp.103-110 (Mar. 2003). オンライン論文誌 doi:10.1527/tjsai.18.104
  17. 駒谷 和範, 河原 達也: 音声認識結果の信頼度を用いた効率的な確認・誘導を行う対話管理, 情報処理学会論文誌, Vol.43, No.10, pp.3078--3086, 2002. in html
  18. 伊藤 亮介, 駒谷 和範, 河原 達也: 機器操作マニュアルの知識と構造を利用した音声対話ヘルプシステム, 情報処理学会論文誌, Vol.43, No.7, pp.2147--2154, 2002. in html
  19. 長谷川 将宏, 秋田 祐哉, 河原 達也: 談話標識の抽出に基づいた講演音声の自動インデキシング, 情報処理学会論文誌, Vol.43, No.7, pp.2222-2229, 2002. in html
  20. Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time Auditory and Visual Multiple-Speaker Tracking For Human-Robot Interaction. Journal of Robotics and Mechatronics, special issue on Human Robot Interaction, Vol.14, No.5 (2002) 479-489, Mechatronics Society of Japan.
  21. 梅澤 健太郎, 齊藤 孝道, 奥乃 博: 権限証明書とSSL相互認証による匿名アクセス制御方式. 情報処理学会論文誌, Vol.43, No.8 (Aug. 2002) 1553-1562. pdf DL

    編著・章分担

  22. Yuasa, T. and Okuno, H.G. (Eds.): Advanced Lisp Technology, Advanced Information Processing Technology, Vol.4, Taylor and Francis Publishers, London, UK, May, 2002.
  23. 日本認知科学会編: 『認知科学辞典』, 推論・問題解決, コミュニケーションとネットワーク, CHインターフェース. 共立出版, 2002.
  24. Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Realizing Audio-Visually triggered ELIZA-like non-verbal Behaviors. In Ishizuka, M. and Slaney, J. (eds) PRICAI-2002 Topics in Artificial Intelligence, LNAI 2417, 552--562, Springer-Verlag, Tokyo, Aug. 2002. pdf doi:10.1007/3-540-45683-X_59
  25. Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Social Interaction of Humanoid Robot through Auditory and Visual Tracking. In Hendtlass, T., and Ali, M. (Eds.) Developments in Applied Artificial Intelligence (IEA/AIE-2002), Cairns, Australia, June 2002, LNAI 2358, pp.725-735, Springer-Verlag. pdf doi:10.1007/3-540-48035-8_70

    査読つき国際会議論文

  26. Takamichi Saito, Toshiyuki Kitoh, Kentaro Umesawa, Hiroshi G. Okuno: Privacy-Enhanced SPKI Access Control on PKIX and Its Application to Web Server. Proc. of the Seventeenth International Conference on Advanced Information Networking and Applications (AINA 2003), 696--703, IEEE, Xi'an, China. Paper. doi:10.1109/AINA.2003.1192970
  27. Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Auditory Fovea Based Speech Separation and Its Application to Dialog System. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2002), 1320-1325, IEEE, Geneva, Oct. 2002. doi:10.1109/IRDS.2002.1043937
  28. Yoko Yamakata, Tatsuya Kawahara, Hiroshi G. Okuno: BELIEF NETWORK BASED DISAMBIGUATION OF OBJECT REFERENCE IN SPOKEN DIALOGUE SYSTEM FOR ROBOT. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 170-176, ASA, ASJ, and ESCA, Denver, Sep. 2002.
  29. Yasushi Tsubota, Tatsuya Kawahara, Hiroshi G. Okuno, Masatake Dantsuji: RECOGNITION AND VERIFICATION OF ENGLISH BY JAPANESE STUDENTS FOR COMPUTER-ASSISTED LANGUAGE LEARNING SYSTEM. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 1205-1208, ASA, ASJ, and ESCA, Denver, Sep. 2002.
  30. Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: AUDITORY FOVEA BASED SPEECH ENCHANCEMENT AND ITS APPLICATION TO HUMAN-ROBOT DIALOG SYSTEM. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 1817-1820, ASA, ASJ, and ESCA, Denver, Sep. 2002.
  31. Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: REAL-TIME SOUND SOURCE LOCALIZATION AND SEPARATION FOR ROBOT AUDITION. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 193-196, ASA, ASJ, and ESCA, Denver, Sep. 2002.
  32. Taro Watanabe, Eiichiro Sumita: Statistical Machine Translation Decoder Base On Phrase. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 1889-1892, Spec3Co2, ASA, ASJ, and ESCA, Denver, Sep. 2002.
  33. Kazunori Komatani, Tatsuya Kawahara, Ryosuke Ito, Hiroshi G. Okuno: Efficient Dialogue Strategy to Find Users' Intended Items from Information Query Results, Proceedings of the Nineteenth International Conference on Computational Linguistics (Coling-2002), Vol.1, pp.481-487, Aug. 2002.
  34. Taro Watanabe, Eiichiro Sumita: Bidirectional Decoding for Statistical Machine Translation. Proceedings of the Nineteenth International Conference on Computational Linguistics (Coling-2002), pp.1079- Aug. 2002.
  35. Yasuhiro Akiba, Taro Watanabe, Eiichiro Sumita: Using Language and Translation Models to Select the Best among Outputs from Multiple MT Systems, Proceedings of the Nineteenth International Conference on Computational Linguistics (Coling-2002), pp. Aug. 2002.
  36. Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Exploiting Auditory Fovea in Humanoid-Human Interaction. Proceedings of Eighteenth National Conference on Artificial Intelligence (AAAI-2002), 431-438, AAAI, Edmonton, Aug. 2002. pdf AAAI Contents
  37. Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Non-Verbal Eliza-like Human Behaviors in Human-Robot Interaction through Real-Time Auditory and Visual Multiple-Talker Tracking. Proceedings of the Third International Workshop on Cognitive Robotics (CogRob-2002), AAAI, Edmonton, Jul. 2002. pdf
  38. Yoko Yamakata, Tatsuya Kawahara, Hiroshi G. Okuno: Belief Network based Disambiguation of Word Reference in Spoken Dialogue System for Robot. Proceedings of ISCA Tutorial and Research Workshop on Multi-Modal Dialogue in Mobile Environments, Germany, Jun. 2002.
  39. Kazuhiro Nakadai, Ken'ichi Hidai, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time speaker localization and speech separation by Audio-Visual Integration, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2002), pp.1043-1049, IEEE, May 2002. pdf doi:10.1109/ROBOT.2002.1013493

    口頭発表(研究会・全国大会)

  40. 奥乃 博: 情報家電における混合音認識の重要性: 聖徳太子コンピュータ. 情報処理学会第65回全国大会, 特別講演, Mar. 2003.
  41. 北原 鉄朗, 後藤 真孝, 奥乃 博: 音響的類似性に基づく楽器音の階層的クラスタリング, 情報処理学会第65回全国大会, 1P-1, Mar. 2003. 学生奨励賞
  42. 櫻庭 洋平, 奥乃 博: 音色類似度と定位類似度の統合による自動採譜, 情報処理学会第65回全国大会, 1P-2, Mar. 2003. 大会優秀賞
  43. 吉井 和佳, 北原 鉄朗, 櫻庭 洋平, 奥乃 博: 教師なしクラスタリングと認識誤りパターンを利用した打楽器音の音源同定, 情報処理学会第65回全国大会, 1P-3, Mar. 2003.
  44. 石原 一志, 坪田 康, 奥乃 博: 日本語の擬音語表現に着目した環境音自動認識, 情報処理学会第65回全国大会, 4X-5, Mar. 2003. 学生奨励賞
  45. 山本 俊一, 戸田 充彦, 和田 俊和, 奥乃 博: 実時間人物発見のための視覚と聴覚を統合した肌色の動的学習, 情報処理学会第65回全国大会, 4R-2, Mar. 2003.
  46. 戸田 充彦, 山本 俊一, 中臺 一博, 奥乃 博: 人間に似た外見を持つロボット Replie における挙動選択システム. 情報処理学会第65回全国大会, 6ZA-1, Mar. 2003.
  47. 石田 克久, 北原 鉄朗, 柳川 貴央, 武田 正之: 統計的アプローチに基づく即興演奏補正. 情報処理学会第65回全国大会,2P-3, Mar. 2003.
  48. 駒谷和範, 上野晋一, 河原達也, 奥乃 博: バス運行情報案内システムにおける適応的な対話管理を行うユーザモデルの評価 言語処理学会第9回年次大会講演論文集, pp.59-62, 2003.
  49. 南條 浩輝, 河原 達也: 講演音声認識のための話題・話者・発音変動に適応した言語モデル, 日本音響学会研究発表会講演論文集, 3-4-2, 春季 2003.
  50. 秋田 祐哉, 河原 達也: 討論音声認識のための言語モデルと音響モデルの適応の検討, 日本音響学会研究発表会講演論文集, 春季 2003.
  51. 長谷川将宏, 河原 達也, 奥乃 博: 談話標識の抽出に基づいた討論音声へのMPEG-7タグの自動付与. 人工知能学会研究会資料, SIG-SLUD-A203-03, pp.15--20, 人工知能学会, Mar. 2003.
  52. 伊藤 亮介, 駒谷 和範, 河原 達也, 奥乃 博: ロボットとの音声対話におけるユーザの心的状況の分析. 音声言語情報処理研究会, SLP-45-18, Vol.2003, No.14, pp.107-112, 情報処理学会, Feb. 2003.
  53. 住吉 貴志, 河原 達也, 奥乃 博: HTMLのフォーム入力のための文法の自動生成と SALT による実装. 音声言語情報処理研究会, SLP-45-21, Vol.2003, No.14, pp.125-130, 情報処理学会, Feb. 2003.
  54. a鈴木紀章, 中臺 一博, 天野英晴, 奥乃 博, 北野 宏明: 方向通過型音源分離フィルタへのFPGAの応用. 信学技法 VLD/CPSY-25, Vol.102, No.609, pp.79-84, 電気情報通信学会, システムLSI設計技術研究会, Vol.2003, No.7, pp.135-140, Jan. 2003, 情報処理学会.
  55. 中臺 一博, 奥乃 博, 北野 宏明: アクティブオーディションに基づくヒューマン・ロボットインタラクション. 第3回システムインテグレーション部門 講演会 (SI2002), 3P32-03, 計測自動制御学会, Dec. 2002. SI2002ベストセッション講演賞.
  56. 上野晋一, 駒谷和範, 河原達也, 奥乃 博: バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成 音声言語処理研究会, 情報処理学会研究会資料, SLP-42-2, pp.5-10, 2002.
  57. 西田 昌史, 秋田 祐哉, 河原 達也: 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし, 電子情報通信学会技術研究報告, SP2002-157, pp.55-60, Dec. 2002.
  58. 中臺 一博, 奥乃 博, 北野 宏明: アクティブオーディションによる複数音源の定位・分離・認識. 第16回 AI チャレンジ研究会, SIG-Challenge-0216-5, pp.25-32, 人工知能学会, Nov. 2002.
  59. 中臺 一博, 松浦 大輔, 奥乃 博, 北野 宏明: 聴覚中心窩を利用した方向通過型フィルタによる音源・分離, 日本ロボット学会全国大会, 1H18, Oct. 2002.
  60. 中臺一博, 松浦 大輔, 宮下 敬宏, 奥乃 博, 北野 宏明: ロボット聴覚実現に向けて --- ヒューマノイドロボット SIG2 の開発 ---, 日本ロボット学会全国大会, 1H19, Oct. 2002.
  61. 松浦 大輔, 中臺 一博, 奥乃 博, 北野 宏明: サポートベクターマシンを用いた話者トラッキング注意制御. 日本ロボット学会全国大会, 1H33, Oct. 2002.
  62. 北原 鉄朗, 後藤 真孝, 奥乃 博: 音高の音色変化に着目した音源同定手法. 音響学会秋季研究発表会講演論文集, 1-1-4, pp.643-644, Sep. 2002.
  63. 南條 浩輝, 河原 達也: 講演音声認識における言語モデル適応の検討, 日本音響学会研究発表会講演論文集, 3-Q-16, 秋季 2002.
  64. 秋田 祐哉, 河原 達也: 多数話者との類似度に基づく討論音声の教師なし話者インデキシング 日本音響学会研究発表会講演論文集, 3-5-10, 秋季 2002.
  65. 山肩 洋子, 河原 達也, 奥乃 博, 美濃 導彦: 音声対話におけるオブジェクト同定のための曖昧性の解消. FIT (情報科学技術フォーラム), K-29, 425--426, 情報処理学会, Sep. 2002.
  66. 駒谷 和範, 上野 晋一, 河原 達也, 奥乃 博: バス運航情報案内システムにおけるユーザモデルを用いた適応的応答の生成. FIT (情報科学技術フォーラム), LF-2, pp.95--96, 情報処理学会, 電子情報通信学会, Sep. 2002. FIT2002ヤングリサーチャー賞
  67. 秋田 祐哉, 河原 達也, 奥乃 博: 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング. 音声言語情報処理, 42-9, Vol.2002, No.65, pp.53-58, 情報処理学会, Jul. 2002.
  68. 上野 晋一, 駒谷 和範, 河原 達也, 奥乃 博: バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成. 音声言語情報処理, 42-2, 情報処理学会, Jul. 2002.
  69. 北原 鉄朗, 後藤 真孝, 奥乃 博: 楽器音を対象とした音源同定:音高による音色変化を考慮する識別手法の検討. 音楽情報科学研究会, SIG-MUS-46-1, 情処研報, Vol.2002, No.63, pp.1--8, 情報処理学会, Jul. 2002.
  70. 櫻庭 洋平, 河原 達也, 奥乃 博: 定位情報と音色情報を用いた複数楽器音の認識, 音楽情報科学研究会, SIG-MUS-46-2, 情処研報, Vol.2002, No.63, pp.9--16, 情報処理学会, Jul. 2002.
  71. 山肩 洋子, 河原 達也, 奥乃 博: 視覚情報を話題の対象とする音声対話システム. 人工知能学会研究会資料, SIG-SLUD-A201-03, pp.15--20, 人工知能学会, Jun. 2002. 人工知能学会, 研究会優秀賞
  72. 下岡 和也, 河原 達也, 奥乃 博: 講演の書き起こしに対する統計的手法を用いた文体の整形. 自然言語処理 149-12, 音声言語情報処理 41-3, Vol.2002, No.44, pp.17--24, 情報処理学会, May 2002.
  73. 南條 浩輝, 河原 達也: 講演音声認識のための種々の形態素解析及び音響モデルの評価, 話し言葉の科学と工学ワークショップ, pp.47--52, 2002.
  74. 南條 浩輝, 河原 達也, 山田 篤, 内元 清貴: 講演音声認識のための言語モデルの教師なし適応, 電子情報通信学会技術研究報告,SP2002-152,NLC2002-75,2002. (情報処理学会研究報告 SLP-44-32,2002. )

    特許

  75. 鳴き声による音声ガイドシステム, 特開2002-304191号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 公開日 2002年9月18日. 特願2001-67846号, 出願日 2001年3月9日.
  76. ロボット視聴覚システム, 特開2002-264058号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 公開日 2002年9月18日. 特願2001-67846号, 出願日 2001年3月9日.
  77. ロボット視聴覚システム, 特開2002-264053号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 公開日 2002年9月18日. 特願2001-67849号, 出願日 2001年3月9日.
  78. ロボット視聴覚システム, 特開2002-264052号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 公開日 2002年9月18日. 特願2001-67848号, 出願日 2001年3月9日.
  79. ロボット視聴覚システム, 特開2002-264051号, 発明者:中臺一博, 日台健一, 奥乃 博, 北野宏明, 公開日 2002年9月18日. 特願2001-67847号, 出願日 2001年3月9日.

2002年度 o 2001年度(奥乃研究室)o 2000年度

学位論文 | ジャーナル論文 | 章分担・解説 | 国際会議論文 | 口頭発表 | 特許

    学位論文

  1. 安達 史博: VoiceXMLの動的生成に基づく自然言語による電話音声対話システム, 修士論文, Feb. 2002.
  2. 山肩 洋子: ロボットとの音声対話のための信念ネットワークを用いた適応的言語理解, 修士論文, Feb. 2002.
  3. Raux Antoine Roland: Intelligibility Assessment and Adaptive Drill Generation for a Computer-Assisted Pronunciation Learning System (発音学 習支援システムのための了解度の評価と適応的なドリル生成), 修士論文, Feb. 2002.

  4. 上野 晋一: 音声対話システムにおけるユーザモデルを用いた適応的応答の生成, 卒業特別研究報告, Feb. 2002.
  5. 櫻庭 洋平: 定位情報と音色情報を用いた複数楽器音の認識, 卒業特別研究報告, Feb. 2002.
  6. 下岡 和也: 講演の書き起こしに対する統計的手法を用いた文体の整形, 卒業特別研究報告, Feb. 2002.
  7. 横尾 昌弘: 環境音の特徴量抽出と決定木学習による階層的分類, 卒業特別研究報告, Feb. 2002.

    査読つきジャーナル論文

  8. Hiroshi G. Okuno, Kazuhiro Nakadai, Lourens, T., Hiroaki Kitano: Sound and Visual Tracking by Active Audition. in Jin, Q., Li, J., Zhang, N., Cheng, J., Yu, C., and Noguchi, N (eds) Enabling Society with Information Technology pp.174-185, Springer-Verlag, 2002.
  9. 齊藤 孝道, 梅澤 健太郎, 奥乃 博: プライバシーを重視するアクセス制御システムの一方式. 電子情報通信学会論文誌, Vol.J84-D1, No.11 (Nov. 2001) pp.1553-1562, 電子情報通信学会. pdf
  10. 梅澤 健太郎, 齊藤 孝道, 奥乃 博: プライバシーを重視したアクセス制御機構の提案. 情報処理学会論文誌, Vol.42, No.8 (Aug. 2001) pp.2067-2076. pdf DL 電気通信普及財団テレコム技術学生賞
  11. Tatsuya Kawahara, Akinobu Lee, Tetsunori Kobayashi, Koichi Takeda, N. Minematsu, Shigeki Sagayama, Katsuya Itou, A. Ito, M. Yamamoto, A. Yamada, T.Utsuto, Kiyohiro Shikano: Japanese Dictation ToolKit -- 1999 version --, Journal of Acoustic Society of Japan, Vol.57, No.3, pp.210--214, 2001
  12. M. Mimura and Tatsuya Kawahara: Difference of acoustic modeling for read speech and dialogue speech, Acoustical Science & Technology, Vol.22, No.5, pp.373--374, 2001.

    章分担・解説論文・翻訳

  13. 奥乃 博, 中臺 一博: ロボットの耳は二つで十分か. 日本音響学会誌, Vol.58, No.3 (Mar. 2002) pp.205-210.
  14. 北野 宏明監訳: 奥乃 博, 諸橋 峰雄, 京田 耕司, 中臺 一博 訳: 『PCクラスタ構築法 − Linux クラスタベオウルフ』, 産業図書, 2001.
  15. Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid Robot, Engineering of Intelligent Systems: 14th International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems, IEA/AIE-2001, Proceedings,