音声メディア研究室発表論文

[ 2015年度| 2014年度| 2013年度| 2012年度| 2011年度| 2010年度| 2009年度| 2008年度| 2007年度| 2006年度| 2005年度| 2004年度| 2003年度| 2002年度| 2001年度| (2000年度以前)| 受賞| English ]

DBLP: 吉井, 糸山, 坂東, 井山, 丸尾, 土橋, 大喜多, 関口, 板倉, 福田,
Youssef, 西出, 金, 前澤, 古川, 池宮, 西牟田, 奥乃, 杉山, 大塚, Lim, 神田, 平山, 望月, 山口, 矢澤, 黄, Cahier, 田崎, 水本, 中村, 糸原, 阪上, 柳楽, 信田, 尾形, 高橋, 平澤, 西川, 山川, 武田, 日下, 安良岡, 松山, 粟野, 駒谷, 吉岡, 藤原, 勝丸, 白松, 安部, 池田, 神田, 久保田, 福林, 須見, 金, 山本, 横矢, 内藤, 北原, 丹羽, 吉田, 松本, Valin, 秋葉, 大庭, 石原, 小鷹, 渡辺, 戸田, 河原翠, Lane, 秋田, 山肩, Raux, 伊藤,
Google Scnholar, Microsoft Academic Search, odysa, Most Prolific DBLP Authors

２０１５年度（音声メディア研究室） 2014年度

ジャーナル論文

Shotaro Sano, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: HMM-based Attacks on Google's ReCAPTCHA with Continuous Visual and Audio Symbols, Journal of Information Processing, accepted, 12 Aug. 2016.
Izaya Nishimuta, Kazuyoshi Yoshii, Katsutoshi Itoyama, Hiroshi G. Okuno: Toward a Quizmaster Robot for Speech-based Multiparty Interaction. Advanced Robotics, accepted, Jul. 23, 2015.
古川孝太郎, 糸山克寿, 吉井和佳, 奥乃博: Scheme による3D図形の構成的制作, コンピュータソフトウエア, 採録決定, 平成26年3月，日本ソフトウエア科学会. 岩波書店.
Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata: Preferential Training of Neuro-Dynamical Model Based on Predictability of Target Dynamics, Advanced Robotics, Vol.29, No.9 (2015) 587-596, 27. May 2015. Taylor & Francis, doi: 10.1080/01691864.2015.1031279
Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Fabien Gouyon, Luis Paulo Reis: Beat Tracking for Interactive Dancing Robots, International Journal of Humanoid Robotics, in print, Vol.12 (2015) 1550023 (24 pages), World Scientific Publishing Company. Online ready, 22 May 2015, doi 10.1142/S0219843615500231
Akira Maezawa, Hiroshi G. Okuno: Bayesian Audio-to-Score Alignment Based on Joint Inference of Timbre, Volume, Tempo, and Performer-Dependent Note Onset Timings. Computer Music Journal, Vol.39, No.1 (Spring 2015) 74-87, accepted on Jan. 23, 2014, posted online March 24, 2015. MIT Press. IF: 0.410 doi:10.1162/COMJ_A_00286

国際会議論文

Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno Human-Voice Enhancement based on Online RPCA for a Hose-shaped Rescue Robot with a Microphone Array Proceedings of the 13th International Symposium on Safety, Security, and Rescue Robotics (SSRR-2015) , pp.1-6, IEEE-RAS, West Lafayette, Indiana, U.S., Oct. 18-20, 2015 Most Innovative Paper Award, People's Choice Demo Award
Kazuyoshi Yoshii, Katsutoshi Itoyama, Masataka Goto: Infinite Superimposed Discrete All-pole Modeling for Source-Filter Decomposition of Wavelet Spectrograms, Proceedings of the 16th International Society for Music Information Retrieval Conference (ISMIR-2015), accepted, October 2015.
Karim Youssef, Katsutoshi Itoyama, Kazuyoshi Yoshii: Identification and Localization of One or Two Concurrent Speakers in a Binaural Robotic Context, Proceedigns of IEEE International Conference on Systems, Man, and Cybernetics (SMC-2015), accepted, October 2015.
Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno: Microphone-Accelerometer Based 3D Posture Estimation for a Hose-shaped Rescue Robot, Proceedings of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2015), accepted, (acceptance rate 46%), Sep. 28- Oct. 3, 2015, Hamburg.
Misato Ohkita, Yoshiaki Bando, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Audio-Visual Beat Tracking Based on a State-Space Model for a Dancing Robot Playing with Humans, Proceedings of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2015), accepted, (acceptance rate 46%), Sep. 28- Oct. 3, 2015, Hamburg.
Kouhei Sekiguchi, Yoshiaki Bando, Katsutoshi Itoyama, Kazuyoshi Yoshii: Optimizing the Layout of Multiple Mobile Robots for Cooperative Sound Source Separation, Proceedings of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2015), accepted, (acceptance rate 46%), Sep. 28- Oct. 3, 2015, Hamburg.
Kousuke Itakura Izaya Nishimuta, Yoshiaki Bando, Katsutoshi Itoyama, Kazuyoshi Yoshii: Bayesian Integration of Sound Source Separation and Speech Recognition:A New Approach to Simultaneous Speech Recognition, Proceedings of the 16th Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), accepted, Dresden, Germany, Sep. 6-10, 2015.
Akira Maezawa, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno: Unified Inter- and intra-recording duration model for multiple music audio alignment, Proceedings of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, (WASPAA 2014), accepted, (acceptance rate 73/151=48%), Mohonk Mountain House, New Paltz, NY, Oct 18-21, 2015.
Tatsunori Hirai, Yukara Ikemiya, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: Automatic Singing Voice to Music Video Generation via Mashup of Singing Video Clips, Proceedings of the 12th Sound and Music Computing Conference (SMC 2015), pp.153-159, Maynooth, Ireland, July 26 - Aug 1, 2015.
Ayaka Dobashi, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: A Music Performance Assistance System based on Vocal, Harmonic, and Percussive Source Separation and Content Visualization for Music Audio Signals, Proceedings of the 12th Sound and Music Computing Conference (SMC 2015), pp.99-104, Maynooth, Ireland, July 26 - Aug 1, 2015.
Tsubasa Fukuda, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: A Score-Informed Piano Tutoring System with Mistake Detection and Score Simplification, Proceedings of the 12th Sound and Music Computing Conference (SMC 2015), pp.105-110, Maynooth, Ireland, July 26 - Aug 1, 2015.
Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Singing Voice Analysis and Editing based on Mutually Dependent F0 Estimation and Source Separation, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), (acceptance rate 52%), pp.574-578, AASP-P8.2, Brisbane, Australia, April 19-24 (23), 2015.
Satoshi Maruo, Kazuyoshi Yoshii, Katsutoshi Itoyama, Matthias Mauch, Masata Goto: A FEEDBACK FRAMEWORK FOR IMPROVED CHORD RECOGNITION BASED ON NMF-BASED APPROXIMATE NOTE TRANSCRIPTION. Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp.196-200, AASP-P1.4, Brisbane, Australia, April 19-24 (21), 2015.
Yoshiaki Bando, Takuma Otsuka, Katsutoshi Itoyama, Kazuyoshi Yoshii, Yoko Sasaki, Satoshi Kagami, Hiroshi G. Okuno: CHALLENGES IN DEPLOYING A MICROPHONE ARRAY TO LOCALIZE AND SEPARATE SOUND SOURCES IN REAL AUDITORY SCENES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp.723-727, AASP-P10.11, Brisbane, Australia, April 19-24 (24), 2015.
Hiroshi G. Okuno, Kazuhiro Nakadai: ROBOT AUDITION: ITS RISE AND PERSPECTIVES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp.5610-5614, SS-L3.1, Brisbane, Australia, April 19-24 (22), 2015.

口頭発表（研究会・全国大会）

関口航平, 坂東宜昭, 糸山克寿, 吉井和佳, 複数移動ロボットを用いた音源分離における音源配置に応じたロボットの最適配置探索 日本ロボット学会第33回学術講演会, RSJ2015AC3D1-05, 東京電機大学, Sep. 3-5, 2015
坂東宜昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博, ロバスト主成分分析を用いた動作雑音抑圧に基づく柔軟索状ロボットのための音声強調 日本ロボット学会第33回学術講演会, RSJ2015AC2D2-05, 東京電機大学, Sep. 3-5, 2015
糸山克寿, 坂東宜昭, 粟野皓光, 合原一究, 吉井和佳: , 視聴覚統合NMFによるカエル合唱音声の分析, 情報処理学会第107回音楽情報科学研究会, May. 23, 2015, ベストプレゼンテーション賞
坂東宜昭, 金宜鉉, 糸山克寿, 吉井和佳, 中臺一博, 奥乃博, 両耳聴ロボット聴覚ソフトウェアHARK-Binauralの紹介とRaspberry Pi 2を用いたヒューマノイドロボットへの適用 情報処理学会第107回音楽情報科学研究会, 電気通信大学, May. 23 2015

2015年度  ２０１４年度（音声メディア研究室） 2013年度

学位論文

Akira Maezawa: Bayesian Music Alignment. 博士論文 (主査: 河原達也教授), Feb. 2015.
Yukara Ikemiya: Singing Voice Analysis and Editing for Recorded Music. 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
Yoshiaki Bando: Sound-based Posture Estimation for a Hose-shaped Rescue Robot. 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
Izaya Nishimuta: A Quizmaster Robot with Auditory Functions for Speech-based Multiparty 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
古川孝太郎: Scheme による 3D 図形の構成的制作. 修士論文 (指導教員: 吉井和佳講師), Feb. 2015.
板倉光佑: ベイズモデルに基づく音源分離の不確実性を考慮した同時発話音声認識卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
大喜多美里: ダンス共演ロボットのための状態空間モデルに基づく視聴覚統合ビートトラッキング卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
関口航平: 分散型マイクロホンアレイを用いた音源分離のための複数移動ロボットの配置最適化卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
福田翼: 弾き間違い検出と楽譜簡略化機能をもつピアノ演奏練習システム卒業特別研究報告 (指導教員: 吉井和佳講師), Feb. 2014.
ジャーナル論文
Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata: Preferential Training of Neuro-Dynamical Model Based on Predictability of Target Dynamics, Advanced Robotics, accepted, March. 2015.
古川孝太郎, 糸山克寿, 吉井和佳, 奥乃博: Scheme による3D図形の構成的制作, コンピュータソフトウエア, 採録決定, 平成26年3月，日本ソフトウエア科学会. 岩波書店.
Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shunsuke Mori, Hiroshi G. Okuno: Automatic Speech Recognition for Mixed Dialect Utterances by Mixing Dialect Language Models, IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.23, No.2 (Feb. 2015) 373-382. IF: 2.625 doi:10.1109/TASLP.2014.2387414
Akira Maezawa, Hiroshi G. Okuno: Bayesian Audio-to-Score Alignment Based on Joint Inference of Timbre, Volume, Tempo, and Performer-Dependent Note Onset Timings. Computer Music Journal, Vol.39, No.1 (Spring 2015) 74-87, accepted on Jan. 23, 2014, posted online March 24, 2015. MIT Press. IF: 0.410 doi:10.1162/COMJ_A_00286
Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata: Audio-Visual Speech Recognition using Deep Learning. Applied Intelligence, Vol.42, Issue 1 (Jan. 2015) 63-74, Springer. doi:10.1007/s10489-014-0629-7
Yoshiaki Bando, Takuma Otsuka, Kazuhiro Nakadai, Satoshi Tadokoro, Masashi Konyo, Katsutoshi Itoyama, HIroshi G. Okuno: Posture Estimation of Hose-shaped Robot by using Active Microphoe Array, Advanced Robotics, Vol.29, Issue 1 (Jan. 2015) 35-49. IF: 0.562 doi: 10.1080/01691864.2014.981291 Taylor Francis
Ui-Hyun Kim, Kazuhiro Nakadai, Hiroshi G. Okuno: Improved Sound Source Localization in Horizontal Plane for Binaural Robot Audition, Applied Intelligence, Vol.42, Issue 1 (Jan. 2015) pp.63-74. doi:10.1007/s10489-014-0544-y IF: 1.853
Takuma Otsuka, Katsutoshi Ishiguro, Takuya Yoshioka, Hiroshi Sawada, Hiroshi G. Okuno: Multichannel Sound Source Dereverberation and Separation for Arbitrary Number of Sources based on Bayesian Nonparametrics IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.22, No.12 (Dec. 2014) 2218-2232. IF: 2.625 doi:10.1109/TASLP.2014.2363790
Akira Maezawa, Katsutoshi Itoyama, Hiroshi G. Okuno: Nonparametric Bayesian dereverberation ofpower spectrograms based on infinite-orderautoregressive processes and interpretation, IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.22, No.12 (Dec. 2014) 1918-1930. doi:10.1109/TASLP.2014.2355772 IF: 2.625
Matthew E.P. Davies, Philippe Hamel, Kazuyoshi Yoshii, Masataka Goto: AutoMashUpper: Automatic Creation of Multi-Song Music Mashups, IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.22, No.12 (Dec. 2014) 1726-1737, doi:10.1109/TASLP.2014.2347135 IF: 2.625
Angelica Lim, Hiroshi G. Okuno: A Recipe for Empathy: Integrating the mirror system, insula, somatosensory cortex and motherese. International Journal of Social Robotics, Vol.7, Issue 1 (Feb. 2015) 35-49. Springer. doi:10.1007/s12369-014-0262-y
平山直樹, 吉野幸一郎, 糸山克寿, 森信介, 奥乃博: 擬似生成した複数方言言語モデル混合による混合方言音声認識, 情報処理学会論文誌, Vol.55, No.7 (July 2014) pp.1681-1694, 情報処理学会. , DL
Angelica Lim, Hiroshi G. Okuno: The MEI Robot: Towards Using Motherese to Develop Multimodal Emotional Intelligence. IEEE Transactions on Autonomous Mental Development, Vol.6, Issue 2 (June 2014) pp.126-138, doi:10.1109/TAMD.2014.2317513 IF: 2.170
章分担・解説
奥乃博: 第2章総論聴覚デバイスの要求・制約事項. 『感覚デバイス開発-- 機器が担うヒト感覚の生成・拡張・代替技術』, pp.85-101, NPS，2014年11月刊．
奥乃博, 中臺一博: 第2章第1節混合音を聞きわける技術の開発. 『感覚デバイス開発-- 機器が担うヒト感覚の生成・拡張・代替技術』, pp.102-113, NPS，2014年11月刊．
奥乃博: サイロからの脱出京都大学工学広報, No.62，2014年10月．
奥乃博: 夏を迎えての雑感「情報学展望」, No.16, p.3,京都大学大学院情報学研究科，2014年5月．
Angelica Lim, Hiroshi G. Okuno: Developing Robot Emotions through Interaction with Caregives. Jordi Vallverdú (Ed.) Synthesizing Human Emotion in Intelligent Systems and Robotics, in print, Hershey, PA, IGI Global, 2014.
Yukara Ikemiya, Katsutoshi Itoyama, Hiroshi G. Okuno: Transferring Vocal Expression of F0 Contour using Singing Voice Synthesizer, Moonis Ali, et al (Eds.): Modern Advances in Applied Intelligence - the 27th International Conference on Industrial, Engineering and Other Applications of Applied Intelligence Systems, IEA/AIE-2014, Proceedings, Part II, Lecture Notes in Computer Science, Vol.8482, pp. 250-259. June 3-6, 2014, Kaohsiung, Taiwan. doi:10.1007/978-3-319-07467-2_27
奥乃博: 研究の水平展開, コンピュータソフトウエア, 巻頭言, Vol.31, No.2 (2014年5月）pp.1, 岩波書店．
国際会議論文
Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Singing Voice Analysis and Editing based on Mutually Dependent F0 Estimation and Source Separation, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
Satoshi Maruo, Kazuyoshi Yoshii, Katsutoshi Itoyama, Matthias Mauch, Masata Goto: Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
Yoshiaki Bando, Takuma Otsuka, Katsutoshi Itoyama, Kazuyoshi Yoshii, Yoko Sasaki, Satoshi Kagami, Hiroshi G. Okuno: CHALLENGES IN DEPLOYING A MICROPHONE ARRAY TO LOCALIZE AND SEPARATE SOUND SOURCES IN REAL AUDITORY SCENES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
Hiroshi G. Okuno, Kazuhiro Nakadai: ROBOT AUDITION: ITS RISE AND PERSPECTIVES, Proceedings of 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), accepted, Brisbane, Australia, April 19-24, 2015.
Yoshiaki Bando, Takuma Otsuka, Ikkyu Aihara, Hiromitsu Awano, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno: Recognition of In-field Frog CHorusing using Bayesian Nonparametric Microphone Array Processing. AAAI-2015 Workshop on Comutational Sustainability, accepted, Jan. 26, 2015, AAAI, Austin, TX.
Izaya Nishimuta, Kazuyoshi Yoshii, Katsutoshi Itoyama, Hiroshi G. Okuno: Development of a Robot Quizmaster with Auditory Functions for Speech-based Multiparty Interaction. Proceedings of 2014 IEEE/SICE International Symposium on System Integration (SII 2014), 328-333, Dec.12-13, Chuo Univ., Tokyo, Japan.
Izaya Nishimuta, Naoki Hirayama, Kazuyoshi Yoshii, Katsutoshi Itoyama, Hiroshi G. Okuno: A Robot Quizmaster that can Localize, Separate, and Recognize Simultaneous Utterances for a Fastest-Voice-First Quiz Game, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2014), accepted (acceptance rate 59% = 171/288), IEEE, Madrid, Nov.18 - 20, 2014.
Shun Nishide, Harumitsu Nobuta, Hiroshi G. Okuno, Tetsuya Ogata: Applying Intrinsic motivation for Visuomotor Learning of Robot Arm Motion, Proceedings of the 11th International Conference on Ubiquitous Robots and Ambient Intelligence (URAI2014), accepted, Kuala Lumpur, Malaysia, Nov. 12-15, 2014.
Yoshiaki Bando, Katsutoshi Itoyama, Satoshi Tadokoro, Masashi Konyo, Kazuhiro Nakadai, Kazuyoshi Yoshii, Hiroshi G. Okuno: A Sound-based Online Method for Estimating the Time-Varying Posture of a Hose-shaped Robot, Proceedings of the 12th International Symposium on Safety, Security, and Rescue Robotics (SSRR-2014), 1-6, Oct. 28, 2014. Oct. 27-30, 2014, IEEE-RAS, Toya, Japan. Best student paper award doi:10.1109/SSRR.2014.7017665
Akira Maruyama, Motoko S. Fujita, Katsutoshi Itoyama, Hiroshi G. Okuno, Mamoru Kanzaki: Development of automatic bird-species recognition system from birdsongs in tropical forests, Proceedings of the 26th International Ornithological Congress (IOC2014), p14-003, 18-24, August 2014, Tokyo.
Akira Maezawa, Katsutoshi Itoyama, Kazuyoshi Yoshii, Hiroshi G. Okuno: BAYESIAN AUDIO ALIGNMENT BASED ON A UNIFIED GENERATIVE MODEL OF MUSIC COMOSITION AND PERFORMANCE, Proceedings of 2014 International Symposium on Music Information Retrieval (ISMIR 2014), accepted, Taipei, Taiwan, Oct 27-31, 2014.
Shoto Sasaki, Kazuyoshi Yoshii, Tomoyasu Nakano, Masataka Goto, Shigeo Morishima: LYRICSRADAR: A LYRICS RETRIEVAL SYSTEM BASED ON LATENT TOPICS OF LYRICS, Proceedings of 2014 International Symposium on Music Information Retrieval (ISMIR 2014), accepted, Taipei, Taiwan, Oct 27-31, 2014.
Taro Masuda, Kazuyoshi Yoshii, Masataka Goto, Shigeo Morishima: SPOTTING A QUERY PHRASE FROM POLYPHONIC MUSIC AUDIO SIGNALS BASED ON SEMI-SUPERVISED NONNEGATIVE MATRIX FACTORIZATION, Proceedings of 2014 International Symposium on Music Information Retrieval (ISMIR 2014), accepted, Taipei, Taiwan, Oct 27-31, 2014.
Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii: Transferring Vocal Expressions of a Professional Singer to Unaccompanied Singing Signals, The 15th International Society for Music Information Retrieval (ISMIR 2014), Late-Breaking / Demo (LBD), Accepted, Taipei, Taiwan, Oct 27-31, 2014.
Katsutoshi Itoyama, Hiroshi G. Okuno: Parameter Estimation of Virtual Musical Instrumental Synthesizers, Proceedings of 2014 Joint Conference on 11th Sound and Music Computing Conference (ICMC) and 40th International Computer Music Conference (SMC) (ICMC|SMC 2014), accepted for poster presentation, Jun. 13 ((120+153)/383), Sep. 14-20, 2014, Athens, Greece.
Kuniaki Noda, Yuki Yamaguchi, Kazuhiro Nakadai, Hiroshi G. Okuno, Tetsuya Ogata: Lipreading using Convolutional Neural Network, Proceedings of 2014 International Conference on Spoken Language Processing (Interspeech 2014), accepted (acceptance rate is 52%), 10 June 2014, Singapore, 14-18 Sep. 2014.
Osamu Sugiyama, Katsutoshi Itoyama, Kazuhiro Nakadai, Hiroshi G. Okuno, Sound Annotation Tool for Multidirectional Sounds based on spatial information extracted by HARK robot audition software, Proceeding of IEEE International Conference on Systems, Man, and Cybernetics (SMC 2014), 2335-2340, San Diego, 5-8 Oct. 2014. doi:10.1109/SMC.2014.6974275
Takahiro Iyama, Osamu Sugiyama, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: Visualization of auditory awareness based on sound source positions estimated by depth sensor and microphone array, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2014), pp.1908-1913 (acceptance rate 47%), IEEE, RSJ, Chicago, 14-18 Sep. 2014. doi 10.1109/IROS.2014.6942814
Joao Lobato Oliveira, Keisuke Nakamura, Thibault Langlois, Fabien Gouyon, Kazuhiro Nakadai, Angelica Lim, Luis Paulo Reis, Hiroshi G. Okuno, Making a Robot Dance to Diverse Musical Genre in Noisy Environments, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2014), pp.1896-1901 (acceptance rate 47%), IEEE, RSJ, Chicago, 14-18 Sep. 2014. doi 10.1109/IROS.2014.6942812
Shun Nishide, Keita Mochizuki, Hiroshi G. Okuno, Tetsuya Ogata: Insertion of Pause in Drawing from Babbling for Robot's Developmental Imitation Learning. Proceedings of 2014 IEEE International Conference on Robots and Automation (ICRA 2014), pp.4785-4791, (acceptance rate 48%), Hong Kong, China, May 31- June 7, 2014. doi: 10.1109/ICRA2014.6907559
Akira Maezawa, Hiroshi G. Okuno: Audio Part Mixture Alignment Based on Hierarchical Nonparametric Bayesian Model of Musical Audio Sequence Collection, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.5249-5253, (acceptance rate = 1745/3492, 50.0%), AASP-P7.11 Florence, Italy, May 4-9, 2014. doi: 10.1109/ICASSP.2014.6854597
Kazuki Yazawa, Katsutoshi Itoyama, Hiroshi G. Okuno: Automatic Transcription of Guitar Tablature from Audio Signals in Accordance with Player's Proficiency, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.3146-3150, (acceptance rate = 1745/3492, 50.0%), AASP-L3, Florence, Italy, May 4-9, 2014. doi: 10.1109/ICASSP.2014.6854175
Yukara Ikemiya, Katsutoshi Itoyama, Hiroshi G. Okuno: Transcribing Vocal Expression from Polyphonic Music, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.3151-3155, (acceptance rate = 1745/3492, 50.0%), AASP-L3, Florence, Italy, May 4-9, 2014. doi: 10.1109/ICASSP.2014.6854176
Kazuyoshi Yoshii, Hiromasa Fujihara, Tomoyuki Nakano, Masataka Goto: Cultivating Vocal Activity Detection for Music Audio Signals in a Circulation-type Crowdsourcing Ecosystem, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.624-628, (acceptance rate = 1745/3492, 50.0%), AASP-P1.5 Florence, Italy, May 4-9, 2014.
Tomoyuki Nakano, Kazuyoshi Yoshii, Masataka Goto: Vocal Timbre Analysis Using Latent Dirichlet Allocation and Cross-Gender Vocal Timbre Similarity, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.5239-5244, (acceptance rate = 1745/3492, 50.0%), AASP-P7.9 Florence, Italy, May 4-9, 2014.
Tomohiko Nakamura, Hirokazu Kameoka, Kazuyoshi Yoshii, Masataka Goto: Timbre Replacement of Harmonic and Drum Components for Music Audio Signals, Proceedings of 2014 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2014), pp.7520-7524, (acceptance rate = 1745/3492, 50.0%), AASP-P10.7 Florence, Italy, May 4-9, 2014.
口頭発表（研究会・全国大会）
井山貴裕, 杉山治，坂東宣昭, 糸山克寿, 吉井和佳, 奥乃博: 聴覚アウェアネスの可視化のための深度センサとマイクロフォンアレイを用いた物体認識と音イベント検出情報処理学会第77回全国大会, 2ZB-07, Mar. 2015. 京都大学.
古川孝太郎, 糸山克寿, 吉井和佳, 奥乃博: プログラミング基礎教育のための図形言語の3D拡張. 情報処理学会第77回全国大会, 3ZF-05, Mar. 2015. 京都大学.
土橋彩香, 池宮由楽, 糸山克寿, 吉井和佳: 1歌声・伴奏音・打楽器音分離に基づく音楽演奏支援システム. 情報処理学会第77回全国大会, 4S-01, Mar. 2015. 京都大学. 学生奨励賞
福田翼, 池宮由楽, 糸山克寿, 吉井和佳: ユーザの技術に合わせた自動編曲機能をもつピアノ演奏練習システム. 情報処理学会第77回全国大会, 4S-02, Mar. 2015. 京都大学.
関口航平, 坂東宣昭, 糸山克寿, 吉井和佳: 分散型マイクロホンアレイを用いた音源分離のための複数移動ロボットの配置最適化. 情報処理学会第77回全国大会, 4T-07, Mar. 2015. 京都大学. 学生奨励賞
板倉光佑, 西牟田勇哉, 坂東宜昭, 糸山克寿, 吉井和佳: 2混合音に対する音源分離の不確実性を考慮した同時発話音声認識, 情報処理学会第77回全国大会, 5P-0, Mar. 2015. 京都大学. 学生奨励賞
赤堀渉，増田太郎，奥乃博, 森島繁生: 雑音下での音源定位・音源分離に与える伝達関数測定法の影響の評価. 情報処理学会第77回全国大会, 5P-03, Mar. 2015. 京都大学.
池宮由楽, 糸山克寿, 吉井和佳: 音楽音響信号に対する相補的な歌声分離と音高推定. 情報処理学会第77回全国大会, 5S-01, Mar. 2015. 京都大学. 学生奨励賞
丸尾智志, 吉井和佳, 糸山克寿, Matthias Mauch，後藤真孝: コード制約付きNMFを用いた音高推定に基づくコード認識, 情報処理学会第77回全国大会, 5S-03, Mar. 2015. 京都大学.
大喜多美里, 坂東宣昭, 池宮由楽, 糸山克寿, 吉井和佳: ダンス共演ロボットのためのマルチモーダルビートトラッキング情報処理学会第77回全国大会, 5S-05, Mar. 2015. 京都大学. 学生奨励賞
坂東宣昭, 池宮由楽, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博: 柔軟索状レスキューロボットのためのロバスト主成分分析を用いた走行雑音抑圧, 情報処理学会第77回全国大会, 5T-04, Mar. 2015. 京都大学. 学生奨励賞
西牟田勇哉, 糸山克寿, 吉井和佳, 奥乃博: 早言いクイズ司会者ロボットの開発と評価情報処理学会第77回全国大会, 5T-06, Mar. 2015. 京都大学.
池宮由楽, 糸山克寿, 吉井和佳: 市販楽曲中の歌声の分離と音高推定に基づく歌唱表現編集システム, インタラクション2015, 一般講演, 採録, 情報処理学会, Dec. 5, 2014. 日本科学未来館, Mar. 5 -- 7, 2015.
中臺一博, 奥乃博: ロボット聴覚オープンソフトウェアHARKの紹介, 第15回計測自動制御学会システムインテグレーション部会講演会, キーノート講演, 2L3-1, pp.1712-1716, Dec. 15, 2014, 東京ビッグサイト.
井山貴裕, 杉山治, 坂東宣昭, 糸山克寿, 吉井和佳, 奥乃博: 深度センサとマイクロフォンを用いた聴覚アウェアネスの提示, 第39回 AI チャレンジ研究会, SIG-Challenge-B402-03, 20-25, 人工知能学会, 慶應義塾大学日吉来往舎, Nov. 21. 2014.
坂東宣昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博: マイクロホンアレイとスピーカをもつ柔軟索状ロボットのための動的スピーカ選択による姿勢推定の高速化, 第39回 AI チャレンジ研究会, SIG-Challenge-B402-08, 45-50, 人工知能学会, 慶應義塾大学日吉来往舎, Nov. 21. 2014.
古川孝太郎, 坂東宣昭, 糸山克寿, 吉井和佳, 奥乃博: Schemeによる3D図形の構成的制作 日本ソフトウエア科学会第31回大会, 名古屋大学, Sep. 7-9, 2014.
坂東宣昭, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博: マイクロホンアレイを用いた駆動機構付ホース型ロボットの姿勢推定, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013.
西牟田勇哉, 吉井和佳, 西出俊糸山克寿, 奥乃博: 「早言い」合図を識別してインタラクションに活用するロボット司会者, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013.
井山貴裕, 杉山治, 坂東宣昭, 糸山克寿, 吉井和佳, 奥乃博: 聴覚アウエアネス可視化に基づくジェスチャ操作インタフェースの開発, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013.
野田邦明, 山口雄紀, 中臺一博, 奥乃博, 尾形哲也: Deep Neural Networkを用いたマルチモーダル音声認識, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013.
西出俊望月敬太, 奥乃博, 尾形哲也: 「早言い」合図を識別してインタラクションに活用するロボット司会者, 日本ロボット学会第32回学術講演会, 九州産業大学, Sep. 4-6, 2013.
中野倫靖吉井和佳, 後藤真孝: 確率的生成モデルに基づく音楽の類似度とありがち度の推定に関する検討, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(2), pp.1-7, 京都大学, 情報処理学会, 25 Aug. 2014.
吉井和佳, 糸山克寿, 後藤真孝: 多重音基本周波数解析のための無限重畳離散全極型モデル, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(9), pp.1-8, 京都大学, 情報処理学会, 25 Aug. 2014.
中村友彦, 吉井和佳, 後藤真孝, 亀岡弘和: 音楽音響信号中の調波音の周波数特性およびドラムの音色の置換システム, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(11), pp.1-6, 京都大学, 情報処理学会, 25 Aug. 2014.
前澤陽, 糸山克寿, 吉井和佳, 奥乃博, 河原達也: 演奏間相対テンポの結合力学モデルに基づく音響信号間アライメント, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(13), pp.1-7, 京都大学, 情報処理学会, 25 Aug. 2014.
池宮由楽, 糸山克寿, 吉井和佳, 奥乃博: 混合音中の歌声F0軌跡に対する歌唱表現転写システム, 第104回情報処理学会音楽情報科学研究会(夏のシンポジウム) 音楽情報科学研究会, Vol.2014-MUS-104(23), pp.1-6, 京都大学, 情報処理学会, 25 Aug. 2014. ベストプレゼン賞.
杉山治, 糸山克寿, 中臺一博, 奥乃博: HARKを用いた多方向音声のアノテーションツールの開発, クラウドネットワークロボット研究会（CNR）, 電子情報通信学会, 慶應義塾大学, June 16, 2014
前澤陽, 糸山克寿, 吉井和佳, 奥乃博: 潜在共通構造モデルに基づく音響信号間アライメント, 音学シンポジウム, 音楽情報科学研究会, Vol.2014-MUS-103 No.23, 音声研究会, 日本大学, May 25, 2014
池宮由楽, 糸山克寿, 吉井和佳, 奥乃博: 市販楽曲からの歌い方ライブラリの作成, 音学シンポジウム, 音楽情報科学研究会, Vol.2014-MUS-103 No.48, 音声研究会, 日本大学, May 25, 2014
特許・ディジタルコンテンツ
楽譜位置推定装置、楽譜位置推定方法、及び楽譜位置推定プログラム. 発明者：中臺一博, 大塚琢馬, 奥乃博, 特許第5654897号, 登録日平成26年11月28日. 特開2011-180590号, 2011年9月15日. 特願2011-37526号, 2011年2月23日.
Musical score position estimating device, musical score position estimating method, and musical score position estimating robot. Inventors: Kazuhiro Nakadai, Takuma Otsuka, Hiroshi Okuno, Patent No. US 8,889,976, Date of Patent: Nov. 18, 2014. Date of Application: Aug. 14, 2009.
音源定位システム及び音源定位方法. 発明者：中臺一博, 奥乃博, 大塚琢馬, 特許第5629249号, 登録日平成26年10月10日. 特開2013-44950号, 2013年3月4日. 特願2011-182774号, 2011年8月24日.
Music Audio Signal Generating System. Inventors: Takehiro Abe, Naoki Yasuraoka, Katsutoshi Itoyama, Hiroshi Okuno, Patent No. US 8,831,762, Date of Patent: Sep 9, 2014. Date of Application: Feb. 16, 2010.
環境音検索装置、環境音検索方法. 発明者：中臺一博, 中村圭祐, 山村祐介, 奥乃博, 特開2014-178886号, 2014年9月25日. 特願2013-52424号, 2013年3月14日.
楽譜位置推定装置、楽譜位置推定方法および楽譜位置推定ロボット. 発明者：中臺一博, 大塚琢馬, 奥乃博, 特許第5582915号, 登録日平成26年7月25日. 特開2011-39511号, 2011年2月24日. 特願2010-177968号, 2010年8月6日.
残響抑制装置，及び残響抑制方法, 発明者：中臺一博, 武田龍, 奥乃博, 特許第5572445号, 登録日平成26年7月4日. 特開2011-232691号, 2011年11月17日. 特願2010-105369号, 2010年4月30日.
残響抑制装置，及び残響抑制方法, 発明者：中臺一博, 中島弘史, 奥乃博, 武田龍, 特許第5550456号, 登録日平成26年5月30日. 特開2010-282193号, 2010年12月16日. 特願2010-124873号, 2010年5月31日.
Theremin-player robot. Inventors: Hiroshi Tsujino, Hiroshi Okuno, Takeshi Mizumoto, Patent No. US 8,718,823, Date of Patent: May 6, 2014. Date of Application: Oct. 6, 2010.
音声理解装置, 発明者：中野幹生, 勝丸真樹, 船越孝太郎, 奥乃博, 特許第5530729号, 登録日平成26年4月25日. 特開2010-170137号, 2010年8月5日. 特願2010-11175号, 2004年11月12日.

2014年度  ２０１３年度（奥乃・吉井研究室） 2012年度

学位論文

Angelica Lim: MEI: Multimedia Emotional Intelligence （MEI: マルチメディア・エモーショナル・インテリジェンス）, 博士論文 (指導教員: 奥乃博教授), Feb. 2014.
大塚琢馬: Bayesian Microphone Array Processing （ベイズ法によるマイクロフォンアレイ処理）, 博士論文 (指導教員: 奥乃博教授), Feb. 2014.
神田直之: Open-ended Spoken Language Technology: Studies on Spoken Dialogue Systems and Spoken Document Retrieval Systems （拡張可能な音声言語技術：音声対話システムと音声文書検索システムにおける研究）, 博士論文 (指導教員: 奥乃博教授), Feb. 2014.
平山直樹: 複数方言言語モデル混合による複数方言音声認識の高機能化，修士論文 (指導教員: 奥乃博教授), Feb. 2014.
矢澤一樹 ギター演奏音響信号からの運指時の身体的制約と演奏難易度に基づくタブ譜自動生成，修士論文 (指導教員: 奥乃博教授), Feb. 2014.
望月敬太 神経力学モデルを用いた描画運動における人間の認知モデルに基づくロボットの発達的模倣, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
黄楊暘 追体験メディアにおける注意誘導の音響提示手法，修士論文 (指導教員: 奥乃博教授), Feb. 2014.
佐野正太郎 Designing Security Guidelines for COntinuous Visual and Audio CAPTCHAs with HMM-based Breaker, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
山口雄紀 Deep Neural Network とマルチストリームHMMを用いた視聴覚音声認識, 修士論文 (指導教員: 奥乃博教授), Feb. 2014.
井山貴裕: 深度センサとマイクロフォンアレイを用いた音源位置推定による聴覚アウェアネスの可視化, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2014.
絵本詩織: 類似楽曲検索のための音響特徴量を用いた時間変化する楽曲印象分布の推定, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2014.
山崎健史: 歌声ー話声変換における動的音響特徴量が話声らしさに及ぼす影響, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2014.
Ui-Hyum Kim: Improvement of Sound Source Localization for a Binaural Robot of Spherical Head with Pinnae (耳介付球状頭部を持つ両耳聴ロボットのための音源定位の高性能化）, 博士論文 (指導教員: 奥乃博教授), Aug. 2013.
田崎豪: People Detection based on Points Tracked by an Omnidirectional Camera and Interaction Distance for Service Robots System (サービスロボットシステムのための全方位カメラによるトラッキング可能特徴点とインタラクション距離情報を用いた人物検出), 博士論文 (指導教員: 奥乃博教授), Aug. 2013.
中村秀樹: Server Side HARKの設計と開発及びその複数人対話の書き起こし支援への応用, 卒業特別研究報告 (指導教員: 奥乃博教授), Jul. 2013.
ジャーナル論文
Ui-Hyun Kim, Kazuhiro Nakadai, Hiroshi G. Okuno: Improved Sound Source Localization in Horizontal Plane for Binaural Robot Audition, Applied Intelligence, accepted, Springer, Mar. 25, 2014. IF: 1.853
Akira Maezawa, Hiroshi G. Okuno: MAHLER : Audio-to-Score Alignment based on Joint Bayesian Inference of Timbre, Volume, Tempo, and Performer-Dependent Note Onset Timings. Computer Music Journal, accepted, Jan. 23, 2014. IF: 0.756
Ikkyu Aihara, Takeshi Mizumoto, Takuma Otsuka, Hiromitsu Awano, Kohei Nagira, Hiroshi G. Okuno, Kazuyuki Aihara: Spatio-Temporal Dynamics in Collective Frog Choruses Examined by Mathematical Modeling and Field Observation. Scientific Reports, 4:3891 Nature Publishing Group, 27 Jan. 2014. doi: 10.1038/srep03891 IF: 2.927
平山直樹, 吉野幸一郎, 糸山克寿, 森信介, 奥乃博: 入力方言の自動推定による複数方言音声認識システムの構築. 情報処理学会論文誌, 条件付き採録, Jan. 23, 2014, 情報処理学会.
Angelica Lim, Hiroshi G. Okuno: The MEI Robot: Towards Using Motherese to Develop Multimodal Emotional Intelligence. IEEE Transactions on Autonomous Mental Development, publication pending minor revisions, Jan. 20, 2014
神田直之, 糸山克寿, 奥乃博: 音声中の任意検索語検出のための未知語区間推定に基づく選択的インデクス統合法, 情報処理学会論文誌, Vol.55, No.3 (Mar. 2014) 121-1211, 情報処理学会. , DL
Takuma Otsuka, Katsutoshi Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: Bayesian Nonparametrics for Microphone Array Processing, IEEE/ACM Transactions on Audio, Speech and Language Processing, in print, Vol.22, Issue 2 (Feb. 2014) 493--504.. doi: 10.1109/TASLP.2013.2294582 IF: 2.625
Tsuyoshi Tasaki, Tetsuya Ogata, Hiroshi G. Okuno: The Interaction between a Robot and Multiple People based on Spatially Mapping of Friendliness and Motion Parameters, Advanced Robotics, Vol.28, Issue 1 (Jan. 2014) pp.39-51 Published on line on 30 Oct. 2013. doi: 10.1080/01691864.2013.854457 IF: 0.562
田崎豪, 尾形哲也, 奥乃博: 相槌認識による聞き手の理解状態推定を利用したインタラクションのためのロボット動作制御, ヒューマンインタフェース学会論文誌, Vol.15, No.4 (Nov. 2013) pp.363-374. 学会オンラインサーバ
Ui-Hyun Kim, Hiroshi G. Okuno: Improved Binaural Sound Localization and Tracking for Unknown Time- Varying Number of Speakers, Advanced Robotics, accepted, Dec. 28, 2012. Vo.27, Issue 15 (Nov. 2013) pp.1161-1173 Published Online on 1 July 2013. doi: 10.1080/01691864.2013.812177 IF: 0.562
Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno: A real-time super-resolution robot audition system that improves the robustness of simultaneous speech recognition Advanced Robotics, Vol.27 Issue 12 (Dec. 2013), pp.933-945, Published Online on 10 May 2013. doi:10.1080/01691864.2013.797139 IF: 0.510 The Best Paper Award.
Daichi Sakaue, Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: Robust Multipitch Analyzer against Initialization based on Latent Harmonic Allocation using Overtone Corpus, Journal of Information Processing, Vol.21, No.2 (Apr. 2013), pp.246-256, IPSJ, Jan. 2013. doi:10.2197/ipsjjip.21.246
章分担・解説
Shotaro Sano, Takuma Otsuka, Hiroshi G. Okuno: Solving Google's Continuous Audio CAPTCHA with HMM-based Automatic Speech Recognition, Advances in Information and Computer Security, Proceedings of the 8th International Workshop on Security (IWSEC 2013), Lecture Notes in Computer Science, Vol.8231, pp.36-52, Springer, Nov. 18-20, Okinawa. The Best Paper Award Description doi: 10.1007/978-3-642-41383-4_3
Ui-Hyun Kim, Kazuhiro Nakadai, Hiroshi G. Okuno: Improved Sound Source Localization and Front-Back Disambiguation for Humanoid Robots with Two Ears, Recent Trends in Applied Artificial Intelligence, Lecture Notes in Computer Science, Vol.7906, pp.282-291, Springer. June 17-21, Amsterdam, The Netherland. (Acceptance rate for long papers: 34.7%). The Best Paper Award (1/103 papers) doi: 10.1007/978-3-642-38577-3_29
YangYang Huang, Takuma Otsuka, Hiroshi G. Okuno: A Speaker Dialization System with Robust Speaker Localization and Voice Activity Detection, Comtemprary Challenges and solutions in Applied Artificial Intelligence, Studies in Computational Intelligence, Vol. 489 (2013) pp.77-82, Springer. June 17-21, Amsterdam, The Netherland. doi: 10.1007/978-3-319-00651-2_11
国際会議論文
Angelica Lim, Hiroshi G. Okuno: A model for human empathy based on a neuroscience-inspired emotional robot, HRI2014 Workshop on "HRI: a bridge between Robotics and Neuroscience", poster, Mar. 3, 2014
Yuki Yamaguchi, Kuniaki Noda, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Learning and Association of Synaesthesia Phenomenon using Deep Neural Networks, Proceedings of 2013 IEEE/SICE International Symposium on System Integration (SII 2013), MP2-K.2, pp.659-664, Dec. 15-17, 2013, Kobe. 10.1109/SII.2013.6776750
M.J. Hikita, Hiroshi G. Okuno: PROPOSAL OF INTERNATIONAL CONFERENCE PROMOTION --- Destination Branding and Risk Management by a network of conference centres ---, Proceedings of the First International Conference of Serviceology (ICServ 2013), pp.61-68, Oct. 16-18, AIST Tokyo Waterfront, Japan.
Keita Mochizuki, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: DevelopmentalHuman-Robot Imitation Learning of Drawing with a Neuro Dynamical System, Proceeding of 2013 IEEE International Conference on Systems, Man, and Cybernetics (SMC 2013), pp.2336-2341, part SMC: Human-Machine, Manchester, UK, 13-16 Oct. 2013. doi:10.1109/SMC.2013.399
Hiroshi G. Okuno: Outdoor Auditory Scee Analysis, Keynote Talk, TuCT8.1, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2013), Nov. 5, 2013.
Yoshinori Bando, Takeshi Muzumoto, Katsutoshi Itoyama, Kazuhiro Nakadai, Hiroshi G. Okuno: Posture Estimation of Horse-Shaped Robot using Microphone Array Localization, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2013), TuCT8.5, pp.3446-3451, (acceptance rate 43%), IEEE, RSJ, Tokyo Big Sight, Japan, 3-7 Nov. 2013. doi 10.1109/IROS.2013.6696847 IEEE Robotics and Automation Society Japan Chapter Young Award
Koutarou Furukawa, Keita Okutani, Kohei Nagira, Takuma Otsuka, Katsutoshi Itoyama, Kazuhiro Nakadai, Hiroshi G. Okuno: Noise Correlation Matrix Estimation for Improving Sound Source Localization by Multirotor UAV, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2013), TuDT8.5, pp.3943-3948, (acceptance rate 43%), IEEE, RSJ, Tokyo Big Sight, Japan, 3-7 Nov. 2013. doi 10.1109/IROS.2013.6696920
Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shunsuke Mori, Hiroshi G. Okuno: Automatic Estimation of Dialect Mixing Ratio for Dialect Speech Recognition, Proceedings of International Conference on Spoken Language Processing (Interspeech 2013), pp.1492-1496, (acceptance rate 52%), Aug., 2013. Lyon, France.
Ui-Hyun Kim, Hiroshi G. Okuno: Robust Localization and Tracking of Multiple Speakers in Real Environments for Binaural Robot Audition, Proceedings of the 14th International Workshop on Image and Audio Analysis for Multimedia Interactive Services (WIA2MIS 2013), pp.1-4, Paris, July 3-5, 2013. doi: 10.1109/WIAMIS.2013.6616137
Kazuki Yazawa, Daichi Sakaue, Kohei Nagira, Katsutoshi Itoyama, Hiroshi G. Okuno: AUDIO-BASED GUITAR TABLATURE TRANSCRIPTION USING MULTIPITCH ANALYSIS AND PLAYABILITY CONSTRAINTS, Proceedings of 2013 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), AASP-P.1.4, pp.196-200. Vancouver, Canada, May 26-31. doi: 10.1109/ICASSP.2013.6637636
Daichi Sakaue, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: INITIALIZATION-ROBUST BAYESIAN MULTIPITCH ANALYZER BASED ON PSYCHOACOUSTICAL AND MUSICAL CRITERIA, Proceedings of 2013 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), AASP-P1.10, pp.226-230, Vancouver, Canada, May 26-31. doi: 10.1109/ICASSP.2013.6637642
Naoyuki Kanda, Katsutoshi Itoyama, Hiroshi G. Okuno: MULTIPLE INDEX COMBINATION FOR JAPANESE SPOKEN TERM DETECTION WITH OPTIMUM INDEX SELECTION BASED ON OOV-REGION CLASSIFIER, Proceedings of 2013 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2013), SLP-P5.7, pp.8540-8544, Vancouver, Canada, May 26-31. doi: 10.1109/ICASSP.2013.6639332
Tetsuya Ogata, Hiroshi G. Okuno: Integration of behaviors and languages with a hierarchal structure self-organized in a neuro-dynamial model, IEEE Symposium Series on Computational Intelligence 2013, pp.89-95, Singapore, Apr. 16-19, 2013. doi: 10.1109/RiiSS.2013.6607934
Randy Gomez, Keisuke Nakamura, Kazuhiro Nakadai, Ui-Hyun Kim, Hiroshi G. Okuno, Tatsuya Kawahara: Hands-Free Human Robot Communication Robust to Speaker's Radial Position, Proceedings of 2013 IEEE International Conference on Robots and Automation (ICRA 2013), pp.4329-4334, (acceptance rate 39%), Karlsruhe, Germany, May 6-10, 2013. doi: 10.1109/ICRA.2013.6631190
口頭発表（研究会・全国大会）
水本武志, 合原一究, 奥乃博: 音声可視化デバイス「カエルホタル」によるニホンアマガエル合唱の時空間構造解析第38回 AI チャレンジ研究会, SIG-Challenge-B303-08, 人工知能学会, 京都大学, Mar. 18. 2014.
合原一究, 粟野皓光, 水本武志, 坂東宜昭, 大塚琢馬, 柳楽浩平, 奥乃博: 振動子モデルと音声可視化システムを用いたアマガエルの合唱法則の解析, 第38回 AI チャレンジ研究会, SIG-Challenge-B303-09, 人工知能学会, 京都大学, Mar. 18. 2014. 人工知能学会 2013年度研究会優秀賞.w
Shotaro Sano, Takuma Otsuka, Hiroshi G. Okuno: HMM-based CAPTCHA Breaker for Overlapped Symbols, 情報処理学会第76回全国大会, 2Z-3, Mar. 2014. 東京電機大学. 学生奨励賞
望月敬太, 西出俊奥乃博, 尾形哲也: ロボットによる描画運動発達モデルと軌道の重み付き区間認識・学習を利用した精度向上, 情報処理学会第76回全国大会, 3C-5, Mar. 2014. 東京電機大学. 大会優秀賞.
坂東宣昭, 大塚琢馬, 中臺一博, 田所諭, 昆陽雅司, 糸山克寿, 奥乃博: マイクロホンアレイの位置推定によるホース型ロボットの姿勢推定, 情報処理学会第76回全国大会, 4V-1, Mar. 2014. 東京電機大学. 学生奨励賞
平山直樹, 吉野浩一郎, 森信介, 糸山克寿, 奥乃博: 混合方言言語モデルと混合比推定による方言音声認識システム, 情報処理学会第76回全国大会, 4S-6, Mar. 2014. 東京電機大学. 学生奨励賞
矢澤一樹, 糸山克寿, 奥乃博: ギター演奏音からの難易度調整可能なタブ譜自動生成システム, 情報処理学会第76回全国大会, 5R-5, Mar. 2014. 東京電機大学. 学生奨励賞
池宮由楽, 糸山克寿, 奥乃博: 伴奏付き歌唱からの歌唱表現のパラメータ化と転写, 情報処理学会第76回全国大会, 5R-7, Mar. 2014. 東京電機大学.
山崎健史, 池宮由楽, 糸山克寿, 奥乃博: 歌声-話声変換における動的音響特徴量が話声らしさに及ぼす影響, 情報処理学会第76回全国大会, 5R-8, Mar. 2014. 東京電機大学.
絵本詩織, 糸山克寿, 奥乃博: 音響特徴量を用いた楽曲印象分布の推定, 情報処理学会第76回全国大会, 6R-8, Mar. 2014. 東京電機大学.
西牟田勇哉, 平山直樹, 大塚琢馬, 杉山治, 糸山克寿, 奥乃博: 環境音に頑健な同時合図を識別するクイズ司会者の構築, 情報処理学会第76回全国大会, 5S-1, Mar. 2014. 東京電機大学.
山口雄紀, 野田邦明, 中臺一博, 奥乃博, 尾形哲也: Deep Neural Networkを用いたマルチモーダル音声認識の為の特徴量学習, 情報処理学会第76回全国大会, 5S-3, Mar. 2014. 東京電機大学. 学生奨励賞
井山貴裕, 杉山治, 大塚琢馬, 糸山克寿, 奥乃博: 深度センサとマイクロホンアレイを用いた音源位置可視化による聴覚アウェアネスの提示, 情報処理学会第76回全国大会, 6S-5, Mar. 2014. 東京電機大学. 学生奨励賞
黄楊暘, 杉山治, 大塚琢馬, 奥乃博: 追体験メディアにおける注意誘導の提示手法, 情報処理学会第76回全国大会, 6S-7, Mar. 2014. 東京電機大学.
Hadi Tjandra，高橋城志，村田真悟，有江浩明，山口雄紀, 尾形哲也，菅野重樹: 神経力学モデルと身体バブリングに基づく道具身体化と動作生成情報処理学会第76回全国大会, 1S-4, Mar. 2014. 東京電機大学.
高橋裕己，中野幹生，岩橋直人，左祥，船越孝太郎，岡夏樹，菅野重樹: マルチモーダル情報を利用した未知語を含む発話のドメイン選択精度の向上, 情報処理学会第76回全国大会, 4S-2, Mar. 2014. 東京電機大学.
アッタミミ・ムハンマド, 長井隆行, 岩橋直人, 奥乃博: 音声命令と行動予測に基づく文脈を考慮したロボットの行動決定, 第14回計測自動制御学会システムインテグレーション部門講演会 (SI2013), 2013年12月18日(水)〜20日(金) 神戸国際会議場
西牟田勇哉, 平山直樹, 大塚琢馬, 杉山治, 糸山克寿, 奥乃博: ロボット聴覚ソフトウエアHARKを用いたクイズの同時回答を識別するロボット司会者の設計と実装, 第37回 AI チャレンジ研究会, SIG-Challenge-B3020-09, pp.45-50, 人工知能学会, 早稲田大学, Dec. 6. 2013.
坂東宣昭, 大塚琢馬, 糸山克寿, 中村圭佑, 昆陽雅司, 田所諭, 中臺一博, 奥乃博: ホースの伸び縮みによるマイク位置の変化を許容するマイクロホンアレイを用いたホース型ロボットの姿勢推定, 第37回 AI チャレンジ研究会, SIG-Challenge-B3020-10, pp.51-56, 人工知能学会, 早稲田大学, Dec. 6. 2013.
望月敬太, 西出俊奥乃博, 尾形哲也: 停止活動を活用した描画運動におけるロボットの発達的模倣学習, 日本ロボット学会第31回学術講演会, 1C2-06, 首都大学東京, Sep. 4-6, 2013.
西出俊奥乃博, 尾形哲也: スパース再帰神経回路モデルによる人物の行動学習, 日本ロボット学会第31回学術講演会, 2C2-01, 首都大学東京, Sep. 4-6, 2013.
坂東宣昭, 大塚琢馬, 水本武志, 糸山克寿, 中臺一博, 奥乃博: ホース型ロボットのマイクロホンアレイを用いた姿勢推定, 日本ロボット学会第31回学術講演会, 3D3-01, 首都大学東京, Sep. 4-6, 2013.
古川孝太郎, 大塚琢馬, 糸山克寿, 中臺一博, 奥乃博: Multirotor UAV を用いた音源定位のための雑音相関行列推定, 日本ロボット学会第31回学術講演会, 3D3-02, 首都大学東京, Sep. 4-6, 2013.
西牟田勇哉, 平山直樹, 大塚琢馬, 杉山治, 糸山克寿, 奥乃博: HARKを用いたロボットクイズ司会者HATTACK25 の開発, 日本ロボット学会第31回学術講演会, 3D3-08, 首都大学東京, Sep. 4-6, 2013.
糸山克寿, 奥乃博: 楽器音に対する仮想音源のパラメータ推定 第100回音楽情報処理研究会, 研究報告音楽情報科学（MUS）, 2013-MUS-100(5),1-6 (2013-08-24) 東京大学, 情報処理学会, Aug. 2013.
前澤陽, 奥乃博: 楽曲パート混合オーディオ同士の楽譜なしアライメント手法, 第100回音楽情報処理研究会, 研究報告音楽情報科学（MUS）, Vol.2013-MUS-100, No.14, 1-6 (2013-09-31) 東京大学, 情報処理学会, Aug. 2013.
矢澤一樹, 糸山克寿, 奥乃博: ギター演奏者の習熟度に合わせた音響信号からのタブ譜自動生成, 第100回音楽情報処理研究会, 研究報告音楽情報科学（MUS）, Vol.2013-MUS-100, No.17, 1 -6 (2013-09-01) 東京大学, 情報処理学会, Sep. 2013.
池宮由楽, 糸山克寿, a href="http://winnie.kuis.kyoto-u.ac.jp/members/okuno/">奥乃博: 伴奏付き歌唱に含まれる歌い方要素の個別抽出 第100回音楽情報処理研究会, 研究報告音楽情報科学（MUS）, Vol.2013-MUS-100, No.20, 1 -6 (2013-09-01) 東京大学, 情報処理学会, Sep. 2013.
特許・ディジタルコンテンツ
音響処理装置, 音響処理方法, 及び音響処理プログラム発明者：ジョアオロバートオリベイラ，インジュギョカン, 中村圭佑, 中臺一博, 奥乃博, ルイスパウロレイシュ, ファビアン, グーヨン, 特開2014-52630号, 2014年3月20日. 特願2013-182717号, 2013年9月3日.
Robot, method and program of correcting a robot voice in accordance with head movement. Inventors: Kazuhiro Nakadai, Takuma Otsuka, Hiroshi Okuno, Patent No. US 8,639,511, Date of Patent: Jan. 28, 2014. Date of Application: Sep. 14, 2010.
音源探査装置, 発明者：堀邊隆介, 梅田修志, 田中史記, 猪田岳司, 奥乃博, 高橋徹. 特許第5423370号, 登録日平成25年12月6日. 特開2011-238964号, 2011年6月23日. 特願2009-280115号, 2009年12月10日.
音源分離定位装置、方法、及びプログラム, 発明者：石黒勝彦, 澤田宏, 大塚琢馬, 奥乃博, 特開2014-21315号, 2014年2月3日. 特願2012-160450号, 2012年7月19日.
ロボット、ロボット制御方法およびプログラム, 発明者：中臺一博, 大塚琢馬, 奥乃博, 特許第5393544号, 登録日平成25年10月25日. 特開2011-189439号, 2011年9月29日. 特願2010-56265号, 2010年3月12日.
音データ記録再生装置および音データ記録再生方法, 発明者：中臺一博, 長谷川雄二, 辻野広司, 奥乃博, 特許第5383056号, 登録日平成25年10月11日. 特開2008-197650号, 2008年8月28日. 特願2008-25678号, 2008年2月5日.
Beat tracking apparatus, beat tracking method, recording medium, beat tracking program, and robot. Inventors: Kazuhiro Nakadai, Yuji Hasegawa, Hiroshi Tsujino, Kazumasa Murata, Ryu Takeda, Hiroshi Okuno, Patent No. US 8,594,846, Date of Patent: Nov. 26, 2013. Date of Application: Jul. 15, 2009.
Speech recognition system and speech recognizing method. Inventors: Kazuhiro Nakadai, Toru Takahashi, Hiroshi Okuno, Patent No. US 8,577,678, Date of Patent: Nov. 5, 2013. Date of Application: Mar. 10, 2011.
Speech understanding apparatus using multiple language models and multiple language understanding models. Inventors: Mikio Nakano, Masaki Katsumaru, Kotaro Funakoshi, Hiroshi Okuno, Patent No. US 8,548,808, Date of Patent: Oct. 1, 2013. Date of Application: Jan. 22, 2010.
ビートトラッキング装置、ビートトラッキング方法、記録媒体、ビートトラッキング用プログラム、及びロボット, 発明者：中臺一博, 長谷川雄二, 辻野広司, 村田和真, 武田龍, 奥乃博, 特許第5337608号, 登録日平成25年8月9日. 特開2010-26512号, 2010年2月4日. 特願2009-166048号, 2009年7月14日.
音楽音響信号生成システム, 発明者：安部武宏, 安良岡直希, 糸山克寿, 奥乃博, 特許第5283289号，登録日2013 (平成25年) 6月7日. 特願2011-500614号, 出願日2011年8月9日, 国立大学法人京都大学.
会話システムおよび会話ソフトウェア, 発明者: 中野幹生, 辻野広司, 竹内誉羽, 駒谷和範, 奥乃博, 特許第5248867号, 登録日平成25年4月19日. 特願2007-556883号, 2007年1月31日.
Musical score position estimating apparatus, musical score position estimating method, and musical score position estimating program. Inventors: Kazuhiro Nakadai, Takuma Otsuka, Hiroshi Okuno, Patent No. US 8,440,901, Date of Patent: May 14, 2013. Date of Application: Mar. 1, 2011.
Audio Source Detection System, Inventors: Hiroshi Tsujino, Kazuhiro Nakadai, Hiroshi Okuno, Takeshi Mizumoto, and Ikkyu Aihara. Patent No. US 8,416,957, Date of Patent: Apr. 9, 2013. Date of Application: Dec. 4, 2009.

2013年度  ２０１２年度（奥乃研究室） 2011年度

学位論文

水本武志: Synchronization among Interacting Individuals: Case Studies of Human-Robot Ensembles and Frog Choruses, 博士論文 (指導教員: 奥乃博教授), Feb. 2013.
中村圭佑: Robust Sound Source Localization Based on Microphone Array Processing for Robot Audition，博士論文 (指導教員: 奥乃博教授), Feb. 2013.
糸原達彦: Beat-tracking method for music robot ensembles with a human guitarist, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
阪上大地: Optimization-Free Multipitch Analyzer based on Psychoacoustical and Musical Criteria, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
柳楽浩平: Nonparametric Bayesian Blind Source Separation in Frequency Domain with Permutation Resolution, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
信田春満: 神経力学モデルを用いた予測可能性による身体識別と視覚運動系環境学習における身体の優先的獲得, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
JooYoung Ahn: Real-Time Lead Sheet Following for Human Accompaniment by Particle Filter, 修士論文 (指導教員: 奥乃博教授), Feb. 2013.
池宮由楽: 伴奏付き歌声からのF0抽出による楽譜逸脱成分推定, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
田島照久: 楽器音の音量変化を共有化したNMFによる楽器パート分離, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
古川孝太郎: 雑音相関行列の推定によるクアドロコプターからの音源定位, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
水野俊一郎: カエルの鳴き声混合音からの複数種識別, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2013.
査読つきジャーナル論文
Kohei Nagira, Takuma Otsuka, Hiroshi G. Okuno: Nonparametric Bayesina Sparse Factor Analysis for Frequency Doain Blind Source Separation without Pearmuation Ambiguity, EURASIP Journal on Audio, Speech, and Music Processing, 2013, 2013:3. doi:10.1186/1687-4722-2013-4 目次 (学会サーバ） IF: 0.382
Kazunori Komatani, Mikio Nakano, Masaki Katsumaru, Kotaro Funakoshi, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Allocation of Training Data for Speech Understanding based on Multiple Model Combinations, IEICE Transactions on Information and Systems, Vol.E95-D, No.9 (Sep. 2012) pp.2298-2307. pdf (学会サーバ）
Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Long-Term Analysis of User Behaviors in Deployed Spoken Dialogue System Dialogue & Discourse, conditionally accepted pending required revisions, May 21, 2012.
Akira Maezawa, Katsutoshi Itoyama, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automated Violin Fingering Transcription Through Analysis of an Audio Recording, Computer Music Journal, Fall 2012, Vol.36, No.3, Pages 57-72 Posted Online August 14, 2012 doi:10.1162/COMJ_a_00129 (Free at MIT Press) IF: 0.756
Shun Nishide, Jun Tani, Toru Takahashi, Hiroshi G. Okuno, Tetsuya Ogata: Tool-Body Assimilation of Humanoid Robt using Neuro-Dynamical System, IEEE Transactions on Autonomous Mental Development, Vol.4, Issue:2 (june 2012) pp.139-149, 2012. doi:10.1109/TAMD.2011.2177660 IF: 2.170
章分担・解説
Angelica Lim: Musical Robots and Interactive Multimodal Systems, Book Review, International Journal of Synthetic Emotions, Vol. 3, No. 2 (2012) 84-86. doi: 10.4018/jse.2012070105
奥乃博: 数独問題の難易度定義とそれに基づく問題自動生成法の研究, 中山隼雄科学技術文化財団20周年記念誌，2012.
Kohei Nagira, Takuma Otsuka, Tetsuya Ogata, Hiroshi G. Okuno: Infinite Sparse Factor Analysis for Blind Source Separation in Reverberant Environments, SSPR/SPR2012, Lecture Notes in Computer Science, Vol. 7626, pp.638-647, Nov. 7-9. Hiroshima, Japan. doi: 10.1007/978-3-642-34166-3_70
Angelica Lim, Hiroshi G. Okuno: Using speech data to recognize emotion in human gait, Human Behavior Understanding, A.A. Salah et al. (Eds): Human Behavior Understanding 2012, Lecture Notes in Computer Science, Vol.7559, pp.52-64, Springer, Algarve, Portgul, October 7, 2012. acceptance rate 42%. Abstract doi: 10.1007/978-3-642-34014-7_5
Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Chord Recognition Based on Probabilistic Integration of Acoustic Features and Chord Transition, He Jiang et al. (Eds.): Advanced Research in Applied Artificial Intelligence, IEA/AIE-2012, pp.58-67, LNAI Vol.7345. Springer. June 9-12, Dalian, China. doi: 10.1007/978-3-642-31087-4_7
Takeshi Mizumoto, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Adaptive Pitch Control for Robot Thereminist using Unscented Kalman Filter. H. Jiang, M. Ali, and M. Li (Eds.), Modern Advances in Intelligent Systems and Tools, Studies in In Computational Intelligence, pp.19-24, Springer. June 9-12, Dalian, China, 2012. (IEA/AIE-2012) doi: 10.1007/978-3-642-30732-4_3
水本武志, 粟野皓光, 坂東宣昭, 3Dプリンタで遊ぼう， 情報処理, 「夏休み自作自習小特集」, Vol.53, No.8 (Aug. 2012) 情報処理学会 http://id.nii.ac.jp/1001/00082771/
奥乃博: 編集にあたって, 情報処理, 「夏休み自作自習小特集」, Vol.53, No.8 (Aug. 2012) 情報処理学会 http://id.nii.ac.jp/1001/00082770/
奥乃博, 中臺一博, 水本武志: 混合音を聞き分けるセンシング技術, 電子情報通信学会学会誌, 人間を理解するためのICT技術特集 2-2, Vol.95, No.5 (May 2012) pp.401-404, 電子情報通信学会.
後藤真孝, 奥乃博: 編集にあたって, 情報処理, 特集号「CGMの現在と未来」, Vol.53, No.5 (May 2012) pp.464-465, 情報処理学会電子図書館
国際会議論文
Naoki Hirayama, Shinsuke Mori, Hiroshi G. Okuno: Statistical Method of Building Dialect Language Models for ASR Systems, Proceedings of the 24th International Conference on Computational Linguistics (Coling-2012), 1179-1194, Mumbai, India, Dec. 8-15, 2012.
Tatsuhiko Itohara, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: Improvement of Audio-Visual Score Following in Robot Ensemble with Human Guitarist, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2012), accepted as oral (acceptance rate 57% = 133/233), IEEE, Osaka, Nov. 30 - Dec. 1, 2012. doi 10.1109/HUMANOIDS.2012.6651577
Hiroshi G. Okuno: Human Robot Interaction through Robot Audition, Keynote, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012) Workshop on Motivational Aspect of Robotics in Physical Therapy, Vilamoura, Algarve, Portgul, October 12, 2012.
Keita Mochizuki, Harumitsu Nobuta, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Developmental Human-Robot Imitation Learning with Phased Structuring in Neuro Dynamical Systems, Proceedings of IROS-2012 Workshop on Cognitive Neuroscience Robotics, Pos-3, 6 pages, IEEE, RSJ, Vilamoura, Algarve, Portgul, October 12, 2012.
Yuki Yamaguchi, Harumitsu Nobuta, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Developmental Human-Robot Imitation Learning with Phased Structuring in Neuro Dynamical Systems, Proceedings of IROS-2012 Workshop on Cognitive Neuroscience Robotics, PM2-3, 6 pages, IEEE, RSJ, Vilamoura, Algarve, Portgul, October 12, 2012.
Takeshi Mizumoto, Tetsuya Ogata, Hiroshi G. Okuno: Who is the leader in a multiperson ensemble? ---Multiperson human-robot ensemble model with leaderness---, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.1413-1419 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. doi: 10.1109/IROS.2012.6385782
Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Luis Paulo Reis, Fabien Gouyon, Live Assessment of Beat Tracking for Robot Audition, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.992-997 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. doi 10.1109/IROS.2012.6386100
Takuma Otsuka, Katsutoshi Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: Unified Auditory Functions based on Bayesian Topic Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.2370-2376 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. doi: 10.1109/IROS.2012.6385787
Yusuke Yamamura, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Unified Auditory Functions based on Bayesian Topic Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), pp.2364-2369 (812/1801=45.0%), IEEE, RSJ, Vilamoura, Algarve, Portgul, October 7-12, 2012. doi: 10.1109/IROS.2012.6385765
Hiroshi G. Okuno: Human Robot Interaction through Robot Audition Keynote, Workshop on Motivational Aspect of Robotics in Physical Therapy. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2012), Vilamoura, Algarve, Portgul, October 12, 2012.
Daichi Sakaue, Takuma Otsuka, Katsutoshi Itoyama, Hiroshi G. Okuno: Bayesian Nonnegative Harmonic-Temporal Factorization and Its Application to Multipitch Analysis Proceedings of 13th International Society for Musical Information Retrieval Conference (ISMIR-2012), pp.91-96, Porto, Portgul, Oct, 2012.
Joao Lobato Oliveira, Gokhan Ince, Keisuke Nakamura, Kazuhiro Nakadai, Hiroshi G. Okuno, Luis Paulo Reis, Fabien Gouyon, An Active Audition Framework for Auditory-driven HRI: Application to Interactive Robot Dancing, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2012), pp.1078-1085, IEEE, Paris, Sep 9-13, 2012. doi: 10.1109/ROMAN.2012.6343892
Takuya Yoshioka, Daichi Sakaue: Log-normal matrix factorization with application to speech-music separation, Proceedings of SAPA-SCALE Conference 2012, pp.80-85, Portland, OR, 7-8 September, 2012.
Ikkyu Aihara, Takeshi Mizumoto, Takuma Otsuka, Hiromitsu Awano, Hiroshi G. Okuno, Kazuyuki Aihara: Possible Functions of Call Alternation in Frog Choruses, Tenth International Congress of Neuroethology, accepted, Aug. 5-10, 2012, University of Maryland, College Park, MD, USA. (poster) doi: 10.3389/conf.fnbeh.2012.27.00267
Takeshi Mizumoto, Hiromitsu Awano, Ikkyu Aihara, Takuma Otsuka, Hiroshi G. Okuno: Sound imaging system for visualizing multiple sound sources from two species, Tenth International Congress of Neuroethology, accepted, Aug. 5-10, 2012, University of Maryland, College Park, MD, USA. (poster) doi: 10.3389/conf.fnbeh.2012.27.00247
Takuma Otsuka, Katsuhiko Ishiguro, Hiroshi Sawada, Hiroshi G. Okuno: Bayesian Unification of Sound Source Localization and Separation with Permutation Resolution, Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence (AAAI-12), 2038-2045 (26%, 294/1129), July 22-26 (26), 2012, Toronto, Canada. AAAI server
Harumitsu Nobuta, Kenta Kawamoto, Kuniaki Noda, Kohtaro Sabe, Hiroshi G. Okuno, Tetsuya Ogata: Body area segmentation from visual scene based on predictability of neuro-dynamical system, Proc. of the 2012 International Joint Conference on Neural Networks (IJCNN 2012), pp.1-8, Brisbane, Australia, June 10-15, 2012. doi:10.1109/IJCNN.2012.6252530
Shun Nishide, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Self-organization of Object Features Representing Motion Using Multiple Timescales Recurrent Neural Network, Proc. of the 2012 International Joint Conference on Neural Networks (IJCNN 2012), pp.1-8, Brisbane, Australia, June 10-15, 2012. doi:10.1109/IJCNN.2012.6252714
Luis-Kenzo Furuya Cahier, Tetsuya Ogata, Hiroshi G. Okuno: Incremental Probabilistic Geometry Estimation for Robot Scene Understanding, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2012), pp.3265-3630, (acceptance rate 40%), May 14-18, 2012, St. Paul, MN. doi: 10.1109/ICRA.2012.6225343
口頭発表（研究会・全国大会）
池宮由楽, 阪上大地, 糸山克寿, 奥乃博: 歌声F0 生成過程とメロディ分離手法に基づく楽譜逸脱成分推定, 情報処理学会第75回全国大会, 3R-9, Mar. 2013. 東北大学.
田島照久, 阪上大地, 糸山克寿, 奥乃博: 単音の音量ダイナミクスを共有化したNMFによる楽器パート分離, 情報処理学会第75回全国大会, 3R-10, Mar. 2013. 東北大学.
矢澤一樹, 阪上大地, 糸山克寿, 奥乃博: ギター演奏からの押弦パターン・発音時刻・フォーム変化時間制約を用いたタブ譜自動生成システム, 情報処理学会第75回全国大会, 4R-3, Mar. 2013. 東北大学.
阪上大地, 大塚琢馬, 糸山克寿, 奥乃博: 非負値調波時間構造因子分解法に基づく音楽音響信号の多重基本周波数解析, 情報処理学会第75回全国大会, 4T-8, Mar. 2013. 東北大学.
JOOYOUNG AHN, 糸山克寿, Louis-Kenzo Cahier, 奥乃博: Score Following of Human Accompaniment using a Lead-sheet for an Artificial Lead Singer, 情報処理学会第75回全国大会, Mar. 2013. 東北大学.
情報処理学会第75回全国大会学会推奨修士論文認定, 2013年5月.
古川孝太郎, 奥谷啓太, 中臺一博, 柳楽浩平, 大塚琢馬, 奥乃博: クアドロコプターを用いた飛行雑音に頑健な音源定位, 情報処理学会第75回全国大会, 4T-7, Mar. 2013. 東北大学.
情報処理学会第75回全国大会学会推奨卒業論文認定, 2013年5月.
坂東宣昭, 水本武志, 中臺一博, 奥乃博: チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定, 情報処理学会第75回全国大会, 3Y-1, Mar. 2013. 東北大学.
黄楊暘, 大塚琢馬, 中臺一博, 奥乃博: 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討, 情報処理学会第75回全国大会, 4T-2, Mar. 2013. 東北大学.
平山直樹, 森信介, 奥乃博: 方言対訳コーパスを用いた日本語方言変換システム, 情報処理学会第75回全国大会, 6T-5, Mar. 2013. 東北大学.
佐野正太郎, 大塚琢馬, 奥乃博: 音声Captcha の自動解析に向けたSingle Channel 混合音声の数字認識, 情報処理学会第75回全国大会, 4T-5, Mar. 2013. 東北大学. 学生奨励賞
柳楽浩平, 大塚琢馬, 奥乃博: Permutation-free infinite ICAによる周波数領域ブラインド音源分離, 情報処理学会第75回全国大会, Mar. 2013. 東北大学.
糸原達彦, 水本武志, 奥乃博: 音楽ロボットのための複数のビートトラッキングの結合手法とその有効性の検証, 情報処理学会第75回全国大会, 4T-4, Mar. 2013. 東北大学.
山口雄紀, 野田邦明, 西出俊, 奥乃博, 尾形哲也: 多層神経回路モデルによる共感覚現象の学習と連想, 情報処理学会第75回全国大会, Mar. 2013. 東北大学. 大会奨励賞
望月敬太, 西出俊奥乃博, 尾形哲也: 神経回路モデルを用いたロボットの描画運動における発達的模倣学習, 情報処理学会第75回全国大会, 1R-5, Mar. 2013. 東北大学. 学生奨励賞大会奨励賞
信田春満, 西出俊奥乃博, 尾形哲也: 再帰結合神経回路モデルを用いた予測可能性による段階的対象選択学習, 情報処理学会第75回全国大会, ３R-2, Mar. 2013. 東北大学. 学生奨励賞
藤田素子, 丸山晃央, 神崎護, 奥乃博: 音声録音データを用いた鳥類多様性評価の可能性, 日本生態学会第60回大会企画集会T-17『熱帯雨林における生物多様性MRVを確立するために』企画者：鮫島弘光 (京大東南研), 今井伸夫 (京大農森林生態), 北山兼弘 (京大農森林生態), 2013年3月6日, 静岡.
平山直樹, 森信介, 奥乃博: 方言対訳コーパスを用いた日本語方言音声認識システム, 第14回音声言語シンポジウム, 18-19 Dec. 2012.
信田春満, 河本献太, 野田邦昭, 佐部浩太郎, 西出俊, 奥乃博, 尾形哲也: 神経力学モデルによる自己身体領域抽出と視覚運動系の自己組織化, SI 2012, 福岡国際会議場, Dec. 19-21, 2012.
中村圭佑, 中臺一博, 奥乃博: 実時間超解像ロボット聴覚システムとその複数同時音声認識への応用, SI 2012, 福岡国際会議場, Dec. 19-21, 2012. 優秀講演賞
中村圭佑, 中臺一博, 奥乃博: ロボットのための実環境ロバストな実時間超解像三次元音源定位, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
黄楊暘, 大塚琢馬, 中臺一博, 奥乃博: 視覚情報との統合による音声区間検出および音声認識精度向上の検討, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
大塚琢馬, 石黒勝彦, 澤田宏, 奥乃博: ベイズモデルによるマイクロホンアレイ処理の移動ロボットへの応用, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
Uihyun Kim, Hiroshi G. Okuno: A Two Microphone-Based Approach for Multiple Speaker Localization on the SIG-2 Humanoid robot, 第36回 AI チャレンジ研究会, 人工知能学会, 東工大, Nov. 15. 2012.
糸原達彦, 奥乃博: ROS (Robot Operating System) を用いた音楽合奏ロボットシステムの構築（クラウドネットワークロボット）, 電子情報通信学会技術研究報告, 信学技法 112 (233), 33-36, Nov. 11, 2012. 沖縄科学技術大学院大学.
黄楊暘, 大塚琢馬, 中臺一博, 奥乃博: マイクロホンアレイを用いた複数人対話からの発話区間検出および話者方向推定の評価手法, 日本ロボット学会第30回学術講演会, 3D1-4, 札幌コンベンションセンター, Sep. 17-20, 2012.
水本武志, 尾形哲也, 奥乃博: 人とロボットの合奏のための多人数合奏の主導権推定, 日本ロボット学会第30回学術講演会, 3D2-3, 札幌コンベンションセンター, Sep. 17-20, 2012.
柳楽浩平, 大塚琢馬, 奥乃博: ノンパラメトリックベイズに基づくパーミュテーションのない周波数領域でのブラインド音源分離, 日本ロボット学会第30回学術講演会, 3D2-4, 札幌コンベンションセンター, Sep. 17-20, 2012.
大塚琢馬, 石黒勝彦, 澤田宏, 奥乃博: 移動ロボットによる音環境理解に向けて, 日本ロボット学会第30回学術講演会, 3D2-5, 札幌コンベンションセンター, Sep. 17-20, 2012.
糸原達彦, 奥乃博: 音楽ロボットとの合奏ための信頼度を用いたビートトラッキングの結合手法, 日本ロボット学会第30回学術講演会, 3D2-6, 札幌コンベンションセンター, Sep. 17-20, 2012.
西出俊, 奥乃博, 尾形哲也: 神経力学モデルによる自己身体領域抽出と視覚運動系の自己組織化, 日本ロボット学会第30回学術講演会, 3N1-7, 札幌コンベンションセンター, Sep. 17-20, 2012.
Uihyun Kim, Hiroshi G. Okuno: Reliable Speaker Localization using Signalto-Noise Ratio Information in Noise Environments for the SIG-2 Humanoid Robot, 日本ロボット学会第30回学術講演会, 4D1-4, 札幌コンベンションセンター, Sep. 17-20, 2012.
山口雄紀, 信田春満, 西出俊, 奥乃博, 尾形哲也: 神経力学モデルを用いたロボットの道具身体化機構, 日本ロボット学会第30回学術講演会, 4N3-3, 札幌コンベンションセンター, Sep. 17-20, 2012.
望月敬太, 信田春満, 西出俊奥乃博, 尾形哲也: 発達的模倣学習における神経力学モデルの段階的構造化と獲得プリミティブの解析, 日本ロボット学会第30回学術講演会, 4N3-4, 札幌コンベンションセンター, Sep. 17-20, 2012.
矢澤一樹, 阪上大地, 糸山克寿, 奥乃博: 押弦制約と運指制約を用いたタブ譜生成システム, 第96回音楽情報科学研究会, Vol.2012-MUS-96 (11), pp.1-7, 情報処理学会, Aug. 2, 2012.
阪上大地, 大塚琢馬, 糸山克寿, 奥乃博: ベイジアン非負値調波因子分解と多重基本周波数推定への応用 第96回音楽情報科学研究会, Vol.2012-MUS-96 (11), pp. 情報処理学会, Aug. 2, 2012.
平山直樹, 森信介, 奥乃博: 方言音声認識のための話し言葉言語モデル構築, NLP若手の会第7回シンポジウム, 4 Sep. 2012.
特許・ディジタルコンテンツ
Speech recognition system and method for generating a mask of the system. Inventors: Kazuhiro Nakadai, Toru Takahashi, Hiroshi Okuno, Patent No. US 8,392,185, Date of Patent: Mar. 5, 2013. Date of Application: Aug. 19, 2009.
Reverberation suppressing apparatus and reverberation suppressing method . Inventors: Kazuhiro Nakadai, Hirofumi Nakajima, Hiroshi Okuno, and Ryu Takeda Patent No. US 8,391,505, Date of Patent: Mar. 5, 2013. Date of Application: Jun. 1, 2010.
Musical piece recommendation system and method . Inventors: Masataka Goto, Kazuyoshi Yoshii, Hiroshi Okuno, Patent No. US 8,370,277, Date of Patent: Feb. 5, 2013. Date of Application: Jul. 31, 2008.
音源分離システム, 音源分離方法及び音源分離用コンピュータプログラム, 発明者：糸山克寿, 奥乃博, 後藤真孝, 特許第5201602号, 登録日平成25年2月22日. 特願2009-511801号, 2009年4月14日.
音声認識装置及び音声認識装置のマスク生成法, 発明者：中臺一博, 高橋徹, 奥乃博, 特許第5180928号, 登録日平成25年1月18日. 特開2010-49249号, 2010年3月4日. 特願2009-185164号, 2009年8月7日.
音源分離システム, 発明者：武田龍, 中臺一博, 辻野広司, 奥乃博, 特許第5178370号, 登録日平成25年1月18日. 特開2009-42754号, 2009年2月26日. 特願2008-191382号, 2008年7月24日.
音源追跡システム，方法，およびロボット, 発明者：中臺一博, 辻野広司, 長谷川雄二, 奥乃博, 特許第5170440号, 登録日平成25年1月11日. WO2007/129731, 2007年11月15日. 特願2008-514510号, 2007年5月9日. PCT/JP2007/059599
音源定位システム及び音源定位方法，発明者: 中臺一博, 奥乃博, 大塚琢馬, 特開2013-44950号, 2013年3月4日. 特願2011-182774号, 2011年8月24日.
Sound source tracking system, method and robot. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, yuji Hasegawa, Hiroshi Okuno, Patent No. US 8,155,331, Date of Patent: Apr. 10, 2012. Date of Application: May 9, 2007.
文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松俊, 駒谷和範, 奥乃博, 特許第5167546号, 登録日平成25年1月11日. 特願2008-530812号, 2007年3月16日. 出願者: 京都大学
ロボット, 発明者：中臺一博, 長谷川雄二, 辻野広司, 村田和真, 武田龍, 奥乃博, 特許第5150573号, 登録日平成24年12月7日. 特開2010-026513号, 2010年2月4日. 特願2009-166049号, 2009年7月14日.
音分離装置、及び、それを備えたカメラユニット. 発明者：梅田修志, 堀邊隆介, 奥乃博, 高橋徹. 特開2012-238964号, 2012年12月6日. 特願2011-105404号, 2011年5月10日.
音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法, 発明者: 藤原弘将, 奥乃博, 後藤真孝, 特許第5131904号，登録日: 2012年11月16日．特開2008-134606号, 2008年6月12日. 特願2007-233682号, 2007年9月10日.
Language Understanding Device. Inventors: Mikio Nakano, Hiroshi Okuno, Kazunori Komatani, Yuichiro Fukubayashi, Kotaro Funakoshi. Patent No. US 8,244,522, Date of Patent: Aug. 14, 2012. Date of Application: May 20, 2008.
Sound source separation system, sound source separation method, and computer program for sound source separation. Inventors: Katsutoshi Itoyama, Hiroshi Okuno, and Masataka Goto. Patent No. US 8,239,052, Date of Patent: Aug. 7, 2012. Date of Application: Apr. 14, 2008.
楽譜位置推定装置、及び楽譜位置推定方法, 発明者: 中臺一博, 大塚琢馬, 奥乃博特開2012-168538号, 2012年9月6日. 特願2012-29802号, 2012年2月14日
言語理解装置, 発明者: 中野幹生, 奥乃博, 福林雄一朗, 船越孝太郎, 特許第5066483号，登録日: 2012年8月17日．特開2008-293019号, 2008年12月4日. 特願2008-134401号, 2008年5月22日.
Moving Object Equipped with Ultra-Directional Speaker. Masamitsu Ishii, Shinichi Sakai, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, Europian Patent EP 1,715,717, Publication Date: 04/18/2012 Filing Date: 02/10/2005
Sound source tracking system, method and robot. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Yuji Hasegawa, and Hiroshi Okuno. Patent No. US 8,155,331, Date of Patent: Apr. 10, 2012. Date of Application: May 9, 2007.

2012年度  ２０１１年度（奥乃・尾形研究室） 2010年度

学位論文

平澤恭治 : Under-Determined Blind Speech Separation Using a GMM-Based Sound Spectral Model. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
西川直毅: 音楽情報検索のための歌詞と音響特徴量を用いた楽曲印象軌跡推定. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
阿曽慎平: 歌声話声自動識別及び歌声の話声自動変換への応用. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
Angelica Lim: Design and Implementation of Emotions for Humanoid Robots based on the Modality-independent DESIRE Model. 修士論文 (指導教員: 奥乃博教授), Feb. 2012.
高野秀樹: 信頼度による調選択を用いた転調に適応可能な音楽音響信号に対する自動和音進行認識システム, 修士論文 (指導教員: 奥乃博教授), Aug. 2011.
山川暢英: 突発性音事象の Matching Pursuit と Formant-wave function による認識とその擬音語変換のための特徴量設計と音源適応, 修士論文 (指導教員: 奥乃博教授), Aug. 2011.
平山直樹: 共通語を中間言語とするWFSTを用いた日本語方言変換システム卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2012.
山村祐介: 同時複数音源に対する擬音語による音源選択システム卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2012.
黄楊暘: 音声特徴を用いるパーティクルフィルタによる複数音源追跡の精度向上卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2012.
望月敬太: 段階的に構造化する神経力学モデルを用いた人間とロボットの発達的模倣学習卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2012.
山口雄紀: 神経力学モデルを用いた道具身体化モデルによる道具機能表現の獲得卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2012.
壷内将之: 軟関節をもつ人間型ロボットにおける神経力学モデルを用いたダイナミック動作の学習卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2012.
査読つきジャーナル論文
Angelica Lim, Takeshi Mizumoto, Tetsuya Ogata, Hiroshi G. Okuno: A musical robot that synchronizes with a co-player using non-verbal cues, Advanced Robotics, Special Issue on Cutting Edge of Robtics in Japan, Vol.26, Issue 3-4 (Jan. 2012) pp.363-381. doi:10.1163/156855311X614626 IF: 0.510
Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: Towards expressive musical robots: A cross-modal framework for emotional gesture, voice and music, EURASIP Journal on Audio, Speech, and Music Processing, 2012:3, Published: 17 January 2012. doi:10.1186/1687-4722-2012-3 IF: 0.382
Tatsuhiko Itohara, Takuma Otsuka, Takeshi Muzumoto, Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: A multi-modal tempo and beat tracking system based on audio-visual information from live guitar performances. EURASIP Journal on Audio, Speech, and Music Processing, 2012, 2012:6, Published: 20 January 2012. doi:10.1186/1687-4722-2012-6 IF: 0.382
Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Efficient Blind Dereverberation and Echo Cancellation based on Independent Component Analysis for Actual Acoustic Signals, Neural Computation, Vol.24, Issue 1 (Jan. 2012) pp. 234-272, MIT Press. doi:10.1162/NECO_a_00219 Posted online Dec. 9, 2011. IF: 2.290
Tsuyoshi Tasaki, Fumio Ozaki, Nobuto Matsuhira, Tetsuya Ogata, Hiroshi G. Okuno: People Detection Based on Spatial Mapping of Friendliness and Floor Boundary Points for a Mobile Navigation Robot, Journal of Robotics, vol. 2011, Article ID 683975, 10 pages, 2011. doi:10.1155/2011/683975 Hindawi Publishing Corp.
駒谷和範, 松山匡子, 武田龍, 高橋徹, 尾形哲也, 奥乃博: 発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム， 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3374-3385, IPSJ. , DL
森信介, 駒谷和範, 勝丸真樹, 尾形哲也, 奥乃博: 音声対話システムにおける簡略表現認識のための自動語彙拡張， 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3398-3407. , DL
リムアンジェリカ, 水本武志, 大塚琢馬, 古谷ルイ賢造, 尾形哲也, 奥乃博: 音楽共演ロボット: 開始・終了キューの画像認識による人間のフルート奏者との実時間同期, 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3599-3610. , DL
安良岡直希, 吉岡拓也, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: フレーズ置換のための調波非調波GMM・ NMFに基づく音源分離・演奏合成, 情報処理学会論文誌, Vol.52, No.12 (Dec., 2011) pp.3839-3852, IPSJ. , DL
Hiromasa Fujihara, Masataka Goto, Jun Ogata, Hiroshi G. Okuno: LyricSynchronizer: Automatic Synchronization Method Between Musical Audio Signals and Lyrics, IEEE Journal of Selected Topics in Signal Processing, Vol.5, No.6 (Oct. 2011) pp.1252-1261, doi:10.1109/JSTSP.2011.2159577
Tetsuya Ogata, Tetsuo Sawaragi, Tadahiro Taniguchi: Preface, Advanced Robotics, Vol.25, Issue 17 (Jan. 2011) pp. 2125-2126. doi:10.1163/016918611X59476
Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno: Classification of Known and Unknown Environmental Sounds based on Self-organized Space using Recurrent Neural Network, Advanced Robotics, Vol.25, Issue 17 (Jan. 2011) pp. 2127-2141. doi:10.1163/016918611X595017
Shun Nishide, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Towards Written Text Recognition based on Handwriting Experiences using Recurrent Neural Network, Advanced Robotics, Vol.25, Issue 7 (Jan. 2011) pp.2173-2187. doi:10.1163/016918611X595026
Takeshi Mizumoto, Ikkyu Aihara, Takuma Otsuka, Ryu Takeda, Kazuyuki Aihara, Hiroshi G. Okuno: Sound imaging of nocturnal animal calls in their natural habitat, Journal of Comparative Physiology A: Neuroethology, Sensory, Neural, and Behavioral Physiology, Vol.197, No.9, 915-921, Online First, 17 May 2011. doi:10.1007/s00359-011-0652-7 , html, Supplementary material at MetaPress.
Wataru Hinoshita, Horiaki Arie, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Emergence of Hierarchical Structure mirroring Linguistic Composition in a Recurrent Neural Network, Neural Networks, Vol.24, Issue 4 (May 2011) pages 311-320, Elsevier. doi:10.1016/j.neunet.2010.12.006
中臺一博, 奥乃博: ロボット聴覚用オープンソースソフトウェア HARKの展開, デジタルプラクティス, 特集「世界に飛び出す日本のソフトウエア」, Vol.2, No.2 (Apr. 2011) pp.133-140, 情報処理学会.
須見康平, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: ベース音高と和音特徴の統合に基づく和音系列認識, 情報処理学会論文誌, Vol.52, No.4 (Apr. 2011) pp.1803-1812. , , DL
章分担・解説
Kohei Nagira, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Complex Extension of Infinite Sparse Factor Analysis for Blind Source Separation of Speech Signals, F. Theis et al. (Eds.): LVA/ICA 2012, Lecture Notes in Computer Science 7191, pp. 388-396, 2012. Tel-Aviv, Israel, Mar. 12-15, 2012. doi:10.1007/978-3-642-28551-6_48
Yasuharu Hirasawa, Naoki Yasuraoka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: A GMM Sound Source Model for Blind Speech Separation in Under-determined Condisions, F. Theis et al. (Eds.): LVA/ICA 2012, Lecture Notes in Computer Science 7191, pp. 446-453, 2012. Tel-Aviv, Israel, Mar. 12-15, 2012. doi:10.1007/978-3-642-28551-6_55
Hiromitsu Awano, Shun Nishide, Hiroaki, Arie, June Tani, Hiroshi G. Okuno, Tetsuya Ogata: Use of a Sparse Structure to Improve Learning Performance of Recurrent Neural Networks, Neural Information Processing, Lecture Notes in Computer Science, Vol.7064, pp.323-331, Springer-Verlag, Shanghei, Nov. 13-17, 2011. doi:10.1007/978-3-642-24965-5_36
Kazunori Komatani, Kyoko Matsuyama, Ryu Takeda, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Spoken Dialogue System that uses Utterance Timing to Interprete User Utterances, R.L-C. Delgado and T. Kobayashi (Eds.): Proceedings of the Paralinguistic Information and its Integration in Spoken Dialogue Systems Workshop, pp.315-326, Springer, Sep. 2011. doi:10.1007/978-1-4614-1335-6
湯淺太一, 奥乃博, 尾形哲也: ぺた語義: 京大における Lisp を使ったプログラミング教育, 情報処理, Vol.52, No.9 (Sep. 2011), pp.1191-1194, 情報処理学会．電子図書館
奥乃博: 東日本大震災危機発生時の対応について考える: 15.災害復旧支援・原子力事故対策ロボット, 情報処理, Vol.52, No.9 (Sep. 2011) pp.1090-1091, 情報処理学会. 電子図書館
奥乃博: ロボット聴覚，日本ロボット学会編『ロボットテクノロジー』304p, オーム社, 2011.
Yasuharu Hirasawa, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Robot with Two Ears Listens to More Than Two Simultaneous Utterances by Exploiting Harmonic Structures, K.G. Mehrotra et al. (Eds.): Modern Approaches in Applied Intelligence (IEA/AIE-2011), LNAI 6703, pp.348-358. Springer. Syracuse, NY, June 28 - July 1, 2011. doi: 10.1007/978-3-642-21822-4_35
Nobuhide Yamakawa, Toru Takahashi, Tetsuro Kitahara, Tetsuya Ogata, Hiroshi G. Okuno: Environmental Sound Recognition for Robot Audition using Matching-pursuit, Modern Approaches in Applied Intelligence (IEA/AIE-2011), LNAI 6704, pp.1-10. Springer. Syracuse, NY, June 28 - July 1, 2011. doi: 10.1007/978-3-642-21827-9_1
Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno: Cluster Self-organization of Known and Unknown Environmental Sounds using Recurrent Neural Network, T. Honkela, W. Duch, M. A. Girolami, S. Kaski (Eds.): Artificial Neural Networks and Machine Learning - ICANN 2011, LNCS 6791, pp.167-175, Springer, (58%, 108/185), Espoo, Finland, June 14-17, 2011. doi:10.1007/978-3-642-21735-7_21
Hiroshi G. Okuno, Kazuhiro Nakadai, Hyun-Don Kim: Robot Audition: Missing Feature Theory Approach and Active Audition, K. Pradalier, R. Siegward, and G. Hirzinger (Eds.): Robotics Research, STAR 70, pp.227-244, Springer-Verlag. doi:10.1007/978-3-642-19457-3_14
国際会議論文
Daichi Sakaue, Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: INITIALIZATION-ROBUST MULTIPITCH ESTIMATION BASED ON LATENT HARMONIC ALLOCATION USING OVERTONE CORPUS, Proceedings of 2012 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2012), pp.425-428, IEEE, Kyoto, Japan, March 25-30, 2012. doi: 10.1109/ICASSP.2012.6287907
Harumitsu Nobuta, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Identification of self-body based on dynamic predictability using neuro-dynamical system, Proceedings of 2011 IEEE/SICE International Symposium on System Integration (SII 2011), pp.256-261, Dec. 20-22, 2011, Kyoto. doi: 10.1109/SII.2011.6147456
Shotaro Sano, Shun Nishide, Hiroshi G. Okuno, Tetsuya Ogata: Predicting Listener Back-Channels for Human-Agent Interaction using Neuro-dynamical Model, Proceedings of 2011 IEEE/SICE International Symposium on System Integration (SII 2011), pp.18-23, Dec. 20-22, 2011, Kyoto. doi:10.1145/10.1109/SII.2011.6147412
Naoki Nishikawa, Hiromasa Fujihara, Masataka Goto, Katsutoshi Itoyama, Tetsuya Ogata, Hiroshi G. Okuno: A Musical Mood Trajectory Estimation Method Using Lyrics and Acoustic Features, Proceedings of International ACM Workshop on Music Information Retrieval with User-Centered and Multimodal Strategies (MIRUM'11), 51-56, ACM, Nov. 28 - Dec. 1, 2011, Scottsdale, AZ. doi:10.1145/2072529.2072543
Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: Converting emotional voice to motion for robot telepresence, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2011), 472-479 IEEE, Bled, Slovenia, Oct. 26-28, 2011. doi:10.1109/Humanoids.2011.6100891
Takuma Otsuka, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: Incremental Bayesian Audio-to-Score Alignment with Flexible Harmonic Structure Models, Proceedings of 12th International Society for Musical Information Retrieval Conference (ISMIR-2011), pp.525-530 Miami, FL, Oct. 24-28. 2011. PDF
Angelica Lim, Takeshi Muzumoto, Takuma Otsuka, Tatsuhiko Itohara, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: More cowbell! A musical ensemble with the NAO thereminist, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), IROS 2011 Standard Platform Demo, IEEE, RSJ, San Francisco, 25-30 Sep. 2011.
Tatsuhiko Itohara, Takeshi Muzumoto, Takuma Otsuka, Tetsuya Ogata, Hiroshi G. Okuno: Particle-filter Based Audio-visual Beat-tracking for Music Robot Ensemble with Human Guitarist, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), pp.118-124, (790/2459 =32.1%), IEEE, RSJ, San Francisco, 25-30 (26) Sep. 2011. doi:10.1109/IROS.2011.6094773 IEEE Robotics and Automation Society Japan Chapter Young Award
Eui-Hyun Kim, Takeshi Muzumoto, Tetsuya Ogata, Hiroshi G. Okuno: Improvement of Speaker Localization by Considering Multipath Interference of Sound Wave for Binaural Robot Audition, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), pp.2910-2915, (790/2459 =32.1%), IEEE, RSJ, San Francisco, 25-30 Sep. 2011. doi:10.1109/IROS.2011.6094778
Patrick Danes, Hiroshi G. Okuno: An Overview of the BINAAHR Project, Semi-Plenary Invited Talk, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2011), 26 Sep. 2011.
Shun Nishide, Jun Tani, Hiroshi G. Okuno, Tetsuya Ogata: Handwriting Prediction Based Character Recognition using Recurrent Neural Network, Proceeding of IEEE International Conference on Systems, Man, and Cybernetics (SMC 2011), pp.2549-2554, 9-12 Oct. 2011. doi:10.1109/ICSMC.2011.6084060
Takuma Otsuka, Kazuhiro Nakadai, Tetsuya Ogata, Hiroshi G. Okuno: Bayesian Extension of MUSIC for Sound Source Localization and Tracking, Proceedings of International Conference on Spoken Language Processing (Interspeech 2011), pp.3109-3112, (oral), Aug. 30, 2011. Florence, Italy.
Yasuharu Hirasawa, Naoki Yasuraoka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Fast and simple iterative algorithm of Lp-norm minimization for under-determined speech separation, Proceedings of International Conference on Spoken Language Processing (Interspeech 2011), pp.1745-1748, Florence, Italy, Aug. 29, 2011.
Mikio Nakano, Shun Sato, Kazunori Komatani, Kyoto Matsuyama, Kotaro Funakoshi, Hiroshi G. Okuno: A Two-Stage Domain Selection Framework for Extensible Multi-Domain Spoken Dialogue Systems, Proceedings of the 12th SIGDIAL Meeting on Discourse and Dialogue (SIGDIAL 2011), pp.18-29, accepted as an oral presentation, June 17-18, 2011, Portland, OR, USA. Best paper award nomination finalist (4 papers)
Katsutoshi Itoyama, Masataka Goto, Tetsuya Ogata, Hiroshi G. Okuno: SIMULTANEOUS PROCESSING OF SOUND SOURCE SEPARATION AND MUSICAL INSTRUMENT IDENTIFICATION USING BAYESIAN SPECTRAL MODELING, Proceedings of 2011 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.3816-3819, Poster, IEEE, Prague, Czech Republic, May 22-28, 2011. doi:10.1109/ICASSP.2011.5947183
Akira Maezawa, Hiroshi G. Okuno, Tetsuya Ogata, Masataka Goto: POLYPHONIC AUDIO-TO-SCORE ALIGNMENT BASED ON BAYESIAN LATENT HARMONIC ALLOCATION HIDDEN MARKOV MODEL, Proceedings of 2011 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.185-188, Poster, IEEE, Prague, Czech Republic, May 22-28, 2011. doi:10.1109/ICASSP.2011.5946371
Naoki Yasuraoka, Hirokazu Kameoka, Takuya Yoshioka, Hiroshi G. Okuno: I-DIVERGENCE-BASED DEREVERBERATION METHOD WITH AUXILIARY FUNCTION APPROACH, Proceedings of 2011 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2011), pp.369-372, Poster, IEEE, Prague, Czech Republic, May 22-28, 2011. doi:10.1109/ICASSP.2011.5946417
Takeshi Mizumoto, Takami Yoshida, Kazuhiro Nakadai, Ryu Takeda, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno: Design and Implementation of Selectable Sound Separation on a Texai Telepresence System using HARK, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2011), pp.2130-2137, May 9-13 (10), 2011, Shanghai, China. doi:10.1109/ICRA.2011.5979849
口頭発表（研究会・全国大会）
阪上大地, 吉岡拓也, 奥乃博: 占有的基底インデクスを用いた対数正規行列分解に基づく音声と音楽の分離, 日本音響学会2012年春季研究発表会, 13 Mar. 2012. 東京.
西川直毅, 糸山克寿, 藤原弘将, 後藤真孝, 尾形哲也, 奥乃博: 楽曲印象軌跡に基づく楽曲検索システムの実装と評価, 情報処理学会第74回全国大会, 1S-7, 6 Mar. 2012. 名古屋工業大学. 学生奨励賞
情報処理学会第74回全国大会学会推奨修士論文認定, 2012年5月.
山口雄紀, 信田春満, 西出俊, 奥乃博, 尾形哲也: 神経回路モデルを用いた道具身体化モデルによる道具機能表現の獲得, 情報処理学会第74回全国大会, 4Q-3, 7 Mar. 2012. 名古屋工業大学. 学生奨励賞
矢澤一樹, 阪上大地, 糸山克寿, 尾形哲也, 奥乃博: 押弦制約付きギター演奏自動採譜システム, 情報処理学会第74回全国大会, 4S-6, 7 Mar. 2012. 名古屋工業大学.
阪上大地, 糸山克寿, 尾形哲也, 奥乃博: 倍音コーパスを用いた初期値依存性の低い多重基本周波数推定法, 情報処理学会第74回全国大会, 4S-7, 7 Mar. 2012. 名古屋工業大学. 学生奨励賞
柳楽浩平, 高橋徹, 尾形哲也, 奥乃博: Complex Infinite Sparse Factor Analysisによる周波数領域での音声信号のブラインド音源分離, 情報処理学会第74回全国大会, 4U-1, 7 Mar. 2012. 名古屋工業大学. 学生奨励賞
平澤恭治, 安良岡直希, 高橋徹, 尾形哲也, 奥乃博: マイク数以上の同時発話分離のための調波：非調波音源モデルの検討. 情報処理学会第74回全国大会, 4U-2, 7 Mar. 2012. 名古屋工業大学.
黄楊暘, 大塚琢馬, 高橋徹, 尾形哲也, 奥乃博: パーティクルフィルタを用いた動的環境下の複数音源追跡, 情報処理学会第74回全国大会, 4U-4, 7 Mar. 2012. 名古屋工業大学.
山村祐介, 高橋徹, 尾形哲也, 奥乃博: 複数音源下での擬音語による音源選択システム, 情報処理学会第74回全国大会, 4U-7, 7 Mar. 2012. 名古屋工業大学.
壷内将之, 尾形哲也, 奥乃博, 西出俊, 信田春満: 柔軟関節をもつ人間型ロボットにおける神経力学モデルを用いたダイナミック動作の模倣, 情報処理学会第74回全国大会, 5P-7, 8 Mar. 2012. 名古屋工業大学.
信田春満, 河本献太, 野田邦昭, 佐部浩太郎, 奥乃博, 尾形哲也: 再帰型神経回路モデルを用いた視野変化予測と場所知覚ニューロンの発現, 情報処理学会第74回全国大会, 5P-8, 8 Mar. 2012. 名古屋工業大学. 学生奨励賞
Angelica Lim, 尾形哲也, 奥乃博: The DESIRE Model: Cross-modal emotion analysis and expression for robots, 情報処理学会第74回全国大会, 5ZA-4, 8 Mar. 2012. 名古屋工業大学. 学生奨励賞
望月敬太, 信田春満, 西出俊奥乃博, 尾形哲也: 段階的に構造化する神経回路モデルを用いたロボットと人間の発達的インタラクション, 情報処理学会第74回全国大会, 5ZA-5, 8 Mar. 2012. 名古屋工業大学.
平山直樹, 高橋徹, 尾形哲也, 奥乃博: 発話中の方言変化に頑健な方言変換システム, 情報処理学会第74回全国大会, 6U-8, 8 Mar. 2012. 名古屋工業大学. 学生奨励賞
阿曽慎平, 齋藤毅, 後藤真孝, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: アクセント特徴量を用いた歌声と朗読音声の識別システム, 情報処理学会第74回全国大会, 6U-9, 8 Mar. 2012. 名古屋工業大学.
阿曽慎平, 齋藤毅, 後藤真孝, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: スペクトル変化量のピーク間隔・F0・MFCCを用いた歌声と朗読音声の自動識別システム, 第94回音楽情報科学研究会, Vol.2012-MUS-94, pp. 舘山寺温泉, 情報処理学会, Feb. 2012.
安良岡直希, 奥乃博: 調波・非調波・音色構造因子分解による音響信号分析と音源分離インターフェースへの応用, 第94回音楽情報科学研究会, Vol.2012-MUS-94, pp. 舘山寺温泉, 情報処理学会, Feb. 2012.
糸山克寿, 尾形哲也, 奥乃博: 音響特徴・ベース音・和音遷移を用いた自動和音認識, 第94回音楽情報科学研究会, Vol.2012-MUS-94, pp. 舘山寺温泉, 情報処理学会, Feb. 2012.
柳楽浩平, 高橋徹, 尾形哲也, 奥乃博: Infinite Sparse Factor Analysis の複素拡張による音声信号のブラインド音源分離, 日本音響学会関西支部第14回若手研究者交流研究発表会, Dec. 18, 2011, 若手優秀賞・関西支部長賞
大塚琢馬, 中臺一博, 尾形哲也, 奥乃博: 音源定位手法MUSICのベイズ拡張, 第34回 AI チャレンジ研究会, SIG-Challenge-B102-6, pp.4-25~4-30, 人工知能学会, Dec. 2011. 慶応義塾大学.
柳楽浩平, 高橋徹, 尾形哲也, 奥乃博: ブラインド音源分離のためのInfinite Sparse Factor Analysisの複素拡張, 第34回 AI チャレンジ研究会, SIG-Challenge-B102-9, pp.4-43~4-48, 人工知能学会, Dec. 2011. 慶応義塾大学.
糸原達彦, 水本武志, Angelica Lim, 大塚琢馬, 中村圭佑, 長谷川雄二, 中臺一博, 尾形哲也, 奥乃博: マルチロボットによるKinectを用いた同期合奏, 第34回 AI チャレンジ研究会, SIG-Challenge-B102-10, pp.4-49~4-54, 人工知能学会, Dec. 2011. 慶応義塾大学.
Angelica Lim, 水本武志, 大塚琢馬, 糸原達彦, 中臺一博, 尾形哲也, 奥乃博: An interactive musical ensemble with the NAO Thereminist, 第34回 AI チャレンジ研究会, SIG-Challenge-A, pp. 人工知能学会, Dec. 2011. 慶応義塾大学.
Uihyun Kim, Tetsuya Ogata, Hiroshi G. Okuno: Improved Statistical Model-Based Voice Activity Detection with Noise Reduction for the SIG-2 Humanoid Robot, 日本ロボット学会第29回学術講演会, 1Q1-7, 芝浦工業大学, Sep. 7-9, 2011.
Louis Kenzo Cahier, Tetsuya Ogata, Hiroshi G. Okuno: Fast Incremental Probabilistic Surface Recognition for Robot Scene Understanding, 日本ロボット学会第29回学術講演会, 1Q2-3, 芝浦工業大学, Sep. 7-9, 2011.
Angelica Lim, Tetsuya Ogata, Hiroshi G. Okuno: Improving social telepresence by converting emotional voice to robot gesture, 日本ロボット学会第29回学術講演会, 1Q3-7, 芝浦工業大学, Sep. 7-9, 2011.
Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Nakamura Keisuke, Yoshida Takami, Mizumoto Takeshi Otsuka Takuma Ince Gohkan: Introduction to Open Source Robot Audition Software HARK, 日本ロボット学会第29回学術講演会, 2Q2-6, 芝浦工業大学, Sep. 7-9, 2011.
尾形哲也, 日下航, 奥乃博: 神経力学モデルによる文字列からの言語構造の自己組織化とロボット運動感覚との統合, 日本ロボット学会第29回学術講演会, 1A3-6, 芝浦工業大学, Sep. 7-9, 2011.
高橋徹, 中臺一博, 石井 Carlos 寿憲, Jani Even, 奥乃博: 実環境下での音源定位・音源検出の検討, 日本ロボット学会第29回学術講演会, 1F3-3, 芝浦工業大学, Sep. 7-9, 2011.
水本武志, 尾形哲也, 奥乃博: テルミン演奏ロボットのためのUnscented Kalman Filter による適応的音高制御, 日本ロボット学会第29回学術講演会, 3A2-1, 芝浦工業大学, Sep. 7-9, 2011.
糸原達彦, 大塚琢馬, 水本武志, 尾形哲也, 奥乃博: パーティクルフィルタを用いたギター演奏の視聴覚統合ビートトラッキング, 日本ロボット学会第29回学術講演会, 3A2-2, 芝浦工業大学, Sep. 7-9, 2011.
平澤恭治, 安良岡直希, 高橋徹, 尾形哲也, 奥乃博: 調波・非調波音源モデルを用いたマイク数以上の音源分離, 日本ロボット学会第29回学術講演会, 3A2-4, 芝浦工業大学, Sep. 7-9, 2011.
柳楽浩平, 高橋徹, 尾形哲也, 奥乃博: ノンパラメトリックベイズによる時間周波数領域における音声信号のブラインド音源分離 , 日本ロボット学会第29回学術講演会, 3A2-5, 芝浦工業大学, Sep. 7-9, 2011.
大塚琢馬, 尾形哲也, 奥乃博: MUSIC 法を用いた音源定位のベイズ拡張, 日本ロボット学会第29回学術講演会, 3A3-2, 芝浦工業大学, Sep. 7-9, 2011.
信田春満, 西出俊奥乃博尾形哲也: 神経力学モデルによる身体図式に基づく空間地図の獲得, 日本ロボット学会第29回学術講演会, 3N1-5, 芝浦工業大学, Sep. 7-9, 2011.
佐野正太郎, 西出俊奥乃博尾形哲也: 対話データの再帰結合神経回路による学習と相槌タイミング予測, 日本ロボット学会第29回学術講演会, 32-1, 芝浦工業大学, Sep. 7-9, 2011.
西川直毅, 糸山克寿, 藤原弘将, 後藤真孝, 尾形哲也, 奥乃博: 歌詞と音響特徴量を用いた楽曲印象軌跡推定法の設計と評価, 第91回音楽情報科学研究会, Vol.2011-MUS-91, pp. 関西学院大学, 三田, 情報処理学会, Jul. 2011.
前澤陽, 糸山克寿, 尾形哲也, 奥乃博: MAHL: 演奏者間のインタラクション分析のためのスコアアライメント手法, 第91回音楽情報科学研究会, Vol.2011-MUS-91, pp. 関西学院大学, 三田, 情報処理学会, Jul. 2011.
山川暢英, 北原鉄朗, 高橋徹, 尾形哲也, 奥乃博: 擬音語と環境音の音響的関係性を考慮した環境音to擬音語変換システム， 2011年度人工知能学会全国大会, 1C2-OS4b-4, 岩手, June 1, 2011.
佐藤隼, 中野幹生, 駒谷和範, 船越孝太郎, 奥乃博: ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク, 第86回音声言語情報処理研究会(SIG-SLP), 情処研報, 情報処理学会, 2011.
特許・ディジタルコンテンツ
楽曲推薦システム, 楽曲推薦方法及び楽曲推薦用コンピュータプログラム, 発明者: 後藤真孝, 吉井和佳, 奥乃博, 特許第4953478号, 登録日平成24年3月23日. 特願2007-199936号, 2007年7月31日.
会話システムおよび会話ソフトウエア, 発明者: 中野幹夫, 奥乃博, 駒谷和範, 特許第4950024号, 登録日平成24年3月16日. 国際公開番号: WO2006/093092, 国際公開日:2006年9月8日, 発行日:2008年8月7日. 特願2007-505922号, 出願日平成18年2月22日, 国際出願番号:PCT/JP2006/303613 国際出願日:2006年2月27日.
対話処理装置、対話処理方法、及び対話処理プログラム. 発明者：中野幹生, 船越孝太郎, 駒谷和範, 奥乃博, 佐藤隼. 特開2012-42952号, 2012年3月1日. 特願2011-175395号, 2011年8月10日.
Voice Recognition System. Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto, Europian Patent EP 1,818,909, Publication Date: 04/18/2012 Filing Date: 02/10/2005
Speech recognition apparatus and method recognizing a speech from sound signals collected from outside. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, and Shunichi Yamamoto. Patent No. US 8,073,690, Date of Patent: Dec. 6, 2011. PCT Filed: Dec. 2, 2005. PCT No: PCT/JP2005/022601.
残響抑制装置，及び残響抑制方法．発明者：中臺一博, 武田龍, 奥乃博. 特開2011-232691号, 2011年11月17日. 特願2010-105369号, 2010年4月10日.
音声認識装置及び音声認識方法．発明者：中臺一博, 高橋徹, 奥乃博. 特開2011-191759号, 2011年9月29日. 特願2011-53124号, 2011年3月10日.
ロボット、ロボット制御方法およびプログラム. 発明者：中臺一博, 大塚琢馬, 奥乃博. 特開2011-189439号, 2011年9月29日. 特願2010-56265号, 2010年3月12日.
楽譜位置推定装置、楽譜位置推定方法、及び楽譜位置推定プログラム. 発明者：中臺一博, 大塚拓馬, 奥乃博. 特開2011-180590号, 2011年9月15日. 特願2011-37526号, 2011年2月23日.
Speech recognition apparatus and method recognizing a speech from sound signals collected from outside. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, and Shunichi Yamamto. Patent No. US 8,073,690, Date of Patent: Dec. 6, 2011. Date of Application: Dec. 2, 2005.
Automatic system for temporal alignment of music audio signal with lyrics, Inventors: Masataka Goto, Hiromasa Fujihara, and Hiroshi Okuno. Patent No. US 8,005,666, Date of Patent: Aug. 23, 2011. Date of Application: Aug. 7, 2007.
Robot. Inventors: Kazuhiro Nakadai, Yuji Hasewaga, Hiroshi Tsujino, Kazumasa Murata, Ryu Takeda, and Hiroshi Okuno. Patent No. US 7,999,168, Date of Patent: Aug. 16, 2011. Application Filed: July 15, 2009. Aplication No: 12/503,448.
Sound-source separation system. Inventors: Ryu Takeda, Kazuhiro Nakadai, Hiroshi Tsujino, and Hiroshi Okuno. Patent No. US 7,987,090, Date of Patent: July 26, 2011. Application Filed: Aug. 7, 2008. Aplication No: 12/187,684.
音源探索装置. 発明者：堀邊隆介, 梅田修志, 田中史記, 猪田岳司, 奥乃博, 高橋徹. 特開2011-124749号, 2011年6月23日. 特願2009-280115号, 2009年12月10日.
テルミン演奏ロボット. 発明者：辻野広司, 奥乃博, 水本武志. 特開2011-81380号, 2011年4月21日. 特願2010-226106号, 2010年10月5日.

2011年度  ２０１０年度（奥乃・尾形研究室） 2009年度

学位論文

武田龍: A Unified Framework of Blind Separation, Blind Dereverberation and Self-Voice Cancellation for Real-Time Robot Audition (実時間ロボット聴覚のためのブラインド分離，ブラインド残響除去，自己発話抑制の統一的枠組み), 博士論文 (指導教員: 奥乃博教授), Jan. 2011.
糸山克寿: , Source Separation of Musical Instrument Sounds in Polyphonic Musical Audio Signal and Its Application (多重奏音楽音響信号に対する楽器音の分離とその応用), 博士論文 (指導教員: 奥乃博教授), Feb. 2011.
大塚琢馬: Real-time Audio-to-Score Alignment using Particle Filter for Co-player Robots (共演者音楽ロボットのためのパーティクルフィルタを用いた実時間楽譜追従手法), 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
日下航: 神経力学モデルを用いたロボットによる言語と感覚運動系の統合的認知, 修士論文 (指導教員: 尾形哲也准教授), Feb. 2011.
前澤彰: Score-Aided Inference of Classical Music Interpretation (楽譜を援用したクラシック音楽解釈の推論), 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
松山匡子: 発語行為レベルの情報をユーザの意図解釈に用いた音声対話システム, 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
安良岡直希: 調波パラメトリックNMF及びIダイバージェンス規準残響推定に基づく音響信号モデリングとフレーズ置換への応用, 修士論文 (指導教員: 奥乃博教授), Feb. 2011.
糸原達彦: ギター奏者と合奏する音楽ロボットのためのパーティクルフィルタを用いた視聴覚統合ビートトラッキング, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2011.
佐野正太郎: 神経力学モデルを用いた相槌タイミングの予測, 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2011.
柳楽浩平: isFAを用いた時間周波数領域における実音声信号のブラインド音源分離, 卒業特別研究報告 (指導教員: 奥乃博教授), Feb. 2011.
信田春満: 神経力学モデルによる予測可能性を用いた視野内動領域からの身体識別及び身体図式獲得, 卒業特別研究報告 (指導教員: 尾形哲也准教授), Feb. 2011.
張陽: Prediction and Classification of Environmental Sounds using Recurrent Neural Network, Master Thesis (指導教員: 尾形哲也准教授), Sep. 2010.
査読つきジャーナル論文
Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno, Kazuyuki Aihara: Complex and Transitive Synchronization in a Frustrated System of Calling Frogs, Physical Review E, Vol.83, Issue 3. 031913 (2011) [5 pages], 21 Mar. 2011. doi:10.1103/PhysRevE.83.031913
Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Query-by-Example Music Information Retrieval by Score-Informed Source Separation and Remixing Technologies, EURASIP Journal on Advances in Signal Processing, Vol.2010, Article ID 172961, 14 pages, Hindawi Pub., Jan. 2011. online page, doi:10.1155/2010/172961 IF: 0.81
Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Audio-to-Score Alignment Using Particle Filter for Co-player Music Robots, EURASIP Journal on Advances in Signal Processing, Vol.2011, Article ID 384651, 13 pages, 2011, Hindawi Pub. online page, doi:10.1155/2011/384651 IF: 0.81
Takuya Yoshioka, Tomohiro Nakatani, Masato Miyoshi, Hiroshi G. Okuno: Blind Separation and Dereverberation of Speech Mixtures by Joint Optimization, IEEE Transactions on Audio, Speech and Language Processing, Vol.19, Issue 1 (Jan. 2011) pp.69-84, IEEE. doi:10.1109/TASL.2010.2045183
Mikio Nakano, Yuji Hasegawa, Kotaro Funakoshi, Yohane Takeuchi, Toyotaka Torii, Kazuhiro Nakadai, Naoyuki Kandai, Kazunori Komatani, Hiroshi G. Okuno, Hiroshi Tsujino: A multi-expert model for dialogue and behavior control of conversational robots and agents. Knowledge-Based Systems, Vol.24, No.2 (Mar. 2011) pp.248-256, Elsevier. doi:10.1016/j.knosys.2010.08.004, Preprint
Kazunori Komatani, Yuichiro Fukubayashi, Satoshi Ikeda, Tetsuya Ogata, Hiroshi G. Okuno: Selecting Help Messages by Using Robust Grammar Verification for Handling Out-of-Grammar Utterances in Spoken Dialogue Systems. IEICE Transactions Information and Systems, Vol.E93-D, No.12 (Dec. 2010) pp.3359-3367. doi:10.1587/transinf.E93.D.3359
藤原弘将, 後藤真孝, 奥乃博: 多重奏中の歌声の基本周波数と有声音素の同時推定手法, 情報処理学会論文誌, Vol.51, No.10 (Oct. 2010) pp.1995-2006. , , DL
水本武志, 辻野広司, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発, 情報処理学会論文誌, Vol.51, No.10 (Oct. 2010) pp.2007-2019. , DL
吉田尚水, 中臺一博, 奥乃博: ロボットを対象としたニ階層視聴覚情報統合音声認識システム, 日本ロボット学会誌, Vol.28, No.8 (Oct. 2010) pp.970-977. Abstract学会サーバ
Tetsuya Ogata, Shun Nishide, Hideki Kozima, Kazunori Komatani, Hiroshi G. Okuno: Inter-modality Mapping in Robot with Recurrent Neural Network, Pattern Recognition Letters, Vol.31, Issue 12 (Sep. 2010) 1560-1569. doi:10.1016/j.patrec.2010.05.002
日下航, 尾形哲也, 小嶋秀樹, 高橋徹, 奥乃博: RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションの創発. 日本ロボット学会誌, Vol.28, No.4 (Apr. 2010) pp.532-543. Abstract学会サーバ
勝丸真樹, 中野幹生, 駒谷和範, 船腰孝太郎, 辻野広司, 尾形哲也, 奥乃博: 複数の言語モデルと言語理解モデルによる音声理解の高精度化, 電子情報通信学会論文誌 D, 情報爆発特集号, Vol.J93-D, No.6 (Jun. 2010) pp.879-888, 電子情報通信学会. 学会サーバ
Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino: Design and Implementation of Robot Audition System "HARK" - Open Source Software for Listening to Three Simulteaneous Speakers, Advanced Robotics, Vol.24, Issue 5-6 (Jan. 2010) pp. 739-761, VSP and Robotics Society of Japan. doi:10.1163/016918610X493561 IF: 0.510
章分担・解説
奥乃博, 中臺一博: 多数の人の声を一度に聞き分ける聴覚技術〜聖徳太子ロボットを目指して〜, 電気学会誌, 131巻3号 (Mar. 2011) pp.159-163. 電気学会.
尾形哲也, 日下航: ロボット間マルチモーダルコミュニケーションの記号過程, システム/制御/情報, Vol.54, No.11 (Nov. 2011) pp.434-439.
Wataru Hinoshita, Horiaki Arie, Jun Tani, Tetsuya Ogata, Hiroshi G. Okuno: Recognition and Generation of Sentences through Self-organizing Linguistic Hierarchy using MTRNN, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6098, 42-51, Cordoba, Spain, June 1-4 (2), 2010.
Takuma Otsuka, Takeshi Mizumoto, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Music-ensemble robot that is capable of playing the theremin while listening to the accompanied music, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6096, 102-112, Cordoba, Spain, June 1-4 (2), 2010. Best paper award, 平成２２年度Ｃ＆Ｃ若手優秀論文賞
Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Violin Fingering Estimation Based on Violin Pedagogical Fingering Model Constrained by Bowed Sequence Estimation from Audio Input, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6098, 249-259, Cordoba, Spain, June 1-4 (3), 2010.
Kyoko Matsuyama, Kazunori Komatani, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Improving Identification Accuracy by Extending Acceptable Utterances in Spoken Dialogue System Using Barge-in Timing, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6097, 585-594, Cordoba, Spain, June 1-4 (3), 2010.
Shun Shiramatsu, Jun Takasaki, Tatiana Zidrasco, Tadachika Ozono, Toramatsu Shintani, Hiroshi G. Okuno: System for Supporting Web-based Public Debate Using Transcripts of Face-to-face Meeting, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6098, 311-320, Cordoba, Spain, June 1-4 (4), 2010.
Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno: An Improvement in Auido-Visual Voice Activity Detection for Automatic Speech Recognition, Nicol\'{a}s Garc\'{\i}a-Pedrajas, Francisco Herrera, Colin Fyfe, Jos\'{e} Manuel Ben\'{\i}tez, and Moonis Ali (Eds.): Trends in Applied Intelligent Systems , LNAI 6096, 51-61, Cordoba, Spain, June 1-4 (2), 2010.
国際会議論文
Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno, Kazuyuki Aihara: Compelx Synchronization in a Frustrated System of Calling Frogs, The 1st International Symposium on Innovative Mathematical Modeling (ISIMM 2011), Feb. 28 - March 2, 2011. ISIMM 2011 BEST POSTER AWARD Silver Prize
Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno: Method of Discriminating Known and Unknown Environmental Sounds using Recurrent Neural Network, Proceedings of oint 5th International Conference on Soft Computing and Intelligent Systems and 11th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2010), pp. 378-383, Okayama, JAPAN, December 8-12, 2010.
Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Two-level Synchronization using Particle Filter for Co-player Music Robots, Proceedings of IEEE/RSJ-2010 Workshop on Robots and Musical Expression, CD-ROM, Oct. 18, 2010, Taipei, Taiwan.
Takeshi Mizumoto, Angelica Lim, Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno : Integration of flutist gesture recognition and beat tracking for human-robot ensemble, Proceedings of IEEE/RSJ-2010 Workshop on Robots and Musical Expression, CD-ROM, Oct. 18, 2010, Taipei, Taiwan.
Angelica Lim, Takeshi Mizumoto, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Programming by Playing and Approaches for Expressive Robot Performances, Proceedings of IEEE/RSJ-2010 Workshop on Robots and Musical Expression, CD-ROM, Oct. 18, 2010, Taipei, Taiwan.
Yasuharu Hirasawa, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Exploiting Harmonic Structures to Improve Separating Simultaneous Speech in Under-Determined Conditions (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.450-457 (49.1%), TuBT12.5, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5651078 IEEE Robotics and Automation Society Japan Chapter Young Award
Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: An Improvement in Automatic Speech Recognition Using Soft Missing Feature Masks for Robot Audition (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.964-969, TuCT12.2, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5650540
Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno: Two-Layered Audio-Visual Speech Recognition for Robots in Noisy Environments (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.988-993, TuCT12.6, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5651205
Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Speedup and Performance Improvement of ICA-based Robot Audition by Parallel and Resampling-based Block-wise Processing (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.1949-1954 (49.1%), TuET12.1, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5652757
Takeshi Mizumoto, Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Human-Robot Ensemble between Robot Thereminst and Human Percussionist using Coupled Oscillator Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.1957-1962, TuET12.2, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5650364
Angelica Lim, Takeshi Mizumoto, Lois-Kenzo Cahier, Takuma Otsuka, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Musical Accompaniment: Integrating Audio and Visual Cues for Real-time Synchronization with a Human Flutist (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.1964-1969, TuET12.3, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5650427 IROS-2011NTF Award for Entertainment Robots and Systems.
Shun Nishide, Tetsuya Ogata, Jun Tani, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Motion Generation Based on Reliable Predictability using Self-organized Object Features (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2010), pp.3453-3458, WeCT13.2, IEEE, RSJ, Taipei, 18-22 Oct. 2010. doi:10.1109/IROS.2010.5652609
Nobuhide Yamakawa, Tetsuro Kitahara, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Effects of modelling within- and between-frame temporal variations in power spectra on non-verbal sound recognition, Proceedings of International Conference on Spoken Language Processing (Interspeech 2010), 2342-2345, (oral), Makuhari, 29 Sep. 2010.
Kyoko Matsuyama, Kazunori Komatani, Ryu Takeda, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Analyzing User Utterances in Barge-in-able Spoken Dialogue System for Improving Identification Accuracy, Proceedings of International Conference on Spoken Language Processing (Interspeech 2010), 3050-3053, (acceptance rate 58.2%), Makuhari, 30 Sep. 2010.
Hideki Kawahara, Masanori Morise, Toru Takahashi, Hideki Banno, Ryuichi Nishimura, Toshio Irino: Simplification and extension of non-periodic excitation source representation for high-quality speech manipulation systems, Proceedings of International Conference on Spoken Language Processing (Interspeech 2010), 38-41, (oral), Makuhari, 27 Sep. 2010. doi:10.1109/ICSMC.2010.5641924
Kazunori Komatani, Hiroshi G. Okuno: Online Error Detection of Barge-In Utterances by Using Individual Users' Utterance Histories in Spoken Dialogue System, Proceedings of the 11th SIGDIAL Meeting on Discourse and Dialogue (SIGDIAL 2010), 289-296, Tokyo, Sep. 24-25, 2010. at SIGDial Server.
Hiromitsu Awano, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Human-Robot Cooperation in Arrangement of Objects Using Confidence Measure of Neuro-dynamcal Systems, Proceeding of IEEE International Conference on Systems, Man, and Cybernetics (SMC 2010), pp. 2533-2538, June 2010.
Shimpei Aso, Takuya Saitou, Masataka Goto, Katsutoshi Itoyama, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SpeakBySinging: Converting Singing Voices to Speaking Voices While Retaining Voice Timbre, Proceedings of the 13th International Conference on Digital Audio Effects (DAFx-10), 114-121, Graz, October, 2010, 公式
Kazunori Komatani, Masaki Katsumaru, Mikio Nakano, Kotaro Funakoshi, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Allocation of Training Data for Rapid Prototyping of Speech Understanding based on Multiple Model Combination, Proceedings of COLING 2010, accepted as poster presentation, (acceptance rate 42%), Beijing, China, September, 2010.
Shun Shiramatsu, Tadachika Ozono, Toramatsu Shintani, Hiroshi G. Okuno: A Corpus-based Analysis of Coreferential Recency Effect in Japanese Discourse for Tracking Dynamic Topic. Proceedings of the 9th IEEE/ACIS International Conference on Computer and Information Science (ACIS-ICIS 2010), 645-650, Yamagata, Japan, Aug. 2010. doi:10.1109/ICIS.2010.65
Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Query-by-Conducting: An interface to retrieve classical-music interpretations by real-time tempo input, Proceedings of 11th International Society for Musical Information Retrieval Conference (ISMIR-2010), 477-482, Dresden, Aug. 2010. 公式
Ikkyu Aihara, Takeshi Mizumoto, Ryu Takeda, Takuma Otsuka, Toru Takahashi, Kazuyuki Aihara, Hiroshi G. Okuno: Frustration in Synchronized Calling Behavior of Japanese Tree Frogs, Ninth International Congress of Neuroethology, P212 (poster), pp.328, , Aug. 5-7 (6-7), 2010, Salamanca, Spain. (poster)
Takeshi Mizumoto, Ikkyu Aihara, Takuma Otsuka, Ryu Takeda, Kazuyuki Aihara, Hiroshi G. Okuno: Sound imaging system for visualizing spatio-temporal behavior of calling nocturnal animals, Ninth International Congress of Neuroethology, P223 (poster), pp.339, , Aug. 5-7 (6-7), 2010, Salamanca, Spain.
Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Implementation of Two-level Synchronization for Interactive Music Robot, Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence (AAAI-10), 1138-1144 (26.9%, 264/982), July 11-15 (15), 2010, Atlanta, GA.
Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Improvement in Listening Capability for Humanoid Robot HRP-2. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2010), 470-475, (847/2062), May 3-8 (4), 2010, Anchorage, Aalaska, USA. doi:10.1109/ROBOT.2010.5509830
Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Upper-limit Evaluation of a Robot Audition based on ICA-BSS in Multi-source, Barge-in and Highly Reveberant Conditions. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2010), 4366-4371, (847/2062), May 3-8, 2010, Anchorage, Aalaska, USA. doi:10.1109/ROBOT.2010.5509891
口頭発表（研究会・全国大会）
松山匡子, 駒谷和範, 武田龍, 尾形哲也, 奥乃博: 発語行為レベルの情報を用いた音声対話システム構築とデータ分析, 第61回言語・音声理解と対話処理研究会(SIG-SLUD), 人工知能学会, Mar. 25, 2011.
安良岡直希, 吉岡拓也, 亀岡弘和, 奥乃博: 補助関数法を用いたIダイバージェンス規準残響抑制, 音響学会春季講演会, 3-1-9, March 11, 2011.
前澤陽, 後藤真孝, 尾形哲也, 奥乃博: 拍長の連続性を考慮した潜在的調波配分法に基づくスコアアライメント手法, 音響学会春季講演会, 3-1-16, March 11, 2011.
Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Kazuyuki Aihara, Hiroshi G. Okuno, Kazuyuki Aihara: Complex Synchronization In a Frustrated System of Calling Frogs, The First International Symposium on Onnovative Mathematical Modelling, P-118 (poster), Feb. 28, 2011, IIS, The University of Tokyo.
信田春満, 尾形哲也, 奥乃博, 高橋徹, 日下航: 神経力学モデルによる予測可能性を用いた身体識別, 情報処理学会第73回全国大会, 2-125-126, 1Q-1, March 2, 2011.
粟野皓光, 尾形哲也, 谷淳, 高橋徹, 奥乃博: 再帰結合神経回路モデルへのスパース構造導入による学習能力の向上, 情報処理学会第73回全国大会, 2-131-132, 1Q-4, March 2, 2011. 学生奨励賞
Louis-Kenzo Cahier, 高橋徹, 尾形哲也, 奥乃博: Time-of-flight camera based Probabilistic Polygonal Mesh mapping, 情報処理学会第73回全国大会, 2-431-432, 1T-5, March 2, 2011.
阿曽慎平, 齋藤毅, 後藤真孝, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: F0・音韻長・パワー制御による歌声らしさ・話声らしさの変化の評価, 情報処理学会第73回全国大会, 2-255-256, 2R-6, March 2, 2011. 学生奨励賞
日下航, 尾形哲也, 高橋徹, 奥乃博: 神経回路モデルによる言語とロボット動作の相互連想学習, 情報処理学会第73回全国大会,2-165-166, 3Q-1, March 2, 2011. 学生奨励賞
情報処理学会第73回全国大会学会推奨修士論文認定, 2011年5月.
糸原達彦, 大塚琢馬, 水本武志, 高橋徹, 尾形哲也, 奥乃博: 視聴覚統合ビートトラッキングを用いた音楽ロボットとギターとの合奏システム, 情報処理学会第73回全国大会, 4-235-236, 1ZB-2, March 2, 2011. 学生奨励賞
松山匡子, 駒谷和範, 武田龍, 尾形哲也, 奥乃博: 誤認識頻発状況下で選択肢列挙を行う音声対話システムとその評価, 情報処理学会第73回全国大会, 4P-4, March 3, 2011.
佐野正太郎, 尾形哲也, 日下航, 高橋徹, 奥乃博: 神経力学モデルの引込みによる相槌タイミング予測, 情報処理学会第73回全国大会, 4P-7, March 3, 2011. 学生奨励賞
Uihyun Kim, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Speaker Localization Using Two-Channel Microphone on the SIG-2 Humanoid Robot, 情報処理学会第73回全国大会, 2-15-16, 4C-1, March 3, 2011.
JOOYOUNG AHN, 前澤陽, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: Classification of Harmonic and Textural Keyboard Playing Style Using Acoustic Features, 情報処理学会第73回全国大会, 2-17-18, 4C-2, March 3, 2011.
安良岡直希, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: 調波パラメトリックNMFによる楽器演奏音響信号の分析合成, 情報処理学会第73回全国大会, 2-293-294, 5R-1, 2-293-244, March 4, 2011.
情報処理学会第73回全国大会学会推奨修士論文認定, 2011年5月.
西川直毅, 糸山克寿, 藤原弘将, 後藤真孝, 高橋徹, 尾形哲也, 奥乃博: 歌詞と音響特徴量を用いた楽曲の印象軌跡推定, 情報処理学会第73回全国大会, 2-297-298, 5R-3, 2-297-298, March 4, 2011.
前澤陽, 後藤真孝, 尾形哲也, 奥乃博: 潜在的調波配分法に基づく隠れセミマルコフモデルを用いたベイズ的スコアアライメント, 情報処理学会第73回全国大会, 2-299-300, 5R-4,, March 4, 2011. 学生奨励賞
情報処理学会第73回全国大会学会推奨修士論文認定, 2011年5月.
阪上大地, 安良岡直希, 高橋徹, 尾形哲也, 奥乃博: 伝達関数のスパース性仮定に基づく音楽音響信号中のディレイエフェクトブラインド推定, 情報処理学会第73回全国大会, 2-301-302, 5R-5, March 4, 2011.
大塚琢馬, 中臺一博, 高橋徹, 尾形哲也, 奥乃博: 累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従, 情報処理学会第73回全国大会, 2-305-306, 5R-7, March 4, 2011.
情報処理学会第73回全国大会学会推奨修士論文認定, 2011年5月.
Angelica Lim, 中村圭佑, 中臺一博, 尾形哲也, 奥乃博: Audio-visual musical instrument recognition 情報処理学会第73回全国大会, 2-309-310, 5R-9, March 3, 2011.
柳楽浩平, 高橋徹, 尾形哲也, 奥乃博: 音源数同定とブラインド音源分離を同時に行うinfinite ICA, 情報処理学会第73回全国大会, 2-109-110, 6P-1, March 4, 2011. 学生奨励賞
平澤恭治, 武田龍, 高橋徹, 尾形哲也, 奥乃博: L1ノルム最小化による劣決定音源分離のための線形計画と二次錐計画の比較評価 情報処理学会第73回全国大会, 2-111-112, 6P-2, March 4, 2011.
山川暢英, 高橋徹, 北原鉄朗, 尾形哲也, 奥乃博: ロボット聴覚のための Matching Pursuit による複数環境音の同定, 情報処理学会第73回全国大会, 2-113-114, 6P-3, March 4, 2011.
中臺一博, 奥乃博: ロボット聴覚〜高雑音下でのハンズフリー音声認識〜 (招待講演), 信学技法, 音声研究会, 電子情報通信学会, 27 Jan. 2011
合原一究, 水本武志, 大塚琢馬, 武田龍, 奥乃博: Spatio-Temporal Dynamics on Synchronized Calling Behavior of Japanese Tree Frogs, 第15回聴覚研究フォーラム, P10, Dec. 2010.
佐藤隼, 中野幹生, 松山匡子, 駒谷和範, 船越孝太郎, 奥乃博: 拡張性の高いマルチドメイン対話システムのための2段ドメイン選択法, 第60回言語・音声理解と対話処理研究会(SIG-SLUD), 人工知能学会, Oct. 17, 2010.
駒谷和範, 松山匡子, 奥乃博: 発話行為レベルの情報を活用した音声対話システムの研究, 第60回言語・音声理解と対話処理研究会(SIG-SLUD), 人工知能学会, Oct. 17, 2010.
Angelica Lim, Takeshi Mizumoto, Louis-Kenzo Cahier, Takuma Otsuka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Multimodal gesture recognition for robot musical accompaniment, 日本ロボット学会第28回学術講演会, 1H2-3, 名古屋工業大学, Sep. 22, 2010.
山川暢英, 高橋徹, 北原鉄朗, 尾形哲也, 奥乃博: ロボット聴覚のための Matching-Pursuit による環境音の分離音認識, 日本ロボット学会第28回学術講演会, 1H2-4, 名古屋工業大学, Sep. 22, 2010.
Zhang Yang, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno: Dynamic Recognition of Environmental Sounds with Recurrent Neural Network, 日本ロボット学会第28回学術講演会, 1H2-7, 名古屋工業大学, Sep. 22, 2010.
武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博: リサンプル-ブロック処理と並列化に基づく ICA の実時間実装, 日本ロボット学会第28回学術講演会, 1H3-1, 名古屋工業大学, Sep. 22, 2010.
水本武志, 中臺一博, 大塚琢馬, 高橋徹, 尾形哲也, 奥乃博: 打楽器とロボットの合奏のための結合振動子モデルに基づく打撃時刻予想手法, 日本ロボット学会第28回学術講演会, 1H3-2, 名古屋工業大学, Sep. 22, 2010.
Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Predictive Score Following user Particle Filter for Music Robots, 日本ロボット学会第28回学術講演会, 1H3-6, 名古屋工業大学, Sep. 22, 2010.
Louis-Kenzo Cahier, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Probabilistic polygonal mesh for 3D SLAM, 日本ロボット学会第28回学術講演会, 2B2-4, 名古屋工業大学, Sep. 23, 2010.
粟野皓光, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博: 確信度を用いた物体配置作業における人間ロボット協調, 日本ロボット学会第28回学術講演会, 3J1-6, 名古屋工業大学, Sep. 24, 2010.
西出俊, 尾形哲也, 谷淳, 奥乃博: 能動知覚経験に基づく物体特徴量の自己組織化と予測信頼性に基づく動作生成, 日本ロボット学会第28回学術講演会, 3A2-5, 名古屋工業大学, Sep. 24, 2010.
日下航, 有江浩明, 谷淳, 尾形哲也, 高橋徹, 奥乃博: MTRNNを用いた階層的言語構造の創発, 日本ロボット学会第28回学術講演会, 3A2-7, 名古屋工業大学, Sep. 24, 2010.
奥乃博, 中臺一博, 高橋徹: ロボット聴覚オープンソースソフトウエア HARK, 電子情報通信学会ソサイエティ大会, 依頼シンポジウムセッション AI-1: マルチモーダル信号処理とその応用, 大阪府立大学, Sep. 14, 2010.
高橋徹, 中臺一博, 奥乃博: ロボット聴覚ソフトウエア HARK とそのロボットへの適用, 電気関係東海支部連合会大会, Sep., 2010.
安良岡直希, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: 多重奏音響信号中の歌唱音声の歌詞を自由に差し替える歌詞置換システム, 音響学会秋季学術講演会, , Sep. 14〜16, 2010. 関西大学千里山キャンパス. 日本音響学会第2回学生優秀発表賞 (内定)
阿曽慎平, 齋藤毅, 後藤真孝, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: SpeakBySinging: 歌声を話声に変換する話声合成システム, 音楽情報科学研究会, Vol.2010-MUS-86, No., pp. つくば, 情報処理学会, Jul. 2010. ,
前澤陽, 後藤真孝, 奥乃博: Query-by-Conducting: テンポ類似性に基づく同一楽曲における多様な解釈の検索インタフェース, 音楽情報科学研究会, Vol.2010-MUS-86, No.2, pp. つくば, 情報処理学会, Jul. 2010. ,
安良岡直希, 糸山克寿, 吉岡拓也, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: 多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム, 音楽情報科学研究会, Vol.2010-MUS-, No., pp. つくば, 情報処理学会, Jul. 2010.
松山匡子, 駒谷和範, 武田龍, 尾形哲也, 奥乃博: バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用, 第82回音声言語情報処理研究会, Vol.2010-SLP-82, No.21, 情処研報, 情報処理学会, Jul. 24, 2010.
特許・ディジタルコンテンツ
楽譜位置推定装置、楽譜位置推定方法および楽譜位置推定ロボット. 発明者：中臺一博, 大塚琢馬, 奥乃博, 特開2011-39511号, 2011年2月24日. 特願2010-177968号, 2010年8月6日.
残響抑圧装置, 及び残響抑圧方法. 発明者：中臺一博, 中島弘史, 奥乃博, 武田龍, 特開2010-282193号, 2010年12月16日. 特願2010-124873号, 2010年5月31日.
Audio Source Detection System, Inventors: Hiroshi Tsujino, Kazuhiro Nakadai, Hiroshi Okuno, Takeshi Mizumoto, and Ikkyu Aihara. Publication No: 20100189271, Publication Date: 2010-07-29. Application No: 12/631434, Application Date: 2009-12-04.
Language Understanding Device. Mikio Nakano, Hiroshi Okuno, Kazunori Komatani, Yuichiro Fukubayashi, Kotaro Funakoshi, Europian Patent EP 2,003,572, Publication Date: 04/18/2012 Filing Date: 02/10/2005
Sound Source separation system, sound source separation method, and computer program for sound source separation, Inventors: Katsutoshi Itoyama, Hiroshi Okuno, Masataka Goto, US Patent Aapplication: Pub. No.: US 2010/0131086 A1, Pub. Date: May 27, 2010. PCT No.: PCT/JP2008/057310.
音声認識装置, 発明者：中臺一博, 辻野広司, 奥乃博, 山本俊一, 特許第4516527号, 登録日2010年5月21日, 発行日2010年8月4日, 特開2010-170137号, 2010年8月5日. 特願2005-515466号, 2004年11月12日.
音声理解装置, 発明者：中野幹生, 勝丸真樹, 船越孝太郎, 奥乃博, 特開2010-170137号, 2010年8月5日. 特願2005-515466号, 2004年11月12日.
音源位置推定システム, 発明者：辻野広司, 中臺一博, 奥乃博, 水本武志, 合原一究, 特開2010-133964号, 2010年6月17日. 特願2009-277075号, 2009年12月4日.
Speech recognition system and method for generating a mask of the system, Kazuhiro Nakadai, Toru Takahashi, Hiroshi Okuno, Publication No: 20100082340, Publication Date: 2010-04-01. Application No: 12/543759, Application Date: 2009-08-19, U.S.A.

2010年度  ２００９年度（奥乃・尾形研究室） 2008年度

学位論文

Hiromasa Fujihara: Statistical Modeling for Recognizing Singing Voices in Polyphonic Music (統計的モデルによる多重奏音楽中の歌声の認識), 博士論文 (指導教員: 奥乃博教授), Feb. 2010.
Takuya Yoshioka: Speech Enhancement in Reverberatn Environments (残響環境下での音声強調), 博士論文 (指導教員: 奥乃博教授), Feb. 2010.
勝丸真樹: 複数の言語モデルと言語理解モデルによる音声理解の高精度化とそのラピッドプロトタイピングへの適用, 修士論文 (指導教員: 奥乃博教授), Feb. 2010.
水本武志: ロボットによるテルミン演奏のための音高・音量特性のモデル化とフィードフォワード制御, 修士論文 (指導教員: 奥乃博教授), Feb. 2010.
穐山空道: 文法検証を統合したPOMDPによる対話管理, 卒業特別研究報告書 (指導教員: 奥乃博教授), Feb. 2010.
阿曽慎平: 音韻長・F0・振幅の制御により歌声を話声に変換する話声合成システム SpeakBySinging, 卒業特別研究報告書 (指導教員: 奥乃博教授), Feb. 2010.
粟野皓光: 人間ロボットの作業確信度を利用した協調物体配置システム, 卒業特別研究報告書 (指導教員: 尾形哲也准教授), Feb. 2010.
平澤恭治: 調波構造を用いた音源分離によるマイク数以上の同時発話認識, 卒業特別研究報告書 (指導教員: 奥乃博教授), Feb. 2010.

査読つきジャーナル論文
Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Soft missing-feature mask generation for robot audition, PALADYN Journal of Behavioral Robotics, Vol.1, No.1 (Mar. 2010) pp. 37-47, doi:10.2478/s13230-010-0005-1
Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Voice-awareness control for a humanoid robot consistent with its body posture and movements, PALADYN Journal of Behavioral Robotics, Vol.1, No.1 (Mar. 2010) pp.80-88, doi:10.2478/s13230-010-0009-x
Hiromasa Fujihara, Masataka Goto, Tetsuro Kitahara, Hiroshi G. Okuno: A Modeling of Singing Voice Robust to Accompaniment Sounds and Its Application to Singer Identification and Vocal-Timbre-Similarity-Based Music Information Retrieval, IEEE Transactions on Audio, Speech and Language Processing, Vol.18, No.3 (Mar. 2010) pp.638-648, IEEE. doi:10.1109/TASL.2010.2041386
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Binaural active audition for humanoid robots to localise speech over entire azimuth range, Applied Bionics and Biomechanics, Special Issue on "Humanoid Robots", Vol.6, Issue 3-4 (Sep. 2009) pp.355-368, Taylor & Francis 2009. doi:10.1080/11762320903007430
Hyun-Don Kim, Jinsung Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Target Speech Detection and Separation for Communication with Humanoid Robots in Noisy Home Environments, Advanced Robotics, Vol.23, Issue 15 (2009) 2093-2111, VSP and Robotics Society of Japan. doi:10.1163/016918609X12529300552105 IF: 0.510
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Self-Organization of Dynamic Object Features based on Bi-Directional Training, Advanced Robotics, Vol.23, Issue 15 (2009) 2035-2057. doi:10.1163/016918609X12529289797027 VSP and Robotics Society of Japan. IF: 0.510
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Autonomous Motion Generation based on Reliable Predictability, Journal of Robotics and Mechatronics, special issue on Kukanchi Interactive Human-Space Design and Intelligence Dedicated to Dr. Kazuo Tanie, Vol.21, No.4 (2009) 478-488. ,
武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博 : 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚, 日本ロボット学会誌, Vol.27, No.7 (2009) 782-792. , 学会サーバ
村田和真, 中臺一博, 武田龍, 奥乃博, 長谷川雄二, 辻野広司: ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用, 日本ロボット学会誌, Vol.27, No.7 (2009) 793-801. , 学会サーバ
神田尚, 尾形哲也, 駒谷和範, 奥乃博: 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション, 日本ロボット学会誌, Vol.27, No.7 (2009) 802-813. , 学会サーバ
Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Parameter Estimation for Harmonic and Inharmonic Models by Using Timbre Feature Distributions, IPSJ Journal, Vol.50, No.7 (Jul. 2009) 1757-1767, IPSJ. Journal of Information Processing, Vol.17 (2009) 191-201, IPSJ. DL
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Human Tracking System Integrating Sound and Face Localization Using an Expection-Maximization Algorithm in Real Environments, Advanced Robotics, Vol.23, Issue 6 (May 2009) 629-653, doi:10.1163/156855309X431659 VSP and Robotics Society of Japan. IF: 0.510
編書・章分担・解説論文・翻訳
中臺一博, 宮下敬宏, 奥乃博: 「ロボット聴覚」特集号について, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.1. 学会サーバ doi:10.7210/jrsj.28.1
奥乃博: ロボット聴覚の現状と課題, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.2-5. 学会サーバ doi:10.7210/jrsj.28.2
奥乃博, 中臺一博: ロボット聴覚オープンソフトウエア HARK, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.6-9. 学会サーバ doi:10.7210/jrsj.28.6
奥乃博: 編集後記, 特集「ロボット聴覚」, 日本ロボット学会誌, Vol.28, No.1 (Jan. 2010) pp.53. 学会サーバ (2010年7月よりアクセス許可)
尾形哲也, 西出俊: 神経回路モデルの感覚・行為予測に基づく空間認知モデル, 計測と制御, Vol.48, No.12 (Dec. 2009) pp.852-857.
尾形哲也: 神経回路と声道モデルを用いた音素獲得シミュレーション, バイオメカニズム学会誌, Vol.33, No.4 (Nov. 2009) pp.257-263.
奥乃博: 「ロボットと<こころ>」, 京都文化会議記念出版編集委員会川添信介, 高橋康夫, 吉澤健吉編『こころの謎 kokoroの未来』, pp.184-212, 京都大学学術出版会, Nov. 2009.
奥乃博, 中臺一博, 大塚琢馬: 音楽ロボットのための実時間音楽情報処理, 特集「音楽処理技術の最前線」, 情報処理, Vol.50, No.8 (Aug. 2009) pp.729-734. 立ち読み 電子図書館
Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Adjusting Occurrence Probabilities of Automatically-Generated Abbreviated Words in Spoken Dialogue Systems, B.-C. Chien, T.-P. Hong, S.-M. Chen, M. Ali (Eds.): Next-Generation Applied Intelligence, 22nd International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, Lecture Notes in Artificial Intelligence 5579, pp.481-490, Tainan, Taiwan, Jun. 24-27, 2009. doi:10.1007/978-3-642-02568-6_49
Shun Shiramatsu, Yuji Kubota, Kazunori Komatani, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno: Visualization-based Approaches to Support Context Sharing towards Public Involment Support System, Opportunities and Challenges for Next-Generation Applied Intelligence, Studies in Computational Intelligence, Springer, Vol.214, pp.111--117, Tainan, Taiwan, Jun. 24-27, 2009. doi:10.1007/978-3-540-92814-0_18 IF: 1.853
Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: A Model of Temporally Changing User Behaviors in a Deployed Spoken Dialogue System, G.-J. Houben et al. (Eds.): UMAP 2009, First and Seventeenth International Conference on User Modeling, Adaptation, and Personalization, Lecture Notes in Computer Science 5535, pp.408-414, Trento, Italy, Jun. 22-26, 2009. doi:10.1007/978-3-642-02247-0_45
合原一究, 武田龍, 水本武志, 高橋徹, 奥乃博: ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析, 数解研講究録 1663, pp153-158, 2009年6月24日.
鹿野清宏, 武田一哉, 河原達也, 河原英紀, 猿渡洋, 徳田恵一, 李晃伸, 川波弘道, 西村竜一, Randy Gomez, 戸田智基, 西浦敬信, 高橋徹, 板野秀樹, 全へい河: 総合報告ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発, 電子情報通信学会誌, Vol.92, No.6 (June 2009) pp.475-491.
査読つき国際会議論文
Naoki Yasuraoka, Takuya Yoshioka, Tomohiro Nakatani, Aatsushi Nakamura, Hiroshi G. Okuno: MUSIC DEREVERBERATION USING HARMONIC STRUCTURE SOURCE MODEL AND WIENER FILTER, Proceedings of 2010 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2010), pp.53-56, (lecture), IEEE, Dallus, March, 2010. doi:10.1109/ICASSP.2010.5496223
Takuya Yoshioka, Tomohiro Nakatani, Hiroshi G. Okuno: NOISY SPEECH ENHANCEMENT BASED ON PRIOR KNOWLEDGE ABOUT SPECTRAL ENVELOPE AND HARMONIC STRUCTURE, Proceedings of 2010 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2010), pp.4270-4273, (lecture+poster 48.8%), IEEE, Dallus, March, 2010. doi:10.1109/ICASSP.2010.5495681
Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Bowed String Sequence Estimation of a Violin Based on Adaptive Audio Signal Classification and Context-Dependent Error Correction, Proceedings of IEEE International Symposium on Multimedia (ISM2009), pp.9-16, (acceptance rate for full papers, 19.6%), San Diego, Dec. 14-16, 2009. doi:10.1109/ISM.2009.30
Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Estimation of Reverberation Time with Robot Speech to Improve ICA-based Robot Audition, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2009), pp.250-355, IEEE, Paris, Dec. 7-10, 2009. doi:10.1109/ICHR.2009.5379572
Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Voice quality manipulation for humanoid robots consistent with their head movements, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2009), pp.405-410, IEEE, Paris, Dec. 7-10, 2009. . doi:10.1109/ICHR.2009.5379569
Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G. Okuno: Automatic Speech Recognition Improved by Two-Layered Audio-Visual, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008), pp.604-609, IEEE, Paris, Dec. 7-10, 2009. . doi:10.1109/ICHR.2009.5379586
Hiromasa Fujihara, Masataka Goto, Hiroshi G. Okuno: A NOVEL FRAMEWORK FOR RECOGNIZING PHONEMES OF SINGING VOICE IN POLYPHONIC MUSIC, Proceedings of 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), pp.17-20, Oct. 18-21, New Paltz, NY, 2009. doi:10.1109/IROS.2009.5354527
Takuya Yoshioka, Hirokazu Kameoka, Tomohiro Nakatani, Hiroshi G. Okuno: Statistical models for speech dereverberation, Proceedings of 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), pp.145-148, Oct. 18-21, New Paltz, NY, 2009. doi:10.1109/ASPAA.2009.5346489
Naoki Yasuraoka, Takehiro Abe, Katsutoshi Itoyama, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Changing Timbre and Phrase in Existing Musical Performances as You Like, ACM Multimedia 2009, 203-212 (16% 22/138), Beijing, China, Oct. 19-24, 2009. , doi:10.1145/1631272.1631302
Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Step-size Parameter Adaptation of Multi-channel Semi-blind ICA with Piecewise Linear Model for Barge-in-able Robot Audition (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2273-2282, (900/1650), IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. doi:10.1109/IROS.2009.5354527
Takuma Otsuka, Kazumasa Murata, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Incremental Polyphonic Audio to Score Alignment using Beat Tracking for Singer Robots (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2289-2296, IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. doi:10.1109/IROS.2009.5354637
Takeshi Mizumoto, Hiroshi Tsujino, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno: Thereminist Robot: Development of a Robot Theremin Player with Feedforward and Feedback Arm Control based on a Theremin's Pitch Model (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2297-2302, IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. doi:10.1109/IROS.2009.5354473
Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Missing-Feature-Theory-based Robust Simultaneous Speech Recognition System with Non-clean Speech Acoustic Model (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.2730-2735, IEEE, RSJ, St. Louis, 12-14 (13) Oct. 2009. doi:10.1109/IROS.2009.5354201
Wataru Hinoshita, Tetsuya Ogata, Hideki Kozima, Hisashi Kanda, Toru Takahashi, Hiroshi G. Okuno: Emergence of Evolutional Interaction with Voice and Motion between Two Robots using RNN, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.4196-4291, IEEE, RSJ, St. Louis, 12-14 (14) Oct. 2009. doi:10.1109/IROS.2009.5354887
Shun Nishide, Tetsuhiro Nakagawa, Tetsuya Ogata, Jun Tani, Toru Takahashi, Hiroshi G. Okuno: Modeling Tool-Body Assimilation using Second-order Recurrent Neural Network, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.5376-5381, (900/1650), IEEE, RSJ, St. Louis, 12-14 (14) Oct. 2009. doi:10.1109/IROS.2009.5354655
Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Phoneme Acquisition Model based on Vowel Imitation using Recurrent Neural Network, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009), pp.5388-5393, IEEE, RSJ, St. Louis, 12-14 (14) Oct. 2009. doi:10.1109/IROS.2009.5354825
Kazunori Komatani, Satoshi Ikeda, Yuichiro Fukubayashi, Tetsuya Ogata, Hiroshi G. Okuno: Ranking Help Message Candidates Based on Robust Grammar Verification Results and Utterance History in Spoken Dialogue Systems, Proceedings of the 10th SIGdial Workshop on Discourse and Dialogue (SigDial 2009), 314-321, Sep. 12, 2009.
Kyoko Matsuyama, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Enabling A User To Specify An Item At Any Time During System Enumeration, Proceedings of International Conference on Spoken Language Processing (Interspeech-2009), Mon-Ses2-P4-1, (57.7%), Brighton, 6-10 Sep. 2009.
Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, Kotaro Funakoshi, Tetsuya Ogata, Hiroshi G. Okuno: Improving Speech Understanding Accuracy with Limited Training Data Using Multiple Language Models and Multiple Understanding Models, Proceedings of International Conference on Spoken Language Processing (Interspeech-2009), Thu-Ses1-P4-9, (57.7%), Brighton, 6-10 (10) Sep. 2009.
Hideki Kawahara, Masanori Morise, Toru Takahashi, Hideki Banno, Ryuichi Nishimura, Toshio Irino: Observation of empirical cumulative distribution of vowel spectral distances and its application to vowel based voice conversion, Proceedings of International Conference on Spoken Language Processing (Interspeech-2009), Thu-Ses1-P2-6, (57.7%), Brighton, 6-10 Sep. 2009.
Hiroshi G. Okuno, Kazuhiro Nakadai, Hyun-Don Kim: Robot Auditon: Missing Feature Theory Approach and Active Audition (Invited talk), Proceeding of the 14th International Symposium of Robotics Research (ISRR 2009), August 31 - September 3, 2009, Lucerne, Switzerland, International Foundation of Robotics Research. Springer STAR series.
Ikkyu Aihara, Ryu Takeda, Takeshi Mizumoto, Takuma Otsuka, Toru Takahashi, Hiroshi G. Okuno: Synchronization in Frustrated Calling Behavior of Japanese Tree Frogs, Conference on Dynamics in Systems Biology, Univ. of Aberdeen, UK, Sep. 16, 2009. (oral)
Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: QUERY-BY-EXAMPLE MUSIC RETRIEVAL APPROACH BASED ON MUSICAL GENRE SHIFT BY CHANGING INSTRUMENT VOLUME, Proceeding of the 12th International Conference on Digital Audio Effects (DAFx-09), accepted, Como, Italy, Sep.1-4. 2009.
Shun Shiramatsu, Tadachika Ozono, Toramatsu Shintani, Kazunori Komatani, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno: Development of a Meeting Browser towards Supporting Public Involvement, Proceedings of the 12th IEEE International Conference on Computational Science and Engineering (CSE-09), pp.717-722, Vancouver, Canada, Aug., 2009. doi:10.1109/CSE.2009.362
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Analysis of Motion Searching based on Reliable Predictability using Recurrent Neural Network, Proceedings of 2009 IEEE/ASME Conference on Advanced Intelligent Mechatronics (AIM 2009), 192-197, Singapore, July 14-19, 2009. doi:10.1145/10.1109/AIM.2009.5230015
Kazunori Komatani, Alexander I. Rudnicky: Predicting Barge-in Utterance Errors by using Implicitly-Supervised ASR Accuracy and Barge-in Rate per User, Proceedings of the Fourth International Joint Conference on Natural Language Processing (ACL-IJCNLP 2009), pp.89-92, Jul. 2009.
Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, Kotaro Funakoshi, Hiroshi G. Okuno: A Speech Understanding Framework that Uses Multiple Language Models and Multiple Understanding Models, Proceeding of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies (NAACL HLT) 2009 Conference, pp.133-136, (40%), Boulder, CO, May 31 - Jun. 5, 2009.
Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Prediction and Imitation of Other's Motions by Reusing Own Forward-Inverse Model in Robots, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2009), pp.4144-4149, (699/1624), (May 12-17 (16), 2009), Kobe. doi:10.1145/10.1109/ROBOT.2009.5152363
Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Continuous Vocal Imitation with Self-organized Vowel Spaces in Recurrent Neural Network, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2009), pp.4438-4443, (May 12-17 (16), 2009), Kobe. doi:10.1145/10.1109/ROBOT.2009.5152818
Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: ICA-BASED EFFICIENT BLIND DEREVERBERATION AND ECHO CANCELLATION METHOD FOR BARGE-IN-ABLE ROBOT AUDITION, Proceedings of 2009 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2009), SS-L7.1, pp.3677-3680, (1178/2633), IEEE, Taipei, Taiwan, April 19--24 (23), 2009. doi:10.1109/ICASSP.2009.4960424
Hideki Kawahara, Ryuichi Nisimura, Toshio Irino, Masanori Morise, Toru Takahashi, Hideki Banno: TEMPORALLY VARIABLE MULTI-ASPECT AUDITORY MORPHING ENABLING EXTRAPOLATION WITHOUT OBJECTIVE AND PERCEPTUAL BREAKDOWN, Proceedings of 2009 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2009), pp. IEEE, April 23.
口頭発表（研究会・全国大会）
Takuma Otsuka, Kazuhiro Nakadai, iToru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Score Following by Particle Filtering for Music Robots, 情報処理学会第72回全国大会, 1ZN-2, Mar. 9, 2010.
松山匡子, 駒谷和範, 高橋徹, 尾形哲也, 奥乃博, バージイン許容音声対話におけるLSMによる許容発話範囲の拡張, 情報処理学会第72回全国大会, 2ZN-2, Mar. 9, 2010.
前澤陽, 後藤真孝, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, クラシック音楽理解能力拡張インターフェイスのための同音旋律音量推定手法と主旋律推定への応用, 情報処理学会第72回全国大会, 3T-1, Mar. 10, 2010. 学生奨励賞
勝丸真樹, 駒谷和範, 中野幹生, 船越孝太郎, 辻野広司, 尾形哲也, 奥乃博, 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用 情報処理学会第72回全国大会, 3U-2, Mar. 10, 2010.
平澤恭治, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, スペクトル推定を用いたマイク数以上の同時発話に対する音声認識, 情報処理学会第72回全国大会, 3U-7, Mar. 10, 2010.
山川暢英, 北原鉄朗, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, 環境音から擬音語への自動変換における特徴量抽出法の検討, 情報処理学会第72回全国大会, 3U-9, Mar. 10, 2010. 学生奨励賞
安良岡直希, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, 調波非調波GMMに基づくMIDI演奏音響信号に対する音色・演奏表情操作, 情報処理学会第72回全国大会, 5T-5, Mar. 11, 2010. 学生奨励賞
安良岡直希, 吉岡拓也, 中谷智広, 中村篤, 奥乃博, 調波GMMとWienerフィルタに基づく音楽音響信号の残響抑圧, 情報処理学会第72回全国大会, 5T-4, Mar. 11, 2010.
穐山空道, 駒谷和範, 高橋徹, 尾形哲也, 奥乃博, ユーザの文法知識を状態に加えたPOMDPに基づく音声対話システム, 情報処理学会第72回全国大会, 5U-9, Mar. 11, 2010.
粟野皓光, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博, RNNを用いた行為予測による人間とロボットの協調物体配置, 情報処理学会第72回全国大会, 5V-6, Mar. 11, 2010.
Angelica Lim, 水本武志, 大塚琢馬, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博 : Robot Musical Accompaniment: Real-time Synchronization using Visual Cue Recognition, 情報処理学会第72回全国大会, 6T-7, Mar. 11, 2010.
水本武志, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, 複数自由度を用いて音高特性モデルに基づく音高制御を行うテルミン演奏ロボットの開発, 情報処理学会第72回全国大会, 6T-8, Mar. 11, 2010. 学生奨励賞
阿曽慎平, 齋藤毅, 後藤真孝, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, F0・振幅・音韻長の制御により歌声を話声に変換する話声合成システムSpeakBySinging, 情報処理学会第72回全国大会, 6U-1, Mar. 11, 2010. 学生奨励賞
日下航, 有江浩明, 谷淳, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博, MTRNNを用いた単語と文法の階層的自己組織化による文の認識・生成, 情報処理学会第72回全国大会, 6W-8, Mar. 11, 2010.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博, 楽器音イコライザによる楽曲音響特徴変動と類似楽曲検索への応用, 情報処理学会第72回全国大会, 6J-6, Mar. 11, 2010.
武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博, ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル, 情報処理学会第72回全国大会, 6J-7, Mar. 11, 2010.
高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博, 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング, 情報処理学会第72回全国大会, 6J-8, Mar. 11, 2010.
駒谷和範, 奥乃博, 音声対話システムにおける各ユーザの利用履歴を活用したバージイン発話のエラー検出, 言語処理学会大会, C2-3, pp.218-221, Mar. 9, 2010.
吉岡拓也, 中谷智広, 奥乃博: スペクトル包絡の事前学習と調波構造モデルを併用した音声強調, 日本音響学会2010年春季研究発表会講演論文集, 3-5-9, Mar. 2010. 第28回粟屋潔学術奨励賞
高橋徹, 辻高明, フィールド情報学的アプローチによる複数発話音声認識ロボットの開発, 京都大学ICTイノベーション2010, Feb., 2010.
水本武志: 最古の電子楽器テルミンを演奏するロボットの開発, 自然科学縦横無尽, 理学系異分野交流会, Jan. 2010. (oral)
水本武志: 音声視覚化デバイス「カエルホタル」を用いた音源定位システム, 自然科学縦横無尽, 理学系異分野交流会, Jan. 2010. (poster)
合原一究, 水本武志, 武田龍, 大塚琢馬, 高橋徹, 奥乃博: アマガエルの多体系発声行動に潜む時空間ダイナミクス, 定量生物学の会・第2回年会, Jan. 2010.
張陽, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博: MTRNNによる環境音の予測識別, 第10回システムインテグレーション部門講演会 (SI2009), 計測自動制御学会, Dec. 24-26, 2009.
前澤陽, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: 弦の音響差異を考慮したバイオリン演奏音響信号に対する運指推定, 日本音響学会関西支部第12回若手研究者交流研究発表会, Dec. 5, 2009, 奨励賞
荒木雅弘, 片桐恭弘, 駒谷和範, 堂坂浩二, 中野幹夫, 翠輝久: SIGDial 2009, Young Researchers' Roundtable on Spoken Dialogue Systems 2009 参加報告, 第57回言語・音声理解と対話処理研究会(SIG-SLUD), 東京工業大学, Nov. 20, 2009.
駒谷和範, Alexander I. Rudnicky: 音声対話システムにおける暗黙的な教師信号に基づく音声認識率の推定とそれを用いたエラー予測, 情報処理学会音声言語情報処理研究会, Vol.2009-SLP-78, Oct. 23, 早稲田大学.
Takeshi Mizumoto, Hiroshi Tsujino, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Thereminist Robot: Development of a Robot Theremin Player based on a Theremin's Pitch Model, Special SIGMUS Symposium, Nov 2, 2009.
吉岡拓也, 中谷智広, 奥乃博: 重みつき予測誤差法におけるMIMO残響除去フィルタの効率的最適化法, 日本音響学会2009年秋季研究発表会講演論文集, Sep., 2009,
吉岡拓也, 亀岡弘和, 中谷智広, 奥乃博: 少量データに頑健な残響抑圧のためのMSPP法, 日本音響学会2009年秋季研究発表会講演論文集, Sep., 2009,
前澤陽, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: 音響信号とコンテキスト制約を併用したバイオリン演奏弦系列の推定, 日本音響学会2009年秋季研究発表会講演論文集, 2-5-15, Sep., 2009,
尾形哲也, 神田尚, 高橋徹, 駒谷和範, 奥乃博: 声道物理モデルの母音列繰り返し模倣による音素獲得シミュレーション (基調講演), 日本ロボット学会第27回学術講演会, 1I2-01, 横浜国立大学, Sep. 2009.
高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: 頭部音響伝達関数を用いたGSSによる3話者同時発話認識〜HARK 1.0.0 の新機能〜, 日本ロボット学会第27回学術講演会, 1I2-02横浜国立大学, Sep. 2009.
大塚琢馬, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: Voice-Awareness Control Consistent with Robot's Body Movements, 日本ロボット学会第27回学術講演会, 1I2-04, 横浜国立大学, Sep. 2009.
水本武志, 辻野広司, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: テルミン演奏ロボットのための音高依存性を考慮した音量モデル. 日本ロボット学会第27回学術講演会, 1I3-01, 横浜国立大学, Sep. 2009.
松山匡子, 駒谷和範, 武田龍, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: ロボット音声対話におけるバージン発話の指示対象同定, 日本ロボット学会第27回学術講演会, 1I3-02, 横浜国立大学, Sep. 2009.
吉田尚水, 中臺一博, 奥乃博: ロボット聴覚のための2階層視聴覚情報統合を用いた音声認識システムの検討, 日本ロボット学会第27回学術講演会, 1I3-04, 横浜国立大学, Sep. 2009.
西出俊, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 二次リカンレトニューラルネットワークを用いた道具身体化モデルの構築, 日本ロボット学会第27回学術講演会, 2S1-03, 横浜国立大学, Sep. 2009.
日下航, 神田尚, 尾形哲也, 小嶋秀樹, 奥乃博: RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションモデル, 日本ロボット学会第27回学術講演会, 3S2-03, 横浜国立大学, Sep. 2009.
奥乃博: ロボット聴覚が切り開く新たな可能性, 日本ロボット学会第27回学術講演会, 一般公開セッション「サイボーグ技術は動き出すか? -- ロボット技術と人間機能の協調--」, 横浜国立大学, Sep. 17, 2009.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 多重奏楽曲の楽器音量バランス変化による音楽ジャンルシフト, 音楽情報科学研究会, Vol.2009-MUS-81, No.3, pp.1-6, 情報処理学会, Jul. 2009.
前澤陽, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: 音響信号と音楽的制約を統合したバイオリンの演奏弦系列の推定, 音楽情報科学研究会, Vol.2009-MUS-81, No.5, pp.1-6, 情報処理学会, Jul. 2009.
安良岡直希, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: 残差スペクトルモデルによる伴奏・残響成分抑制に基づいた楽器演奏分析合成の高精度化, 音楽情報科学研究会, Vol.2009-MUS-81, No.10, pp.1-6, 情報処理学会, Jul. 2009.
藤原弘将, 後藤真孝, 奥乃博: 多重奏中の歌声の基本周波数と音素を同時に推定可能な新たなフレームワーク, 音楽情報科学研究会, Vol.2009-MUS-, No.11, pp.1-8, 情報処理学会, Jul. 2009.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 複数楽器混合モデルのパラメータ推定と楽器名同定への応用, 音楽情報科学研究会, Vol.2009-MUS-81, No.13, pp.1-6, 情報処理学会, Jul. 2009.
駒谷和範, 池田智志, 福林雄一朗, 尾形哲也, 奥乃博: 音声対話システムにおける文法検証結果と発話履歴に基づくヘルプメッセージ候補のランキング, 情報処理学会音声言語情報処理研究会, Vol.2009-SLP-77, No.12, pp.1-6, 飯坂温泉, July 17-18, 2009, 情報処理学会.
松山匡子, 駒谷和範, 武田龍, 尾形哲也, 奥乃博: バージイン発話タイミングを導入した指示対象同定, 情報処理学会音声言語情報処理研究会, Vol.2009-SLP-76, No.4, pp.1-7, 情報処理学会, May 2009. 学生奨励賞
特許・ディジタルコンテンツ
Robot Auditory Apparatus. Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, Europian Patent EP 1,306,832, Publication Date: 02/24/2010 Filing Date: 06/08/2001
音楽音響信号生成システム発明者: 安部武宏, 糸山克寿, 奥乃博, 出願番号: PCT/JP2010/052293. 出願日: 2010年2月16日
Sound source tracking system, method and robot. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Yuji Hasegawa, Hiroshi Okuno. Publication No: 20100034397, Publication Date: 2010-02-11. Application No: 12/293358, Application Date: 2007-05-09.
音声認識装置及び音声認識装置のマスク生成法, 発明者：中臺一博, 高橋徹, 奥乃博, 特開2010-49249号, 2010年3月4日. 特願2009-185164号, 2009年8月7日.
ビートトラッキング装置, ビートトラッキング方法, 記録媒体, ビートトラッキング用プログラム, 及びロボット, 発明者：中臺一博, 長谷川雄二, 辻野広司, 村田和真, 武田龍, 奥乃博, 特開2010-026512号, 2010年2月4日. 特願2009-166048号, 2009年7月14日.
ビートトラッキング装置, ビートトラッキング方法, 記録媒体, ビートトラッキング用プログラム, 及びロボット, 発明者：中臺一博, 長谷川雄二, 辻野広司, 村田和真, 武田龍, 奥乃博, 特開2010-026513号, 2010年2月4日. 特願2009-166049号, 2009年7月14日.
楽器音の音高・音長操作システム, 京都大学デジタルコンテンツ C46, Aug 2009. 開発者: 安部武宏, 糸山克寿, 奥乃博
音楽音響信号の音源分離システム, 京都大学デジタルコンテンツ C45, May 2009. 開発者: 糸山克寿, 奥乃博, 後藤真孝
音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム. 発明者：後藤真孝, 吉井和佳, 奥乃博, 特許第4318119号, 平成21年6月5日, 特願2004-181881号, 出願日 2004年6月18日, 登録日 2004年6月23日.
Robotics visual and auditory system, Patent No. US 7,526,361, Date of Patent: Apr. 28, 2009. Inventors: Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, PCT Files: Aug. 30, 2002. PCT No.: PCT/JP02/08827.

2009年度  ２００８年度（奥乃・尾形研究室） 2007年度

学位論文

西出俊: Self-Organization of Invariants for Motion Generation based on Reliable Predictability (予測信頼性に基づく動作生成のための不変項の自己組織化), 博士論文 (指導教員: 奥乃博教授), Feb. 2009.
Hyun-Don Kim: Binaural Active Audition for Humanoid Robots, (ヒューマノイドロボットのためのバイノーラルアクティブオーディション), 博士論文 (指導教員: 奥乃博教授), Sep. 2008.
安部武宏: インハーモニシティを組み込んだ調波・非調波統合モデルに基づく楽器音の音高・音長・音色操作, 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
池田智志: 想定外発話に頑健なマルチドメイン音声対話システムのためのドメイン選択とヘルプ提示戦略, 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
神田尚: 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得過程シミュレーション, 修士論文 (指導教員: 尾形哲也准教授), Feb. 2008.
久保田祐史: 聴覚的アウエアネスの改善：顔動作による3次元音環境可視化システムの設計と実装, 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
王凱平: Query-By-Example music retrieval approach based on music genre change by adjusting instrument volumes (楽器音量操作による楽曲ジャンル変化を利用した事例に基づく音楽検索法), 修士論文 (指導教員: 奥乃博教授), Feb. 2008.
大塚琢馬: 歌唱ロボットのためのビートトラッキングを用いた多重奏音楽音響信号の逐次的楽譜同期, 卒業特別研究報告, Feb. 2009.
日下航: RNNを用いた2体のロボット間マルチモーダルインタラクションにおけるモダリティマッピングの共有化, 卒業特別研究報告, Feb. 2009.
松山匡子: 音声対話システムにおけるバージンタイミングと音声認識結果の統合による指示対象同定, 卒業特別研究報告, Feb. 2009.
安良岡直希: 連続発音による生ずる音色特徴量変分の操作に基づく楽器演奏表情付けと音響信号の合成, 卒業特別研究報告, Feb. 2009.
中川達裕: ロボットによる道具利用のための自己モデル変換を通じた道具身体化モデル, 卒業特別研究報告, Feb. 2009.
査読つきジャーナル論文
安部武宏, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: 音色の音高依存性を考慮した楽器音の音高操作手法, 情報処理学会論文誌, Vol.50, No.3 (Mar., 2009) 1054-1066, 情報処理学会. , DL
池田智志, 駒谷和範, 尾形哲也, 奥乃博: マルチドメイン音声対話システムにおけるトピック推定と対話履歴の統合によるドメイン選択手法, 情報処理学会論文誌, Vol.50, No.2 (Feb., 2009) 488-500, 情報処理学会. , DL
森勢将雅, 高橋徹, 河原英紀, 入野俊夫: 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析, 電子情報通信学会論文誌, 和文A分冊, Vol.J92-A, No.3 (Mar. 2009) 163-171.
Shun Shiramatsu, Kazunori Komatani, Koiti Hasida, Tetsuya Ogata, Hiroshi G. Okuno: A Game-Theoretic Model of Referential Coherence and Its Empirical Verification Using Large Japanese and English Corpora, ACM Transactions on Speech and Language Processing, Vol.5, No.3 (Oct. 2008) Article 6, ACM. doi:10.1145/1410358.1410360
藤原弘将, 後藤真孝, 奥乃博: 歌声の統計的モデル化とビタビ探索を用いた多重奏中のボーカルパートに対する音高推定手法, 情報処理学会論文誌, Vol.49, No.10 (Oct. 2008) pp.3682-3693, 情報処理学会. , DL
Chyon Hae Kin, Tetsuya Ogata, Shigeki Sugano: Reinforcement Signal Propagation Algorithm for Logic Circuit, Journal of Robotics and Mechatronics, Vol.20, No.5 (Oct. 2008) pp757-774.
Kazunori Komatani, Satoshi Ikeda, Tetsuya Ogata, Hiroshi G. Okuno: Managing out-of-grammar utterances by topic estimation with domain extensibility in multi-domain spoken dialogue systems, Speech Communication, Vol.50, No.10 (2008) 836-870. doi:10.1016/j.specom.2008.05.010
武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: 独立成分分析に基づく適応フィルタのロボット聴覚への応用, 日本ロボット学会誌, Vol.26, No.6 (2008) pp.529-536. , 学会サーバ
Yuki Suga, Tetsuya Ogata, Shigeki Sugano: Human-Adaptive Robot Interaction using Interactive EC with Human-Machine Hybrid Evaluation, Journal of Robotics and Mechatronics, Vol.20, No.4 (Aug. 2008) pp.610-620.
Hayeong Jeong, Shun Shiramatsu, Kiyoshi Kobayashi, and Tsuyoshi Hatori: Discourse Analysis of Public Debates Using Corpus Linguistic Methodologies, Journal of Computers, Vol.3, No.8 (Aug. 2008) pp.58--68.
福林雄一朗, 駒谷和範, 中野幹生, 船越孝太郎, 辻野広司, 尾形哲也, 奥乃博: 音声対話システムにおけるラピッドプロトタイピングを指向したWFSTに基づく言語理解, 情報処理学会論文誌, Vol.49, No.8 (Aug. 2008) pp.2762--2772, 情報処理学会. , DL
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Predicting Object Dynamics from Visual Images through Active Sensing Experiences, Advanced Robotics, Vol.22, Issue 5 (May 2008) pp.527-546, doi:10.1163/156855308X294879 Online version, VSP and Robotics Society of Japan. IF: 0.510
Hiroshi G. Okuno, Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata: A Portable Robot Audition Software System for Multiple Simultaneous Speech Signals, Journal of Acoustic Society of America, Vol.123, No.5 (May 2008) Pt.2, pp.3066-3067.
Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Hideki Banno, Toshio Irino: A temporally stable representation of power spectra of periodic signals and its application to F0 and periodicity estimation, Journal of Acoustic Society of America, Vol.123, No.5 (May 2008) Pt.2, pp.3074-3075.
編書・章分担・解説論文・翻訳
Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SalienceGraph: Visualizing Salience Dynamics of Written Discourse by Using Reference Probability and PLSA, T. B. Ho and Z-H. Zhou (Eds.): PRICAI-2008: Trends in Artificial Intelligence, 890-902, (84/234, 35.8%), Lecture Notes in Computer Science, Vol.5351, Springer-Verlag, Dec. 2008. doi:10.1007/978-3-540-89197-0_83
合原一究: アマガエルの合唱に潜む非線形ダイナミクス, 科学, 78:11, pp.1267-1270, (Nov. 2008), 岩波書店．
奥乃博: 多数の人の声を一度に聞き分ける聴覚センサ, 日経エレクトロニクス, 2008年9月22日号, 115-123.
Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Integrating Topic Estimation and Dialogue History for Domain Selection in Multi-Domain Spoken Dialogue Systems, Ngoc Thanh Nguyen,Leszek Borzemski,Adam Grzech,Moonis Ali (Eds.): New Frontiers in Applied Artificial Intelligence, pp.294-304, Lecture Notes in Artificial Intelligence, Vol.5027, June, 2008. doi:10.1007/978-3-540-69052-8_31
Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Vowel Imitation using Vocal Tract Model and Recurrent Neural Network, Masumi Ishikawa, Kenji Doya, Hiroyuki Miyamoto, Takeshi Yamakawa (Eds.): Neural Information Processing, 14th International Conference, ICONIP 2007, Revised Selected Papers, Part II, pp.222-232, Lecture Notes in Computer Science 4985, Springer-Verlag, June 2008. doi:10.1007/978-3-540-69162-4_24
奥乃博: 洛書「触媒としての教員 -- 自学自習へのある試み」, 京大広報, No.634, 2008年5月.
Tetsuya Ogata, Hideki Kojima, Hiroshi G. Okuno: Motion Emergence from Sound using Cross-Modal Mapping on Recurrent Neural Network, Aucouturier, J.-J. (ed.) Cheek to Chip: Dancing Robots and AI's Future, IEEE Intelligent Systems, Vol.23, No.2 (Apr. 2008), 74--84, doi:10.1109/MIS.2008.22
査読つき国際会議論文
Masato Onishi, Toru Takahashi, Toshio Irino, Hideki Kawahara: Vowel-based frequency alignment function design and recognition-based time alignment for automatic speech morphing, Proceedings of IEEE Workshop on Spoken Language Technology 2008 (SLT 2008), accepted, Goa, India, December, 15--18, 2008,
Yuji Kubota, Masatoshi Yoshida, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Implementation of 3D Auditory Scene Visualizer towards Auditory Awareness with Face Tracking, Proceedings of IEEE International Symposium on Multimedia (ISM2008), pp.468-476 (acceptance rate for regular papers, 24%), Berkeley, Dec. 16. 2008. doi:10.1109/ISM.2008.107
Yuji Kubota, Shun Shiramatsu, Masatoshi Yoshida, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: 3D Auditory Scene Visualizer With Face Tracking: Design and Implementation For Auditory Awareness Compensation, Proceedings of 2nd International Symposium on Universal Communication (ISUC2008), pp.42-49, IEEE, Osaka, Dec. 15. 2008. doi:10.1109/ISUC.2008.59
Kazuhiro Nakadai, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino: An Open Source Software System For Robot Audition HARK and Its Evaluation, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008), pp.561-566, Daejeon, Korea, Dec. 3, 2008. doi:10.1109/ICHR.2008.4756031
Kazumasa Murata, Kazuhiro Nakadai, Ryu Takeda, Hiroshi G. Okuno, Toyotaka Torii, Yuji Hasegawa, Hiroshi Tsujino: A Beat-Tracking Robot for Human-Robot Interaction and Its Evaluation, Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008), pp.79-84, Daejeon, Korea, Dec. 2, 2008. doi:10.1109/ICHR.2008.4755935
Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SalienceGraph: Visualizing Salience Dynamics of Written Discourse by Using Reference Probability and PLSA, <Proceedings of the Tenth Pacific Rim International Conference on Artificial Intelligence (PRICAI-08), 890-902, (84/234, 35.8%), Lecture Notes in Computer Science, Vol.5351, Springer-Verlag, Hanoi, Vienam, Dec. 15-19. 2008. doi:10.1007/978-3-540-89197-0_83
Hiroshi G. Okuno: Computational Auditory Scene Analysis and Its Application to Robot Audition (Invited Talk), Proceedings of the Second International Symposium on Robotics and Artificial Intelligence, University of Electro-Communication and Shanghai Jiao Tong University, 9 Oct. 2008.
Ikkyu Aihara: Synchronization and Frustration in Calling Behavior of Japanese Tree Frogs, Dynamics Days Asia Pacific 5 (DDAP5), September, 2008.(oral)
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Analysis of Reliable Predictability based Motion Generation using RNNPB, Proceedings of Joint 4th International Conference on Soft Computing and Intelligent Systems and 9th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2008), pp.305-310, Nagoya, JAPAN, September 17-21, 2008.
Hideki Kawahara, Masanori Morise, Hideki Banno, Toru Takahashi, Ryuichi Nishimura, Toshio Irino: Spectral Envelope Recovery beyond the Nyquist Limit for High-Quality Manipulation of Speech Sounds, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.22-26, Brisbane, Sept. 24, 2008.
Toru Takahashi, Shun'ichi Yamamoto, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno:Soft Missing-Feature Mask Generation for Simultaneous Speech Recognition System in Robots, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.992-997, Brisbane, Sept. 24, 2008.
Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Predicting ASR Errors by Exploiting Barge-In Rate of Individual Users for Spoken Dialogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.183--186, Brisbane, Sept. 2008.
Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Expanding Vocabulary for Recognizing User\'s Abbreviations of Proper Nouns without Increasing ASR Error Rates in Spoken Dialogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.187-190, Brisbane, Sept. 2008.
Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno:Extensibility Verification of Robust Domain Selection against Out-of-Grammar Utterances in Multi-Domain Spoken Dialogue System, Proceedings of International Conference on Spoken Language Processing (Interspeech-2008), pp.487-490, Brisbane, Sept. 2008.
Shun Nishide, Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Active Ssensing based Dynamical Object Feature Extraction, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), pp.1-7, TuAT1.1, IEEE, RSJ, Nice, 23 Sep. 2008. doi:10.1109/IROS.2008.4650794
Takeshi Mizumoto, Ryu Takeda, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: A Robot Listens to Music and Counts Its Beats Aloud by Separating Music from Counting Voice, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1538-1543, WeAT6.1 IEEE, RSJ, Nice, 24 Sep. 2008. doi:10.1109/IROS.2008.4650821
Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist.
Hyun-Don Kim, Jinsung Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Target Speech Detection and Separation for Humanoid Robot in Sparse Dialogue with Noisy Home Environments (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1705-1711, WeAT10.4 IEEE, RSJ, Nice, 24 Sep. 2008. doi:10.1109/IROS.2008.4650977
Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Segmenting Acoustic Signal with Articulatory Movement using Recurrent Neural Network for Phoneme Aquisition (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1712-1717, WeAT10.5 IEEE, RSJ, Nice, 24 Sep. 2008. doi:10.1109/IROS.2008.4651060
Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Barge-in-able Robot Audition Based on ICA and Missing Feature Theory under Semi-Blind Situation (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), 1718-1723, WeAT10.6, IEEE, RSJ, Nice, 24 Sep. 2008. doi:10.1109/IROS.2008.4650821
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Evaluation of Two-Channel Sound Source Localization over Entire Azimuth Range for Moving Talker (Invited paper), Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), pp.2197-2203 Sept. 2008 IEEE, RSJ, Nice, Sept. 2008. doi:10.1109/IROS.2008.4650947
Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotaka Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino: A Robot Uses Its Own Microphone to Synchronize Its Steps to Musical Beats While Scatting and Singing, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008), pp.2459-2464, WeCT6.1, IEEE, RSJ, Nice, 24 Sep. 2008. doi:10.1109/IROS.2008.4650596
Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist.
Kohei Sumi, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Chord Recognition Based on Probabilistic Integration of Chord Transition and Bass Pitch Estimation, Proceedings of 9th International Conference on Musical Information Retrieval (ISMIR-2008), 39-44, Philadelphia, 15 Sep. 2008.
Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrument Equalizer for Query-by-Example Retrieval: Improving Sound Source Separation based on Integrated Harmonic and Inharmonic Models, Proceedings of 9th International Conference on Musical Information Retrieval (ISMIR-2008),133-138, Philadelphia, 15 Sep. 2008.
Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotake Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino: A Robot Singer with Music Recognition Based on Real-Time Beat Tracking, Proceedings of 9th International Conference on Musical Information Retrieval (ISMIR-2008), 199-204, Philadelphia, 15 Sep. 2008.
Takehiro Abe, Katsutoshi Itoyama, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Synthesis Approach for Manipulating Pitch of a Musical Instrument Sound with Considering Timbral Characteristics, Proceeding of the 11th International Conference on Digital Audio Effects (DAFx-08), 249-256, Espoo, Finland, Sep.1-4. 2008.
Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Integrating Topic Estimation and Dialogue History for Domain Selection in Multi-Domain Spoken Dialogue Systems Proceeding of the 21st International Conference on Industrial, Engineering and Other Applications of Applied Intelligence Systems (IEA/AIE-2008), pp.294-304, (acceptance rate is about 30%), LNAI 5027, Wroclaw, Poland, Jun. 18, 2008. doi:10.1007/978-3-540-69052-8_31
Hiroshi G. Okuno, Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata: A Portable Robot Audition Software System for Multiple Simultaneous Speech Signals, Proceedings of Acoustics'08, CD-ROM , 1pSCa8, June 30, 2008.
Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Hideki Banno, Toshio Irino: A temporally stable representation of power spectra of periodic signals and its application to F0 and periodicity estimation, Proceedings of Acoustics'08, CD-ROM , 1pSCc24, June 30, 2008.
Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Hideki Banno, Toshio Irino: A unified approach for F0 extraction and aperiodicity estimation based on a temporally stable power spectral representation, Proceedings of ISCA Tutorial and Research Workshop (ITRW) on "Speech Analysis and Processing for Knowledge Discovery", June 4, 2008, Aalborg, DK.
Shun Nishide, Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Object Dynamics Prediction and Motion Generation based on Reliable Predictability, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008), 1608-1614, (May 20, 2008). doi:10.1109/ROBOT.2008.4543431
Kazuhiro Nakadai, Shun'ichi Yamamoto, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino: A Robot Referee for Rock-Paper-Scissors Sound Games, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008), 3469--3474, (May 20, 2008). doi:10.1109/ROBOT.2008.4543741
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Two-Channel-Based Voice Activity Detection for Humanoid Robots in Noisy Home Environments, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008), 3495-3501, (May 20, 2008). doi:10.1109/ROBOT.2008.4543745
Hiroshi G. Okuno, Kazuhiro Nakadai: COMPUTATIONAL AUDITORY SCENE ANALYSIS AND ITS APPLICATION TO ROBOT AUDITION, (invited talk), Proceedings of Hands-free Speech Communication and Microphone Arrays (HSCMA-2008), pp.123-127, May 7, 2008, Trento, Italy. doi:10.1109/HSCMA.2008.4538702
Hideki Kawahara, Masanori Morise, Toru Takahashi, Ryuichi Nishimura, Toshio Irino, Hideki Banno: TANDEM-STRAIGHT: A Temporally Stable Power Spectral Representation for Periodic Signals and Applications to Interference-free Spectrum, F0, and Aperiodicity Estimation, Proceedings of 2008 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2008), pp.3933-3936, IEEE, Las Vegas, Nevada, USA, March 30 - April 4, 2008.
口頭発表（研究会・全国大会）
合原一究, 武田龍, 水本武志, 高橋徹, 合原一幸, 奥乃博: ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析, ニューロコンピューティング研究会, 2009年3月13日.
鈴木茉莉緒, 進矢正宏高橋徹, 糸山克寿, 奥乃博, 小田伸午: 西洋古典歌唱における発声時の頭部, 頸部, 胸部の姿勢変化, 京都体育学会, Mar. 2009.
合原一究, 水本武志, 武田龍, 大塚琢馬, 高橋徹, 奥乃博: Time-delayed model on frogs' calling behavior and novel device for localizing calling animals, 第14回聴覚研究フォーラム, P2, Mar. 2009.
高野秀樹, 須見康平, 糸山克寿, 駒谷和範, 尾形哲也, 奥乃博: ベース音高とクロマベクトルの相関に基づいた和音進行認識, 情報処理学会第71回全国大会, 5R-6, Mar. 2009.
安良岡直希, 安部武宏, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: 連続発音中の音色変化に着目した未学習譜面情への演奏信号生成, 情報処理学会第71回全国大会, 4R-1, Mar. 2009. 学生奨励賞
安部武宏, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: 音色特徴量に基づく調波・非調波統合モデルによる楽器音モーフィング, 情報処理学会第71回全国大会, 4R-2, Mar. 2009.
前澤陽, 糸山克寿, 高橋徹, 尾形哲也, 奥乃博: Probabilistic Classification of Monophonic Instrument Playing Techniques, 情報処理学会第71回全国大会, 4R-3, Mar. 2009.
Wang Kaiping, 糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: A Music Retrieval Approach from Alternative Genres of Query by Adjusting Instrument Volume, 情報処理学会第71回全国大会, 5R-5, Mar. 2009.
井上真大, 奥乃博: 本質的に異なる数独解盤面の列挙と番号付け, 情報処理学会第71回全国大会, 5ZC-6, Mar. 2009.
高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識, 情報処理学会第71回全国大会, 2D-1, Mar. 2009.
水本武志, 辻野広司, 尾形哲也, 高橋徹, 奥乃博: 楽器の内部モデルに基づくフィードフォワード制御によるテルミン演奏ロボットの開発, 情報処理学会第71回全国大会, 4ZC-2, Mar. 2009.
大塚琢馬, 村田和真, 武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博, 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発, 情報処理学会第71回全国大会, 5R-7, Mar. 2009.
水本武志, 合原一究, 高橋徹, 尾形哲也, 奥乃博: フィールドにおける音源定位のための音声視覚化デバイス「カエルホタル」の設計, 情報処理学会第71回全国大会, 6U-5, Mar. 2009. 学生奨励賞
久保田祐史, 白松俊: 駒谷和範, 尾形哲也, 奥乃博: 顔追跡による音環境可視化システムのアウエアネスの改善, 情報処理学会第71回全国大会, 3Y-2, Mar. 2009.
勝丸真樹, 中野幹生, 駒谷和範, 成松宏美, 船腰孝太郎, 辻野広司, 高橋徹, 尾形哲也, 奥乃博: 音声認識と言語理解を動的に選択する音声理解フレームワーク, 情報処理学会第71回全国大会, 4Q-2, Mar. 2009.
松山匡子, 駒谷和範, 白松俊: 武田龍, 尾形哲也, 奥乃博: 実環境音声対話システムにおけるバージイン発話タイミングを活用した指示対象の同定, 情報処理学会第71回全国大会, 4Q-3, Mar. 2009.
池田智志, 駒谷和範, 高橋徹, 尾形哲也, 奥乃博: 音声対話システムにおける想定外発話の文法検証を用いた対話行為推定に基づくヘルプ生成, 情報処理学会第71回全国大会, 4Q-4, Mar. 2009.
神田尚, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博: 神経回路モデルを用いた音声模倣モデルによる音声バブリングと音声獲得過程シミュレーション, 情報処理学会第71回全国大会, 5Q-3, Mar. 2009. 学生奨励賞
日下航, 神田尚, 尾形哲也, 小嶋秀樹, 奥乃博: RNNを備えた2対の小型ロボット間の首振り動作と音声によるインタラクションにおける共有シンボルの創発, 情報処理学会第71回全国大会, 5S-1, Mar. 2009. 学生奨励賞 大会奨励賞
中川達裕, 尾形哲也, 谷淳, 高橋徹, 奥乃博: ロボットによる卓上物体操作のためのRNNを用いた道具身体化モデルの構築, 情報処理学会第71回全国大会, 3D-3, Mar. 2009. 大会奨励賞
合原一究, 武田龍, 水本武志, 高橋徹, 合原一幸, 奥乃博: ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析, 電子情報通信学会技術研究報告, NC, ニューロコンピューティング, 108(480), 335-339, 2009年3月4日.
白松俊, 駒谷和範, 尾形哲也, 高橋徹, 奥乃博: 話題遷移図の可視化と話題遷移に応じた関連情報提示による議事録閲覧支援, 言語処理学会第15回年次大会, D2-1, Mar. 3, 2009.
武田龍: 独立成分分析と雑音下音声認識技術によるロボット聴覚, 京都大学ICTイノベーション2009, 2009年2月20日.
高橋徹: 聖徳太子ロボットから順風耳ロボットへ, 京都大学ICTイノベーション2009, 2009年2月20日.
合原一究: アマガエルの同期した発声行動に関する数理的・実験的研究, 北陸応用数理研究会2009, 2009年2月12日.
勝丸真樹, 中野幹生, 駒谷和範, 成松宏美, 船腰孝太郎, 辻野広司, 高橋徹, 尾形哲也, 奥乃博: 複数の言語モデル・言語理解方式を用いた音声理解の高精度化, 第75回音声言語情報処理研究会, 2009-SLP-75 (9), pp.45-50, 情処研報, Vol.2009, No.10, 情報処理学会, 越後湯沢, Feb. 7, 2009.
合原一究, アマガエルの発声行動における同期現象, 第2回自己組織化討論会, 2008年1月12日.
Ikkyu Aihara, Takeshi Mizumoto, Toru Takahashi, Ryu Takeda, Hiroshi G.Okuno: Complex Synchronization in Calling Behavior of Three Japanese Tree Frogs, 第13回聴覚研究フォーラム、2008年12月.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 楽器音イコライザ：楽器パートの音量を操作可能なオーディオプレイーヤ, (社)音響学会関西支部第11回若手研究者交流研究発表会, 2008年12月17日. 優秀賞
神田尚, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博: RNNを用いた構音運動分節化に基づく連続母音模倣モデル, (社)音響学会関西支部第11回若手研究者交流研究発表会, 2008年12月17日.
合原一究, 武田龍, 高橋徹, 水本武志, 奥乃博: アマガエルの同期した発声行動に関する実験的・数理的研究, (社)音響学会関西支部第11回若手研究者交流研究発表会, 2008年12月17日. 最優秀賞
河原英紀, 森勢将雅, 高橋徹, 坂野秀樹, 西村竜一, 入野俊夫: 実時間操作インタフェースへの応用を目的とした歌唱モーフィング操作パラメタの時系列への拡張について, 第78回音楽情報科学研究会, 日本音響学会音楽音響研究会, pp.xx--xx, Dec. 19--20, 2008.(草津／滋賀), (発表日12月20日)
河原英紀, 森勢将雅, 高橋徹坂野秀樹, 西村竜一, 入野俊夫: 基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出について, 電子情報通信学会技術研究報告, SP2008-xx, vol.xxx, no.xxx, pp.xx--xx, December, 9--10, 2008. (早稲田／東京), (発表日12月xx日)
神田尚, 尾形哲也, 高橋徹, 駒谷和範, 奥乃博: 連続音響信号と構音情報の分節化に基づく母音音声模倣モデル, 第9回システムインテグレーション部門講演会(SI2008), pp. 639-640, 計測自動制御学会, Dec. 5-7, 2008.
西出俊, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: ロボットによるRNNPBを用いた高予測信頼性動作探索とその解析, 第9回システムインテグレーション部門講演会(SI2008), pp. 81-82, 計測自動制御学会, Dec. 5-7, 2008.
Ikkyu Aihara, Ryu Takeda, Toru Takahashi, Takeshi Mizumoto, Hiroshi G.Okuno: Experimental and Theoretical Studies on Synchronized Calling Behavior of Three Japanese Tree Frogs, 日本スロベニア共同セミナー, 2008年11月.
合原一究, ニホンアマガエルの発声行動における時空間構造, 第66回形の科学シンポジウム, 2008年11月.
吉井和佳, 後藤真孝, 奥乃博: HybridRecommender: 安心感と意外性を兼ね備えた音楽推薦システム, WISS2008 デモ・ポスターセッション, 2008年11月27日.
Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G. Okuno: Vocal Imitation Model with Segmenting and Composing Capability of Vowel Structure using Recurrent Neural Network, 第28回 AI チャレンジ研究会, SIG-Challenge-A802-2, pp.7--12, 人工知能学会, Nov. 2008.
村田和真中臺一博, 武田龍, 奥乃博, 長谷川雄二, 辻野広司: ビートトラッキングロボットの構築と評価, 第28回 AI チャレンジ研究会, SIG-Challenge-A802-3, pp.13--20, 人工知能学会, Nov. 2008. (社)人工知能学会 2008年度研究会優秀賞
森勢将雅, 坂野秀樹, 高橋徹, 河原英紀, 片寄晴弘: 歌唱モーフィングインタフェースにおける実時間インタラクションの検討, 日本音響学会2008年秋季研究発表会講演論文集, p.95, Sept. 10--12, 2008, (九州大学/福岡), (発表日 9月10日).
大西壮登, 高橋徹, 入野俊夫, 河原英紀: 母音情報を用いた自動化音声モーフィングの方式パラメータの評価について, 日本音響学会2008年秋季研究発表会講演論文集, p.53, Sep. 10--12, 2008, (九州大学/福岡), (発表日 9月10日).
河原英紀, 森勢将雅, 高橋徹, 坂野秀紀, 大西壮登, 板垣英恵, 西村竜一, 入野俊夫: 零周波数フィルタ信号に基づく基本周波数抽出法の評価と応用について, 日本音響学会2008年秋季研究発表会講演論文集, p.99, Sep. 10--12, 2008, (九州大学/福岡), (発表日 9月11日).
高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: ミッシングフィーチャ理論に基づく複数話者同時発話音声認識における音響特徴量とマスクの検討, 日本音響学会 2008年秋季研究発表会講演論文集, p.95-06, 10-12 Sep. 2008.
高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: ロボット聴覚のためのソフトマスク生成法による周辺話者音声認識率の改善, 日本ロボット学会第26回学術講演会, 1A1-01, pp.43-46, 9-11, Sep. 2008.
水本武志, 武田龍, 吉井和佳, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博: 聴覚機能を持つ音楽ロボットのためのアーキテクチャの設計とビートカウントロボットへの適用, 日本ロボット学会第26回学術講演会, 1A1-02 , Sep. 2008.
村田和真, 中臺一博, 武田龍, 吉井和佳, 奥乃博, 鳥井豊隆, 長谷川雄二, 辻野広司: 人・ロボットインタラクションに向けたビートトラッキングロボットの開発とその評価, 日本ロボット学会第26回学術講演会, 1A1-03 , Sep. 2008.
神田尚, 尾形哲也, 駒谷和範, 奥乃博: RNNを用いた連続音響信号からの母音構造と遷移情報の抽出, 日本ロボット学会第26回学術講演会, 1A2-01, Sep. 2008.
武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: 独立成分分析を応用したロボット聴覚による残響下におけるバージイン発話認識, 日本ロボット学会第26回学術講演会, 1A2-02, Sep. 2008.
中臺一博, 奥乃博, 中島弘史, 長谷川雄二, 辻野広司: ロボット聴覚オープンソースソフトウェアHARKの概要と評価, 日本ロボット学会第26回学術講演会, 1A2-04 , Sep. 2008.
尾形哲也, 横矢龍之介, 谷淳, 駒谷和範, 奥乃博: ロボットにおける自己身体の順逆モデルを再利用した他者行為の予測と模倣, 日本ロボット学会第26回学術講演会, 1J1-04, Sep. 2008.
西出俊, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 物体挙動予測モデルによる動画像特徴量の自己組織化, 日本ロボット学会第26回学術講演会, 2N2-04, Sep. 2008.
近藤裕樹, 奥出京司郎, 岩丸大二郎, 守良真, 菅佑樹, 尾形哲也, 菅野重樹: 形態主張型コミュニケーションロボットにおける研究〜形態主張行動の解かり易さのユーザへの影響にかんする研究〜, 日本ロボット学会第26回学術講演会, 3J2-02, Sep. 2008.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 楽器音イコライザによる音色の類似度に基づく楽曲検索システム, 音楽情報科学研究会, 2008-MUS-78-24, Vol.2008, No.78, pp.143-148, 情報処理学会, 8 Aug. 2008.
安部武宏, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: 音高による音色変化を考慮した楽器音の音高・音長操作手法, 音楽情報科学研究会, 2008-MUS-78-26, Vol.2008, No.78, pp.155-160, 情報処理学会, 8 Aug. 2008.
白松俊, 久保田祐史, 駒谷和範, 尾形哲也, 奥乃博: SalienceGraph: 参照確率に基づく話題遷移図の可視化, 第22回人工知能学会全国大会, 1H1-01, Jun. 11, 2008.
近藤, 坂上, 奥出, 岩丸, 菅佑樹, 尾形哲也, 菅野重樹: ユーザのカスタマイズを受容・拒否できる機構を持つロボットシステムの開発, 2008 JSME Conference on Robotics and Mechatronics ロボッティクス・メカトロニクス講演会 (ROBOMEC'08), 1P1-G11, Jun. 6, 2008.
中臺一博, 山本俊一, 奥乃博, 中島弘史, 長谷川雄二, 辻野広司: ロボット聴覚用オープンソフトウェアHARKの概要, ROBOMEC'08, 1P1-G13, Jun. 6, 2008.
神田尚, 尾形哲也, 駒谷和範, 奥乃博: 音素獲得に向けたリカンレトニュ-ラルネットワ-クによる音響信号と構音運動の分節化, ROBOMEC'08, 2P1-G03, Jun. 7, 2008.
菅佑樹, 小林大三, 尾形哲也, 菅野重樹: 神経調節機能を参考とした自律エージェントの神経制御器の開発, ROBOMEC'08, 2P1-G05, Jun. 7, 2008.
有江浩明, 尾形哲也, 谷淳, 菅野重樹: 物体操作に関する脳の情報処理構造を参考にした運動学習モデル, ROBOMEC'08, 2P1-G06, Jun. 7, 2008.
勝丸真樹, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける簡略表現認識のための誤認識増加を抑制する自動語彙拡張, 第185回自然言語処理研究会, 2008-NL-185 (11), 第71回音声言語情報処理研究会, 2008-SLP-71 (11), pp.71-76, 情処研報, Vol.2008, No.46, 情報処理学会, 横浜国立大学, May 23, 2008. 学生奨励賞
特許・ディジタルコンテンツ
Sound-source separation system, Application No. 20090043588. Filed: February 12, 2009. Inventors: Ryu Takeda, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno. PCT No.: PCT/JP05/22601.
Sound-Spurce Sepation System. Ryu Takeda, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Europian Patent EP 2,023,343, Publication Date: 02/11/2009 Filing Date: 08/11/2008
音源分離システム, 発明者: 武田龍, 中臺一博, 辻野広司, 奥乃博, 特開2009-42754号, 2009年2月26日. 特願2008-191382号, 2008年7月24日.
音楽音響信号の音色変更システム, 発明者: 安部武宏, 糸山克寿, 奥乃博, 特願2009-34664号, 2009年2月17日. 出願人: 国立大学法人京都大学
文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松俊, 駒谷和範, 奥乃博, 国内出願出願日： 2008年12月12日. PCT/JP2007/055448, 国際出願日：16 Mar. 2007. 出願者: 京都大学
言語理解装置, 発明者: 中野幹生, 奥乃博, 福林雄一朗, 船越孝太郎, 特開2008-293019号, 2008年12月4日. 特願2008-134401号, 2008年5月22日.
Moving object equipped with ultra-directional speaker. Patent No. US 7,424,118, Date of Patent: Sep. 9, 2008. Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, and Hiroshi Tsujino. PCT Files: Feb. 10, 20052. PCT No.: PCT/JP2005/002043.
Sound Source Separation System, Sound Source Separation Method, and Computer Program for Sound Source Separation, PCT/JP2008/057310, WO 2008/133097 国際公開日: 06.11.2008, Inventors: Katsutoshi Itoyama, Hiroshi Okuno, Masataka Goto. 京都大学, 産総研.
音源分離システム, 発明者: 武田龍, 中臺一博, 辻野広司, 奥乃博, 特願2008-191382号, 2008年7月24日.
音声認識装置, 発明者: 中臺一博, 辻野広司, 奥乃博, 山本俊一, 特許第4157581号, 登録日：2008年7月18日, 発行日：2008年10月1日. 国際公開 PCT/JP2005/022601, 2006年6月8日. 特願2006-546764号, 2005年12月2日.
音データ記録再生装置および音データ記録再生方法, 発明者: 中臺一博, 長谷川雄二, 辻野広司, 奥乃博, 特開2008-197650号, 2008年8月28日. 特願2008-25678号, 2008年2月5日.
Moving object equipped with ultra-directional speaker, Patent No. US 7,424,118, Date of Patent: Sep. 9, 2008. Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, PCT No.: PCT/JP2005/002043.
Speech Recognition Apparatus, Application No. 20080167869. Filed: July 10, 2008. Inventors: Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto. PCT No.: PCT/JP05/22601.
音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法, 発明者: 藤原弘将, 奥乃博, 後藤真孝, 特開2008-134606号, 2008年6月12日. 特願2007-233682号, 2007年9月10日.
会話システムおよび会話ソフトウエア, 発明者: 中野幹夫, 奥乃博, 駒谷和範, 再表2006/093092, 国際公開番号: WO2006/093092, 国際公開日:2006年9月8日, 発行日:2008年8月7日. 特願2007-505922号, 国際出願番号:PCT/JP2006/303613 国際出願日:2006年2月27日.
音声認識装置, 発明者: 中臺一博, 辻野広司, 奥乃博, 山本俊一, 再表2006/059806, 国際公開番号: WO2006/059806, 国際公開日:2006年6月8日, 発行日:2008年6月5日. 特願2006-546764号, 国際出願番号:PCT/JP2005/022601. 国際出願日:2005年12月2日.
音源分離システム, 音源分離方法及び音源分離用コンピュータプログラム, 発明者: 糸山克寿, 奥乃博, 後藤真孝, PCT/JP2008/057310, 国際出願日: 2008年4月14日.
SalienceGraph (議事録閲覧システム), <\ttl> 京都大学デジタルコンテンツC32, Aug. 2009. 開発者: 白松俊, 奥乃博

2008年度  ２００７年度（奥乃・尾形研究室） 2006年度

学位論文

白松俊: Salience-based Modeling of Discourse Context (顕現性に基づく談話文脈のモデル化), 博士論文, Feb. 2008.
山本俊一: Real-Time Robot Audition Software Based on Missing Feature Theory for Multiple Simultaneous Talkers in Real Environments (実環境における同時発話認識のためのミッシングフィーチャ理論に基づくリアルタイムロボット聴覚ソフトウェア), 博士論文, Feb. 2008.
吉井和佳: Studies on Hybrid Music Recommendation Using Timbral and Rhythmic Features, 博士論文, Feb. 2008.
糸山克寿: 調波・非調波統合モデルの制約付きパラメータ推定による多重奏音楽音響信号の音源分離, 修士論文, Feb. 2008.
武田龍ロボット聴覚におけるICAとMFT-ASRに基づくバージイン発話認識, 修士論文, Feb. 2008.
福林雄一朗: WFSTに基づくラピッドプロトタイピング向け音声言語理解と想定外発話からのユーザ知識推定への応用, 修士論文, Feb. 2008.
徳田浩一: 聴覚障害者支援のためのHMDを用いた音環境可視化システム, 修士論文, Feb. 2008.
横矢龍之介: ロボットによる自己モデル投影に基づく他者の発見と模倣, 修士論文, Feb. 2008.
須見康平: 音楽音響信号に対するベース音高推定を利用した確率的統合に基づく和音進行認識, 卒業特別研究報告, Feb. 2008.
勝丸真樹: 音声対話システムにおける固有名詞簡略表現の認識のための誤認識増加を抑制する語彙拡張, 卒業特別研究報告, Feb. 2008.
斎藤博己: 音楽と映像の相関に基づくミュージックビデオのクロスメディア検索, 卒業特別研究報告, Feb. 2008.
張陽: 人工神経回路モデルによる動作・言語変換を利用した人間ロボット音声協調の実装, 卒業特別研究報告, Feb. 2008.
水本武志: 音楽と自発声を聞き分けながらビート構造に合わせて発声するロボットの研究, 卒業特別研究報告, Feb. 2008.
査読つきジャーナル論文
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 楽譜情報を援用した多重奏音楽音響信号の音源分離と調波・非調波統合モデルの制約付パラメータ推定の同時実現, 情報処理学会論文誌, Vol.49, No.3 (Mar. 2008) pp.1465-1479, 情報処理学会. , DL 第24回電気通信普及財団賞 (テレコム技術学生賞)
横矢龍之介, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 自己モデルの投影に基づくロボットによる他者発見と動作模倣, ヒューマンインタフェース学会論文誌, Vol.10, No.1 (Feb. 2008) pp.59-72.
Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: An Efficient Hybrid Music Recommender System Using an Incrementally Trainable Probabilistic Generative Model, IEEE Transactions on Audio, Speech and Language Processing, Vol.16, No.2 (Feb. 2008) pp.435-447, , doi:10.1109/TASL.2007.911503
白松俊, 駒谷和範, 橋田浩一, 尾形哲也, 奥乃博: ゲーム理論に基づく参照結束性のモデル化と日本語・英語の大規模コーパスを用いた統計的検証, 自然言語処理, Vol.14, No.4 (Oct. 2007) pp.199-239.
Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Experience Based Imitation Using RNNPB, Advanced Robotics, Vol.21, Issue 12 (2007) pp.1351-1367, doi:10.1163/156855307781746106, Online version, VSP and Robotics Society of Japan. IF: 0.510
金天海, 出澤純一, 尾形哲也, 菅野重樹: 自己組織化回路素子SONEにおけるノイズの抑制, 日本ロボット学会誌, Vol.25, No.6 (Sep. 2007) pp.115-122. 学会サーバ
中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司: 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡, 日本ロボット学会誌, Vol.25, No.6 (Sep. 2007) pp.181-191. , 学会サーバ
Jean-Marc Valin, Shun'ichi Yamamoto, Jean Rouat, Francois Michaud, Kazuhiro Nakadai, Hiroshi G. Okuno: Robust Recognition of Simultaneous Speech By a Mobile Robot, IEEE Transactions on Robotics, Vol.23, No.4 (Aug. 2007) pp.742--752. , doi:10.1109/TRO.2007.900612
池田智志, 駒谷和範, 尾形哲也, 奥乃博: マルチドメイン音声対話システムにおける想定外発話への対処のためのWebを用いたシステム知識の拡張, 情報技術レターズ (第6回情報科学技術フォーラム(FIT2007)講演論文集), LE-007, 2007.
福林雄一朗, 駒谷和範, 中野幹生, 船越孝太郎, 辻野広司, 尾形哲也, 奥乃博: 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化, 情報技術レターズ (第6回情報科学技術フォーラム(FIT2007)講演論文集), LE-008, 2007.
Hiroaki Arie, Tetsuya Ogata, Jun Tani, and Shigeki Sugano: Reinforcement learning of continuous motor sequence with hidden state, Advanced Robotics, Special Issue on Robotic Platforms for Research in Neuroscience, VSP and Robotics Society of Japan, Vol.21, Issue 10 (July 2007), pp.1215-1229. Online version doi:10.1163/156855307781389365 IF: 0.510
Taro Watanabe, Kenji Imamura, Eiichiro Sumita, Hiroshi G. Okuno: Statistical machine translation using hierarchical phrase alignment, Systems and Computers in Japan, Vol.38, No.6 (June 2007) pp.70-79, doi:10.1002/scj.20271
神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博: マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択, 情報処理学会論文誌, Vol.48, No.5 (May 2007) pp.1980-1989, 情報処理学会. DL
編書・章分担・解説論文・翻訳
奥乃博, 溝口博: ロボット聴覚のための情報統合の現状と課題 (韓国語訳), 自動化技術, Vol.24, No.3 (Mar. 2008) pp.60-63. www.chomdan.co.kr
Koiti Hasida, Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Meaning Games, New Frontiers in Artificial Intelligence, Lecture Notes in Computer Science, Vol.4914, pp.228-241, Springer-Verlag, Feb. 2008. doi:10.1007/978-3-540-78197-4_21
奥乃博, ロボットによる人の聴覚処理への構成的アプローチ, 特集ロボットメディアによる人間情報処理研究, 情報処理, Vol.49 No.1 (Jan., 2008) 15-23, 情報処理学会. 電子図書館
尾形哲也: 人工神経回路モデルによるインタラクション創発システム実現に向けて, 日本神経回路学会誌, Vol.14, No.4 (Dec. 2007) pp.282-292. オンライン
奥乃博, 山本俊一: 音環境理解コンピューティング, 人工知能学会誌, レクチャーシリーズ:「知能コンピューティングとその周辺」第5回, Vol.22, No.6 (Nov. 2007) pp.846-854.
Hiroshi G. Okuno, Moonis Ali (Eds.): New Trends in Applied Artificial Intelligence (IEA/AIE-2007), Lecture Notes in Computer Science, Vol.4570, Springer-Verlag, 14 Jun. 2007, XXI, 1194p. ISBN: 978-3-540-73322-5. doi:10.1007/978-3-540-73325-6
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Auditory and Visual Talker Tracking through integrating EM algorithm and Particle Filter, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.280-290, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_28
Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Two Simultaneous Continous Speech Recognition with ICA BSS and MTF-based ASR, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.384-394, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_38
奥乃博, 北原鉄朗, 吉井和佳: 楽曲の特徴量抽出と検索技術, 電気学会誌, 特集「音響機器は進歩している 6」, Vol.127, No.7 (Jul. 2007) pp.417--420.
奥乃博, 溝口博:ロボット聴覚のための情報統合の現状と課題, 計測と制御, 「ロボット聴覚のためのインテグレーション技術」特集, Vol.46, No.6 (Jun. 2007) pp.415-419.
山本俊一, 武田龍, 奥乃博: ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識, 計測と制御, 「ロボット聴覚のためのインテグレーション技術」特集, Vol.46, No.6 (Jun. 2007) pp.447-452.
北原鉄朗訳: 音楽情報検索, CACM 日本語版, Vol.6, No.2, pp.1-3
原著: SPECIAL ISSUE: Music information retrieval, Introduction, by Bryan Pardo, CACM, Vol.49, No.8 (Aug. 2006) 29-31.
吉井和佳訳: 音楽音響信号からの情報抽出, CACM 日本語版, Vol.6, No.2, pp.4-10
原著: Extracting information from music audio, by Daniel P.W. Ellis, CACM, Vol.49, No.8 (Aug. 2006) 32-37.
藤原弘将訳: 楽譜アラインメントとコンピュータ自動伴奏, CACM 日本語版, Vol.6, No.2, pp.11-16
原著: Music score alignment and computer accompaniment, by Roger B. Dannerberg, Christoppher Raphael, CACM, Vol.49, No.8 (Aug. 2006) 38-43.
北原鉄朗訳: Shazam 音楽認識サービス, CACM 日本語版, Vol.6, No.2, pp.17-21
原著: The Shazam music recognition service, by Avery Wang, CACM, Vol.49, No.8 (Aug. 2006) 44-48.
藤原弘将訳: VocalSsearchシステムによる鼻歌検索, CACM 日本語版, Vol.6, No.2, pp.22-26
原著: Query by humming with the VocalSearch system, by William Birmingham, Roger Dannenberg, Bryan Pardo, CACM, Vol.49, No.8 (Aug. 2006) 49-52.
糸山克寿訳: Variation2: 学術的環境における音楽の検索と利用, CACM 日本語版, Vol.6, No.2, pp.27-34
原著: Variation2: retrieving and using music in an academic setting, by Jon W. Dunn, Donald Byrd, Mark Notess, Jenn Riley, RYan Scherle, CACM, Vol.49, No.8 (Aug. 2006) 53-58.
Shinichi Ueno, Fumihiro Adachi, Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Bus Information System Based on User Models and Dynamic Generation of VoiceXML Scripts, New Frontiers in Artificial Intelligence (JSAI 2003/2004), LNAI 3609, pp.45-60, 2007. Springer-Verlag. doi:10.1007/978-3-540-71009-7_4
査読つき国際会議論文
Yuichiro Fukubayashi, Kazunori Komatani, Mikio Nakano, Kotaro Funakoshi, Hiroshi Tsujino, Tetsuya Ogata, Hiroshi G. Okuno: Rapid Prototyping of Robust Language Understanding Modules with Less Training Data for Spoken Dialogue Systems, Proceedings of the Third International Joint Conference on Natural Language Processing (IJCNLP 2008), pp.210-216, Jan. 2008, Hyderabad, India.
Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Design and Implementation of A Robot Audition System for Automatic Speech Recognition of Simultaneous Speech, Proceedings of IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU-2007), 111-116, acceptance rate (115/267), IEEE, Kyoto, Dec. 2007. doi:10.1109/ASRU.2007.4430093
Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Vocal Imitation using Vocal Tract Model and Recurrent Neural Network, Proceedings of International Conference on Neural Information Processing (ICONIP-2007), Vol.2, pp.222-232, Nov. 2007.
Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Vocal Imitation Using Physical Vocal Tract Model, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1846-1851, IEEE, RSJ, San Diego, Oct. 2007. doi:10.1109/IROS.2007.4399137
Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Discovery of Other Individuals by Projecting a Self-Model Through Imitation, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1009-1014, IEEE, RSJ, San Diego, Oct. 2007. doi:10.1109/IROS.2007.4399153
Kazuyoshi Yoshii, Kazuhiro Nakadai, Toyotaka Torii, Yuji Hasegawa, Hiroshi Tsujino, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: A Biped Robot that Keeps Steps in Time with Musical Beats while Listening to Music with Its Own Ears, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1743-1750, IEEE, RSJ, San Diego, Oct. 2007. doi:10.1109/IROS.2007.4399244
Tetsuya Ogata, Masamitsu Murase, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno, Two-way Translation of Compound Sentences and Arm Motions by Recurrent Neural Networks, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1858-1863, IEEE, RSJ, San Diego, Oct. 2007. doi:10.1109/IROS.2007.4399265
Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Exploiting Known Sound Sources to Improve ICA-based Robot Audition in Speech Separation and Recognition, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.1757-1762, IEEE, RSJ, San Diego, Oct. 2007.
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Auditory and Visual Integration based Localization and Tracking of Humans in Daily-life Environments, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007), pp.2021-2027, IEEE, RSJ, San Diego, Oct. 2007.
Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Hybrid Collaborative and Content-based Music Recommendation Using Probabilistic Model with Latent User Preferences, Proceedings of 8th International Conference on Musical Information Retrieval (ISMIR-2007), long paper (15.8% of 214 submissions), pp.89-94, Vienna, Sep. 2007.
Kazunori Komatani, Yuichiro Fukubayashi, Tetsuya Ogata, Hiroshi G. Okuno: Introducing Utterance Verification in Spoken Dialogue System to Improve Dynamic Help Generation for Novice Users, Proceedings of the 8th SIGdial Workshop on Discourse and Dialogue, pp.202-205, Sep. 2007
Satoshi Ikeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Topic Estimation with Domain Extensibility for Guiding User's Out-of-Grammar Utterance in Multi-Domain Spoken DIalogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2007), pp.2561-2564,, Antwerp, Sep. 2007.
Kazunori Komatani, Tatsuya Kawahara, Hiroshi G. Okuno: Analyzing Temporal Transition of Real User's Behaviors in a Spoken Dialogue System, Proceedings of International Conference on Spoken Language Processing (Interspeech-2007), pp.142-145, Antwerp, Sep. 2007.
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Auditory and VIsual Integration based Localization and Tracking of Multiple Moving Sounds in Daily-life Environments, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man 2007), 399-404, IEEE, Jeju Island, Korea, Aug. 2007. doi:10.1109/ROMAN.2007.4415117
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Auditory and Visual Talker Tracking through integrating EM algorithm and Particle Filter, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.280-290, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_28
Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Two Simultaneous Continous Speech Recognition with ICA BSS and MTF-based ASR, New Trends in Applied Artificial Intelligence (IEA/AIE-2007), LNAI 4570, pp.384-394, Springer-Verlag. Kyoto, Jun. 2007. doi:10.1007/978-3-540-73325-6_38
Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: INTEGRATION AND ADAPTATION OF HARMONIC AND INHARMONIC MODELS FOR SEPARATING POLYPHONIC MUSICAL SIGNALS, Proceedings of 2007 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2007), pp.57-60, IEEE, Hawaii, April 2007, pp.57-60, (15.1% acceptance rate for lecture presentation) doi:10.1109/ICASSP.2007.366615
Haruhiko Niwa, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Distance Estimation of Hidden Objects Based on Acoustical Holography by applying Acoustic Diffraction of Audible Sound, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), pp.423-428, (Apr. 2007). doi:10.1109/ROBOT.2007.363823
Tetsuya Ogata, Shohei Matsumoto, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Human-Robot Cooperation using Quasi-symbols Generated by RNNPB Model, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), pp.2156-2161, (Apr. 2007). doi:10.1109/ROBOT.2007.363640
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Predicting Object Dynamics from Visual Images through Active Sensing Experiences, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), pp.2501-2506, (Apr. 2007). doi:10.1109/ROBOT.2007.363841
Chyon Hae Kim, Tetsuya Ogata, Shigeki Sugano: Enhancement of Self Organizing Network Elements for Supervised Learning, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2007), WeA3.5, (Apr. 2007).
査読なし国際会議論文
Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani: Robot Audition from the viewpoint of Computational Auditory Scene Analysis, Proceedings of the International Conference on Informatics Education and Research for Knowledge-Creation Society Infrastructure (ICKS'08), pp.35-40, Jan. 2008. doi:10.1109/ICKS.2008.10
Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Structual Feature Extraction based on Active Sensing Experiences, Proceedings of the International Conference on Informatics Education and Research for Knowledge-Creation Society Infrastructure (ICKS'08), pp.169-172, Jan. 2008. doi:10.1109/ICKS.2008.9
Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Evaluation of Two-Channel-Based Sound Source Localization using 3D Moving Sound Creation Tool, Proceedings of the International Conference on Informatics Education and Research for Knowledge-Creation Society Infrastructure (ICKS'08), pp.209-212. doi:10.1109/ICKS.2008.25
口頭発表（研究会・全国大会）
藤原弘将, 後藤真孝, 奥乃博: 歌声GMMとViterbi探索を用いた多重奏中のボーカルパートに限定した基本周波数推定手法, 電子情報通信学会総合大会, スペシャルセッション「音響信号のモデリングと表現」, Mar. 2008.
北原鉄朗, 後藤真孝, 奥乃博, 片寄晴弘: Instrogram: 多重奏中の楽器構成に関する確率的表現法, 電子情報通信学会総合大会, スペシャルセッション「音響信号のモデリングと表現」, Mar. 2008.
河原英紀, 森勢将雅, 高橋徹, 西村竜一, 坂野秀樹, 入野俊夫: TANDEM およびSTRAIGHT スペクトルに基づく基本周波数および非周期性の表現について, 日本音響学会2008年春季研究発表会講演論文集, pp.563-564, March 17-19, 2008.
小林憲昭, 森勢将雅, 高橋徹, 入野俊夫, 河原英紀: 時間窓と入力信号の持続時間に基づく音響イベント検出を利用した音源位置推定法の一検討, 日本音響学会2008年春季研究発表会講演論文集, pp.775-776, March 17--19, 2008. (千葉工業大学/千葉), (発表日 3月17日).
大西壮登, 高橋徹, 森勢将雅, 入野俊夫, 河原英紀: 母音情報に基づく声質変換法における連続発話音声からの母音テンプレートの設計, 日本音響学会2008年春季研究発表会講演論文集, pp.429-430, March 17--19, 2008. (千葉工業大学/千葉), (発表日 3月19日).
吉田有里, 森勢将雅, 高橋徹, 入野俊夫, 河原英紀: 歌唱音声と会話音声のSTRAIGHT による分析と母音部におけるスペクトル変動の統計的性質の比較, 日本音響学会2008年春季研究発表会講演論文集, pp.279-280, March 17-19, 2008.
白松俊, 駒谷和範, 尾形哲也, 奥乃博: 新近性効果の減数曲線を加味した顕現性計算手法に基づく話題遷移の可視化, 言語処理学会第14回年次大会, Mar. 2008.
横矢龍之介, 尾形哲也, 西出俊, 谷淳, 駒谷和範, 奥乃博: ロボットの順逆モデルの変換による他者行為予測と模倣, 情報処理学会第70回全国大会, 1X3, Mar. 2008.
須見康平, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: ベース音高を考慮したポピュラー音楽に対する和音進行認識, 情報処理学会第70回全国大会, 2X-5, Mar. 2008. 大会優秀賞
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 複数楽器個体による事前分布を用いた調波・非調波統合モデルのパラメータ推定, 情報処理学会第70回全国大会, 2X-6, Mar. 2008.
安部武宏, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: 楽器固有の音響的特徴を考慮した楽器音の音高操作手法, 情報処理学会第70回全国大会, 2X-7, Mar. 2008.
水本武志, 武田龍, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: 音楽と自分の声を聞き分けながらビートに合わせて発声するロボットの開発, 情報処理学会第70回全国大会, 2X-8, Mar. 2008.
久保田祐史, 吉田雅敏, 駒谷和範, 尾形哲也, 奥乃博: 顔の動作に追従したGUIインタフェースを持つ音環境可視化システム, 情報処理学会第70回全国大会, 2ZL-5, Mar. 2008.
駒谷和範, 福林雄一朗, 池田智志, 尾形哲也, 奥乃博: 音声対話システムにおける誤り原因の階層的分類とその推定に基づく発話誘導, 情報処理学会第70回全国大会, 3K-1, Mar. 2008.
武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価, 情報処理学会第70回全国大会, 3U-1, Mar. 2008.
池田智志, 駒谷和範, 尾形哲也, 奥乃博: トピック推定と対話履歴の統合によるドメイン選択を行うマルチドメイン音声対話システム, 情報処理学会第70回全国大会, 3U-3, Mar. 2008.
勝丸真樹, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおけるユーザの固有名詞の簡略化に対処する語彙拡張, 情報処理学会第70回全国大会, 3U-5, Mar. 2008.
福林雄一朗, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおけるWFSTに基づく文法検証を利用した動的ヘルプ生成, 情報処理学会第70回全国大会, 3U-7, Mar. 2008. 学生奨励賞
斎藤博己, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博: 音楽と映像の調和度計算モデルを用いたクロスメディア探索, 情報処理学会第70回全国大会, 3X-4, Mar. 2008.
前田一貴: 奥乃博: 数独の問題作成支援システムの設計と開発, 情報処理学会第70回全国大会, 4ZH-4, Mar. 2008. 学生奨励賞, 大会奨励賞
徳田浩一, 駒谷和範, 尾形哲也, 奥乃博: 音源定位結果と音声認識結果をHMDに統合呈示する聴覚障害者向け音環境理解支援システム, 情報処理学会第70回全国大会, 5ZD-7, Mar. 2008. 大会奨励賞
張陽, 尾形哲也, 谷淳, 村瀬昌満, 駒谷和範, 奥乃博: 神経回路モデルによる動作・言語変換を利用した人間ロボット音声協調, 情報処理学会第70回全国大会, 6X-1, Mar. 2008.
神田尚, 尾形哲也, 駒谷和範, 奥乃博: RNNPBによる音響模倣・分節化を用いた音素獲得モデルの提案, 情報処理学会第70回全国大会, 6X-2, Mar. 2008. 学生奨励賞
福林雄一朗, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける動的ヘルプ生成を指向したWFSTに基づく文法検証によるユーザ知識推定, 人工知能学会研究会資料 SIG-SLUD-AAA703-09 (3/7), pp.45--50, 人工知能学会, Mar, 2008.
吉田有里, 森勢将雅, 高橋徹, 西村竜一, 入野俊夫, 河原英紀: ポップス系歌唱音声における基本周波数軌跡の楽譜からの変位について, 音楽情報処理研究会, 2008-MUS-74 (3), 2008-SLP-70 (3), Vol.2008, No.12, pp.13-18, 情報処理学会, Feb. 2008.
奥乃博: ロボット聴覚の課題と現状: 聖徳太子ロボットをめざして, 招待講演, 第12回関西大学先端科学技術シンポジウム講演集, pp.221-226, Jan. 2008.
池田智志, 駒谷和範, 尾形哲也, 奥乃博: マルチドメインシステムにおけるトピック推定と対話履歴の統合によるドメイン選択の高精度化, 音声言語シンポジウム, 信学技法, NLC2007-80, SP2007-143, pp.277-282, Dec. 2007.
西出俊, 尾形哲也, 横矢龍之介, 谷淳, 駒谷和範, 奥乃博: 能動的知覚経験に基づく物体挙動連想と動作生成, 第8回システムインテグレーション部門講演会 (SI2007), 1C1-3, 計測自動制御学会, Dec. 2007.
有江浩明, 尾形哲也, 谷淳, 菅野重樹: ニューラルネットによるけん駆動ロボットアームの制御, 第8回システムインテグレーション部門講演会 (SI2007), 1B4-6, 計測自動制御学会, Dec. 2007.
尾形哲也: インタラクション創発システム情報学の提案, (keynote), 第8回システムインテグレーション部門講演会 (SI2007), 2C1-1, 計測自動制御学会, Dec. 2007.
横矢龍之介, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 自己モデルの再利用に基づくロボットによる他者の発見と模倣, 第8回システムインテグレーション部門講演会 (SI2007), 2C1-2, 計測自動制御学会, Dec. 2007.
中臺一博, 山本俊一, 奥乃博, 中島弘史, 長谷川雄二, 辻野広司: ロボット聴覚システムを用いた口じゃんけん判定ロボット, 第8回システムインテグレーション部門講演会 (SI2007), 3K4-2, 計測自動制御学会, Dec. 2007.
村田和真, 吉井和佳, 奥乃博, 鳥井豊隆, 中臺一博, 長谷川雄二: ロボットによるビートトラッキングにおける周期性自己発生音の影響評価, 第8回システムインテグレーション部門講演会 (SI2007), 3K4-4, 計測自動制御学会, Dec. 2007.
鄭蝦榮, 羽鳥剛史, 小林潔司, 白松俊: ファセット学習モデルを用いた公的討議のプロトコル分析, 第36回土木計画学研究発表会秋大会, 304, Nov. 2007.
山本俊一, 複数の人の発話を聞き分ける聖徳太子ロボットの開発, 「自然科学縦横無尽」, 理学系異分野交流会, 京都大学, Nov. 3, 2007.
尾形哲也, 村瀬昌満, 谷淳, 駒谷和範, 奥乃博: リカレントニューラルネットワークによる複数文章とロボット動作の双方向変換, 日本ロボット学会第25回大会, 1C26 , Sep. 2007.
武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: 独立成分分析に基づく適応フィルタのロボット聴覚への応用, 日本ロボット学会第25回大会, 1N6 , Sep. 2007.
神田尚, 尾形哲也, 駒谷和範, 奥乃博: 声道物理モデルとリカレントニューラルネットワークによる母音模倣, 日本ロボット学会第25回大会, 1N8 , Sep. 2007.
西出俊, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 物体挙動の予測信頼性に基づく自律的な動作生成, 日本ロボット学会第25回大会, 1C36, Sep. 2007.
横矢龍之介, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 自己モデルの投影に基づくロボットによる模倣動作の自律的獲得, 日本ロボット学会第25回大会, 3N27, Sep. 2007.
菅佑樹, 生熊良規, 尾形哲也, 菅野重樹: 対話型進化的計算による強化学習器の報酬系の獲得, 日本ロボット学会第25回大会, 2O18, Sep. 2007.
吉井和佳, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 楽曲推薦システムの効率性とスケーラビリティの改善のための確率的推薦モデルのインクリメンタル学習法, 音楽情報処理研究会, 2007-MUS-71, Vol.2007, No.71, pp.19-26, 情報処理学会, Aug. 2007.
藤原弘将, 後藤真孝, 奥乃博: 歌声GMMとViterbi探索を用いた多重奏中のボーカルパートに限定した基本周波数推定手法, 音楽情報処理研究会, 2007-MUS-71, Vol.2007, No.71, pp.119-126, 情報処理学会, Aug. 2007.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 音色特徴量分布の利用による調波・非調波併用モデルのパラメータ推定, 音楽情報処理研究会, 2007-MUS-71, Vol.2007, No.71, pp.161-166, 情報処理学会, Aug. 2007.
糸山克寿, 後藤真孝, 奥乃博: 楽器音イコライザ：ハードウェアフェーダを用いた直感的操作の実現, デモンストレーション：若手による研究紹介V, 音楽情報科学研究会, 2007-MUS-71, Vol.2007, No.71, pp.130, 情報処理学会, Aug. 2007.
駒谷和範, 河原達也, 奥乃博: 京都市バス運行情報案内システムにおける実ユーザのふるまいの経時的変化の分析, 第67回音声言語情報処理研究会, 2007-SLP-67 (17), Vol.2007, No.75, pp.91--96, 情報処理学会, 21 July, 2007.
白松俊, 駒谷和範, 尾形哲也, 奥乃博: 会話文脈に応じた関連情報提示タスクのための文脈類似度計算手法の開発, 人工知能学会研究会資料 SIG-SLUD-A701-10 (7/23), pp.57-62, July 2007.
池田智志, 駒谷和範, 尾形哲也, 奥乃博: ドメイン拡張性を備えたトピック推定に基づく発話誘導を行うマルチドメイン音声対話システム, 人工知能学会研究会資料 SIG-SLUD-A701-10 (7/23), pp.83-88, July 2007.
糸山克寿, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 多重奏音楽音響信号の音源分離のための調波・非調波モデルの制約付きパラメータ推定, 音楽情報処理研究会, 2007-MUS-70 (13), 2007-EC-7 (13), Vol.2007, No.37, pp.81-88, 情報処理学会, May 2007.
福林雄一朗, 駒谷和範, 中野幹生, 船越孝太郎, 辻野広司, 尾形哲也, 奥乃博: 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化, 第66回音声言語情報処理研究会, 2007-SLP-66 (8), 2007-NL-179 (8), Vol.2007, No.47, pp.43--48, 情報処理学会, 25 May, 2007.
特許・ディジタルコンテンツ
Sentence Search Method, Sentence Search Engine, Computer Program, Recording Medium, and Document Storage. Shun Shiramatsu, Kazunori Komatani, Hiroshi Okuno, Europian Patent EP WO/2008/023470, Publication Date: 02/28/2008 Filing Date: 03/16/2007
超指向性スピーカ搭載型移動体, 発明者: 森清文, 吉田俊治, 奥乃博, 中臺一博, 辻野広司, 再表2005/076661, 国際公開番号: WO2005/076661, 国際公開日:2005年8月18日, 発行日:2008年1月10日. 特願2005-517825号, 国際出願番号:PCT/JP2005/002044, 国際出願日:2005年2月10日.
超指向性スピーカ搭載型移動体, 発明者: 森清文, 吉田俊治, 奥乃博, 中臺一博, 辻野広司, 再表2005/076660, 国際公開番号: WO2005/076660, 国際公開日:2005年8月18日, 発行日:2008年1月10日. 特願2005-517825号, 国際出願番号:PCT/JP2005/002043, 国際出願日:2005年2月10日.
楽器音認識方式, 楽器アノテーション方法, 及び楽曲検索方法, 発明者：北原鉄朗, 奥乃博. 特開2007-240552号. 公開日: 2007年9月20日. 特願2006-058649号. 出願日: 2006年3月3日.
Robot acoustic device and robot acoustic system, Patent No. US 7,215,786, Date of Patent: May 8, 2007. Inventors: Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, Assignee: Japan Science and Technology Agency. PCT No.: PCT/JP2005/002043.
EPO特許 (ドイツ, フランス, 英国, イタリア, スペイン, オランダ), 音源同定装置及びその同定方法, 発明者：奥乃博, 北野宏明, 中川由紀子, 特許日：2007年3月12日.
音源分離システム, 音源分離プログラム及び音源分離装置, 発明者: 糸山克寿, 奥乃博, 後藤真孝, 特願2007-106576号, 2007年4月13日.
音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法, 発明者: 藤原弘将, 奥乃博, 後藤真孝, 特願2007-233682号, 2007年9月10日.
楽曲推薦システム, 楽曲推薦方法及び楽曲推薦用プログラム, 発明者: 後藤真孝, 吉井和佳, 奥乃博, 特願2007-199936号, 2007年7月31日.
Moving object equipped with ultra-directional speaker, Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, Application No. 20070172076. Filed: July 26, 2007. PCT No.: PCT/JP05/02043.

2007年度  ２００６年度（奥乃研究室） 2005年度

学位論文

北原鉄朗: Computational Musical Instrument Recognition and Its Application to Content-based Music Information Retrieval (計算機による楽器音認識および内容に基づく音楽情報検索への応用), 博士論文, Feb. 2007 第2回京都大学総長賞
西山正紘: マルチメディアコンテンツにおける音楽と映像の調和度計算モデル, 修士論文, Feb. 2007.
藤原弘将: 調波構造の分離と歌声信頼度の推定に基づく歌声の認識に関する研究, 修士論文, Feb. 2007.
村瀬昌満: RNNPBによる言語列と動作列の意味的結合と人間ロボットインタラクションへの応用, 修士論文, Feb. 2007.
池田智志: マルチドメイン音声対話システムにおける想定外発話に対する発話誘導のためのトピック推定, 卒業特別研究報告, Feb. 2007.
神田尚: 声道の身体拘束を反映した音声模倣モデル, 卒業特別研究報告, Feb. 2007.
清水敬太: OnomaTree: 擬音語と木構造を併用した環境音探索インタフェース, 卒業特別研究報告, Feb. 2007.
吉田雅敏: 音の視覚化機能を有した混合音録音再生システム, 卒業特別研究報告, Feb. 2007.
査読つきジャーナル論文
Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Drumix: An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening, IPSJ Journal, Vol.48, No.3 (Mar. 2007), 1229-1239, 情報処理学会. IPSJ Digital Courier, Vol.3 (2007), pp.134-144. 電子図書館 , IPSJ Digital Courier 船井若手奨励賞
Hyun-Don Kim, Jong-Suk Choi, and Munsang Kim: Human-robot interaction in real environments by audio-visual integration, International Journal of Control Automation and Systems, Vol.5, No.1 (Feb. 2007) pp.61-69.
Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrogram: Probabilistic Representation of Instrument Existence for Polyphonic Music, IPSJ Journal, Vol.48, No.1 (Jan. 2007), pp.214-226, 情報処理学会. 電子図書館 IPSJ Digital Courier, Vol.3 (2007) pp.1-13. , IPSJ Digital Courier 船井若手奨励賞
黒瀧俊輔, 鈴木紀章, 中臺一博, 奥乃博, 天野英晴: 動的リコンフィギャラブルデバイス DRP を用いたロボット聴覚のための音源分離フィルタ, 電子情報通信学会論文誌 D, Vol.J90-D, No.3, pp.897-907, Mar. 2007, 電子情報通信学会. 電子図書館
山本俊一, 中臺一博, 中野幹生, 辻野広司, Jean-Marc Valin, 駒谷和範, 尾形哲也, 奥乃博: 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識, 日本ロボット学会誌, Vol.25, No.1 (Jan. 2007) 92-102. , 学会サーバ
Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectogram Templates with Harmonic Structure Suppression, IEEE Transactions on Audio, Speech and Language Processing, Vol.15, No.1 (Jan. 2007) pp.333-345, , doi:10.1109/TASL.2006.876754 電気通信普及財団テレコム技術学生賞
Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrument Identification in Polyphonic Music: Feature Weighting to Minimize Influence of Sound Overlaps, EURASIP Journal on Advanes in Signal Processing, Special issue on Music Information Retrieval Based on Signal Processing, Vol.2007, Article ID 51979, 15 pages, 2007, doi:10.1155/2007/51979 IF: 0.81
北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 多重奏を対象とした音源同定：混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用, 電子情報通信学会論文誌, Vol.J89-D, No.12 (Dec. 2006), pp.2721-2733, 電子情報通信学会.
神田直之, 駒谷和範, 尾形哲也, 奥乃博: データベース検索タスクにおける対話文脈を利用した音声言語理解, 情報処理学会論文誌, Vol.47, No.6 (June 2006) pp.1802-1811, 情報処理学会. , DL
藤原弘将, 北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 伴奏音抑制と高信頼度フレーム選択に基づく楽曲の歌手名同定手法, 情報処理学会論文誌, Vol.47, No.6 (June 2006) pp.1831-1843, 情報処理学会. DL
山本俊一, 中臺一博, 中野幹生, 辻野広司, Jean-Marc Valin, 武田龍, 駒谷和範, 尾形哲也, 奥乃博: 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上, ヒューマンインタフェース学会論文誌, Vol.8, No.2 (Jun. 2006) pp.203-212.
Takamichi Saito, Kentaro Umesawa, Hiroshi G. Okuno: A Privacy-Enhanced Access Control, Systems and Computers in Japan, (2006) A Privacy-Enhanced Access Control, Systems and Computers in Japan, Vol.37, No.5 (May 2006) pp.77-86. doi:10.1002/scj.10214
金天海, 尾形哲也, 菅野重樹: ローカルルールに基づいた論理回路の自己組織アルゴリズム, 計測自動制御学会論文誌, Vol.42, No.4 (Apr. 2006) pp.334-341.
章分担・解説論文・翻訳
奥乃博: 音環境理解から観たロボット聴覚, 日本音響学会誌, Vol.63, No.1 (Jan. 2007) pp.29-34.
奥乃博: 複数の音を同時に聞き分ける聖徳太子ロボットの研究, TELECOM FRONTIER, SCAT Technical Journal, Vol.52, 2006 Summer, pp.12-20.
奥乃博: 聖徳太子のような音声処理ロボットの開発, inrevium lab, inrevium, Vol.3, 2006 Summer, pp.1-4.
Hiroaki Arie, Jun Namikawa, Tetsuya Ogata, Jun Tani, Shigeki Sugano: Reinforcement Learning Algorithm with CTRNN in Continuous Action Space, Neural Information Processing (ICONIP-2006), Part I, LNCS 4232, pp.387-396. Oct. 2006. doi:10.1007/11893028_44
Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Recognition of Simultaneous Speech by Estimating Reliability of Separated Signals for Robot Audition, Qiang Yang, Geoffrey I. Webb (Eds.): PRICAI 2006: Trends in Artificial Intelligence, LNCS 4099, pp.484-494, accepted as regular paper for ORAL Presentation (14.1%), Springer-Verlag, Guilin, China, Aug. 2006. doi:10.1007/11801603_52
Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Ryu Takeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Genetic Algorithm based Improvement of Robot's Hearing Capabilities in Separating and Recognizing Simultaneous Speech Signals, Moonis Ali, Richard Dapoigny (Eds.): Advances in Applied Artificial Intelligence (IEA/AIE-2006), LNAI 4031, pp.207-217, Springer-Verlag. Annecy, France, Jun. 2006. doi:10.1007/11779568_24
査読つき国際会議論文
Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani: Computational Auditory Scene Analysis and Its Application to Robot Audition: Five Years Experience, Proceedings of the 2nd International Conference on Informatics Research for Development of Knowledge Society Infrastructure (ICKS 2007), pp.69-76, Jan. 2007. doi:10.1109/ICKS.2007.7
Shun Shiramatsu, Kazunori Komatani, Koiti Hasida, Tetsuya Ogata, Hiroshi G. Okuno: Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification Using Japanese and English Corpora, Proceedings of the 6th Discourse Anaphora and Anaphor Resolution Colloquium (DAARC2007), pp.121-126, Lisbon, Mar. 2007.
Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Musical Instrument Recognizer ``Instrogram'' and Its Application to Music Retrieval based on Instrumentation Similarity, Proceedings of IEEE International Symposium on Multimedia (ISM2006), pp.265-272, San Diego, Dec. 2006. doi:10.1109/ISM.2006.113
Hiromasa Fujihara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal signals, Proceedings of IEEE International Symposium on Multimedia (ISM2006), pp.257-264, San Diego, Dec. 2006. doi:10.1109/ISM.2006.38
Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Hybrid Collaborative and Content-based Music Recommendation Using Probabilistic Model with Latent User Preferences, Proceedings of 7th International Conference on Musical Information Retrieval (ISMIR-2006), pp.296-301, Vancouver, CA, Sep. 2006.
Katsutoshi Itoyama, Tetsuro Kitahara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Feature Weighting in Automatic Transcription of Specified Part in Polyphonic Music, Proceedings of 7th International Conference on Musical Information Retrieval (ISMIR-2006), pp.172-175, Vancouver, CA, Sep. 2006.
Kazuhiro Nakadai, Hirofumi Nakajima, Masamitsu Murase, Satoshi Kaijiri, Kentaro Yamada, Yuji Hasegawa, Hiroshi G. Okuno, Hiroshi Tsujino: Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 852-859, IEEE, RSJ, Beijing, China, Sep. 2006. , doi:10.1109/IROS.2006.281737
Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 878-885, IEEE, RSJ, Beijing, China, Sep. 2006. , doi:10.1109/IROS.2006.281741
IEEE Robotics and Automation Society Japan Chapter Young Award,
RSJ/SICE Award for IROS 2006 Best Paper Nomination Finalist (2nd to 5th Place) at IROS-2007.
Haruhiko Niwa, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Multiple Acoustical Holography Method for Localization of Objects in Broad Range using Audible Sound, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 1146-1151, IEEE, RSJ, Beijing, China, Sep. 2006. , doi:10.1109/IROS.2006.281844
Chyon Hae Kim, Tetsuya Ogata, Shigeki Sugano: Efficient Organization of Network Topology based on Reinforcement Signals, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 3154-3159, IEEE, RSJ, Beijing, China, Sep. 2006.
Yuki Suga, Chihiro Endo, Daizo Kobayashi, Takeshi Matsumoto, Tetsuya Ogata, Shigeki Sugano: User-Adaptive Human-Robot Interaction System using Interactive EC, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 3663-3668, IEEE, RSJ, Beijing, China, Sep. 2006.
Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Experience Based Imitation Using RNNPB, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 3669-3674, IEEE, RSJ, Beijing, China, Sep. 2006. , doi:10.1109/IROS.2006.281724 IEEE 関西支部学生研究奨励賞内定
Jong-Suk Choi, Hyun-Don Kim, and Munsang Kim: Probabilistic Speaker Localization in Noisy Environment by Audio-Visual Integration, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 4704-4709, IEEE, RSJ, Beijing, China, Sep. 2006.
Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2006), 5333-5338, IEEE, RSJ, Beijing, China, Sep. 2006. , doi:10.1109/IROS.2006.282037
Tetsuya Ogata, Yuya Hattori, Hideki Kojima, Kazunori Komatani, Hiroshi G. Okuno: Generation of Robot Motions from Environmental Sounds using Inter-modality Mapping by RNNPB, Proceedings of Sixth International Workshop on Epigenetic Robotics (EpiRobo-2006), 95-102, Paris, Sep., 2006.
Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting, Proceedings of International Conference on Spoken Language Processing (Interspeech-2006), 1459-1462, Pittsburgh, Sep. 2006.
Ryu Takeda, Shun'ichi Yamamoto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature Mask Generation, Proceedings of International Conference on Spoken Language Processing (Interspeech-2006), 2302-2305, Pittsburgh, Sep. 2006.
Yuichiro Fukubayashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems, Proceedings of International Conference on Spoken Language Processing (Interspeech-2006), 1946-1949, Pittsburgh, Sep. 2006.
Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Leak Energy based Missing Feature Mask Generation for ICA and GSS and Its Evaluation with Simultaneous Speech Recognition, Proceedings of ISCA Tutorial and Research Workshop on Statistical and Perceptual Audition (SAPA2006), pp.42-46,
Kazunori Komatani, Naoyuki Kanda, Mikio Nakano, Kazuhiro Nakadai, Hiroshi Tsujino, Tetsuya Ogata, Hiroshi G. Okuno: Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors, Proceedings of SIGdial Workshop on Discourse and Dialogue, 9-17, Aug. 2006
Hiroshi G. Okuno: Computational Auditory Scene Analysis - Towards Listening to Several Thinkgs at Once -, 50th Anniversary Summit of Artificial Intelligence (ASAI50) workshop and abstract booklet, accepted for inclusion, Monte Verita, Switzerland, July 2006.
Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Robust Decomposition of Inverse Filter of Channel and Prediction Error Filter of Speech Signal for Dereverberation, Proceedings of the 14th European Signal Processing Conference (EUSIPCO 2006), CD-ROM Proceedings, Florence, 2006.
Ryunosuke Yokoya, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Robot Imitation from Active-Sensing Experiences, Proceedings of Fifth International Conference on Learning and Development (ICDL06), accepted, Bloomington, IN USA, May 2006.
Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: AN ERROR CORRECTION FRAMEWORK BASED ON DRUM PATTERN PERIODICITY FOR IMPROVING DRUM SOUND DETECTION, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.V, pp.237-240, IEEE, Toulouse, May 2006. , doi:10.1109/ICASSP.2006.11661256 IEEE 関西支部学生研究奨励賞
Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: F0 ESTIMATION METHOD FOR SINGING VOICE IN POLYPHONIC AUDIO SIGNAL BASED ON STATISTICAL VOCAL MODEL AND VITERBI SEARCH, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.V, pp.253-256, IEEE, Toulouse, May 2006. , doi:10.1109/ICASSP.2006.1661260
Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Instrogram: A New Musical Instrument Recognition Technique Without Using Onset Detection Nor F0 Estimation, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.V, pp.229-232, IEEE, Toulouse, May 2006. , doi:10.1109/ICASSP.2006.1661254 IEEE 関西支部学生研究奨励賞
Kazuhiro Nakadai, Hirofumi Nakajima, Masamitsu Murase, Satoshi Kaijiri. Kentaro Yamada, Yuji Hasegawa, Hiroshi G. Okuno, Hiroshi Tsujino: ROBUST TRACKING OF MULTIPLE SOUND SOURCES BY SPATIAL INTEGRATION OF ROOM AND ROBOT MICROPHONE ARRAYS, Proceedings of 2006 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2006), Vol.IV, pp.929-932, IEEE, Toulouse, May 2006. , doi:10.1109/ICASSP.2006.1661122
Hyun-Don Kim, Jong-Suk Choi, and Munsang Kim: Speaker Localization among Multi-faces in Noisy Environment by Audio-Visual Integration, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2006), 1305-1310, (May 2006). 10.1109/ROBOT.2006.1641889
口頭発表（研究会・全国大会）
白松俊, 駒谷和範, 尾形哲也, 奥乃博: コーパスからの関連語獲得に基づく連想を加味した顕現性の推定, 言語処理学会第13回年次大会, B3-6, Mar. 2007.
駒谷和範, 河原達也: 奥乃博: 音声対話システムにおけるユーザのふるまいの経時的変化の分析, 言語処理学会第13回年次大会, E1-5, Mar. 2007.
中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司: マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡, 電子情報通信学会総合大会, Mar. 2007.
安部武宏, 糸山克寿, 北原鉄朗, 柳田益造: 撥弦の物理モデルを用いた音響信号からのパラメータ推定, 日本音響学会音楽音響研究会資料, MA2006-91, Mar. 2007.
藤原弘将, 後藤真孝, 緒方淳, 駒谷和範, 尾形哲也, 奥乃博: 歌声の分離と音響モデルの分離歌声への適用に基づく音楽音響信号と歌詞の時間的対応付け手法, 音響学会春季講演会, 3-7-3, Mar. 2007.
丹羽治彦, 駒谷和範, 尾形哲也, 奥乃博: 可聴域音波を用いたAcoustical Holography (AH) による遮蔽物の検出と距離計測法, 音響学会春季講演会, 1-10-7, Mar. 2007.
神田尚, 尾形哲也, 駒谷和範, 奥乃博: 人間型声道モデルと神経回路モデルを利用した母音模倣, 情報処理学会第69回全国大会, 1Q-2, Mar. 2007.
横矢龍之介, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 自己身体モデルの投影に基づくロボットによる他者の動作予測, 情報処理学会第69回全国大会, 1R-3, Mar. 2007.
村瀬昌満, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: RNNPBによる自然言語列と動作列の意味的結合と人間ロボットインタラクション, 情報処理学会第69回全国大会, 1R-4, Mar. 2007. 学生奨励賞
糸山克寿, 駒谷和範, 尾形哲也, 奥乃博: 楽譜情報を用いたNMFによる音楽音響信号の音源分離, 情報処理学会第69回全国大会, 2N-1, Mar. 2007.
西山正紘, 北原鉄朗, 駒谷和範, 尾形哲也, 奥乃博: マルチメディアコンテンツにおける音楽と映像の調和に関する分析, 情報処理学会第69回全国大会, 2N-6, Mar. 2007. 学生奨励賞
金天海, 尾形哲也, 菅野重樹: 自己組織化回路素子(SONE)への教師あり学習の付与, 情報処理学会第69回全国大会, 2Q-3, Mar. 2007.
清水敬太, 北原鉄朗, 駒谷和範, 尾形哲也, 奥乃博: Onomatree:擬音語と木構造を併用した環境音検索インターフェース, 情報処理学会第69回全国大会, 3N-7, Mar. 2007. 学生奨励賞
徳田浩一, 駒谷和範, 尾形哲也, 奥乃博: 聴覚障害児の授業支援のためのHMDによる音声認識結果提示システムの設計, 情報処理学会第69回全国大会, 3ZB-4, Mar. 2007.
金鉉燉, 駒谷和範, 尾形哲也, 奥乃博（京大）: EMアルゴリズムとパーティクルフィルタの統合によるリアルタイム複数の人物追跡システム実現, 情報処理学会第69回全国大会, 4B-3, Mar. 2007.
福林雄一朗, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける発話検証を利用したシステム想定外発話の誤受理抑制, 情報処理学会第69回全国大会, 5Q-5, Mar. 2007.
池田智志, 駒谷和範, 尾形哲也, 奥乃博: マルチドメイン音声対話システムにおけるシステム想定外発話のトピック推定に基づく発話誘導, 情報処理学会第69回全国大会, 5Q-6, Mar. 2007.
西出俊, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 物体静止画像から動的特徴を抽出する神経回路モデルの学習と解析, 情報処理学会第69回全国大会, 6B-4, Mar. 2007.
吉田雅敏, 海尻聡, 山本俊一, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: 音環境を可視化する録音再生システム, 情報処理学会第69回全国大会, 6ZB-2, Mar. 2007. 学生奨励賞
武田龍, 山本俊一, 駒谷和範, 尾形哲也, 奥乃博: ICA と MFT に基づく音声認識における Soft Mask を用いた性能評価, 情報処理学会第69回全国大会, 6ZB-6, Mar. 2007.
西山正紘, 北原鉄朗, 駒谷和範, 尾形哲也, 奥乃博: マルチメディアコンテンツにおける音楽と映像の調和度計算モデル, 音楽情報処理研究会, 2007-MUS-69, Vol.2007, No.15, pp.31--36, 情報処理学会, Feb. 23, 2007.
福林雄一朗, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおけるヘルプ生成のためのシステム想定外発話の誤受理抑制, 第65回音声言語情報処理研究会, 2007-SLP-65, 2007-HI-122, Vol.2007, No.11, pp.61--66, 情報処理学会, 伊豆長岡, Feb., 2007.
西出俊, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 能動知覚経験に基づく物体静止画像からの挙動推定, 第7回システムインテグレーション部門講演会 (SI2006), 1B2-4, 計測自動制御学会, Dec. 2006. SI2006優秀講演賞
中臺一博, 中島弘史, 村瀬昌満, 長谷川雄二, 奥乃博, 辻野広司: 複数のマイクロフォンアレイのパーティクルフィルタに基づく統合による音源追跡, 第7回システムインテグレーション部門講演会 (SI2006), 2D2-4, 計測自動制御学会, Dec. 2006.
武田龍, 山本俊一, 駒谷和範, 尾形哲也, 奥乃博: ICA による音源分離とMFTに基づく音声認識の同時発話認識による評価, 第24回 AI チャレンジ研究会, SIG-Challenge-0624-2, pp.9--16, 人工知能学会, Nov. 2006.
中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司: 複数マイクロホンアレイのパーティクルフィルタ統合による実時間音源追跡, 第24回 AI チャレンジ研究会, SIG-Challenge-0624-7, pp.43--50, 人工知能学会, Nov. 2006.
Hyun-Don Kim, 駒谷和範, 尾形哲也, 奥乃博: 視聴覚情報統合及びEMアルゴリズムを用いた人物追跡システム実現, 第24回 AI チャレンジ研究会, SIG-Challenge-0624-8, pp.51--58, 人工知能学会, Nov. 2006.
尾形哲也, 小嶋秀樹, 駒谷和範, 奥乃博: RNNPBによる視聴覚情報変換を利用したロボットの身体・音声表現, 言語理解とコミュニケーション研究会他, TL2006-22 NLC2006-18 PRMU2006-99 pp.27-32(TL), pp.27-32(NLC), pp.45-50(PRMU), 電子情報通信学会, Oct. 2006.
丹羽治彦, 駒谷和範, 尾形哲也, 奥乃博: 可聴音を用いたAH法による遮蔽された物体の検出と距離計測, 応用電気音響研究会, EA2006-48, pp.1-6, 電子情報通信学会, Sep. 29, 2006.
中臺一博, 中島弘史, 村瀬昌満, 奥乃博, 長谷川雄二, 辻野広司: 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡, 日本ロボット学会第24回大会, 1B11, Sep. 2006.
山本俊一, 中臺一博, 中野幹生, 辻野広司, Jean-Marc Valin, 駒谷和範, 尾形哲也, 奥乃博: パラメータ最適化による実環境同時発話認識向上とそのオンライン処理の実装, 日本ロボット学会第24回大会, 1B12, Sep. 2006.
武田龍, 山本俊一, 駒谷和範, 尾形哲也, 奥乃博: ICAとミッシングフィーチャマスク自動生成によるロボット聴覚, 日本ロボット学会第24回大会, 1B13, Sep. 2006.
尾形哲也, 服部佑哉, 小嶋秀樹, 駒谷和範, 奥乃博: リカレントニューラルネットワークによるロボットの異種感覚モダリティ変換, 日本ロボット学会第24回大会, 2L22, Sep. 2006.
村瀬昌満, 松本祥平, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: 人間ロボット協調のための RNNPB による擬似シンボルの獲得とその階層性の解析, 日本ロボット学会第24回大会, 3K24, Sep. 2006.
横矢龍之介, 尾形哲也, 谷淳, 駒谷和範, 奥乃博: ロボットの身体経験に基づく RNNPB を用いた模倣動作の自律的獲得, 日本ロボット学会第24回大会, 3D34, Sep. 2006.
藤原弘将, 後藤真孝, 緒方淳, 駒谷和範, 尾形哲也, 奥乃博: 音楽音響信号と歌詞の時間的対応付け手法: 歌声の分離と母音のViterbiアラインメント, 音楽情報処理研究会, 2006-MUS-66, Vol.2006, No.90, pp.37-44, 情報処理学会, Aug. 2006. 山下記念研究賞
北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: Instrogram: 発音時刻検出とF0推定の不要な楽器音認識手法, 音楽情報処理研究会, 2006-MUS-66, Vol.2006, No.90, pp.69-76, 情報処理学会, Aug. 2006.
吉井和佳, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: ユーザの評価と音響的特徴との確率的統合に基づくハイブリッド型楽曲推薦システム音楽情報処理研究会, 2006-MUS-66, Vol.2006, No.90, pp.45-72, 情報処理学会, Aug. 2006. ベストプレゼンテーション賞
福林雄一朗, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける発話パターンを教示するヘルプの動的生成, 人工知能学会研究会資料, SIG-SLUD-A601-03, pp.13-18, 人工知能学会, Jul. 2006.
特許・ディジタルコンテンツ
文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松俊, 駒谷和範, 奥乃博, OBPCT/JP2007/055448, 16 Mar. 2007.
音楽音響信号と歌詞の時間的対応づけ方法, 発明者: 藤原弘将, 奥乃博, 後藤真孝, 特願2006-289289号, 24 Oct. 2006.
ロボット視聴覚システム, 特許3843743号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67849号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特許3843742号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67848号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特許3843741号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67847号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特許3843740号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 登録日:2006年8月25日, 発行日:2006年11月8日, 公開日 2002年9月18日. 特願2001-67846号, 出願日 2001年3月9日.
文単位検索方法, 文単位検索装置, コンピュータプログラム, 記憶媒体, 及び文書記憶装置, 発明者: 白松俊, 駒谷和範, 奥乃博, 特願2006-224563号, 21 Aug. 2006.
情報処理システムおよび情報処理方法, 並びにプログラム, 発明者: 菅野重樹, 尾形哲也, 金天海, 特願2006-172141号, 29 Jun. 2006. 特願2004-363742号, 15 Dec. 2005.
鍵盤楽器支援装置及び鍵盤楽器支援システム, 発明者: 武田正之, 石田克久, 北原鉄朗, 特開2006-145681号, 8 Jun. 2006. 特願 2004-333279号, 17 Nov. 2004.
Moving object equipped with ultra-directional speaker, Inventors: Kiyofumi Mori, Shunji Yoshida, Hiroshi Okuno, Kazuhiro Nakadai, Hiroshi Tsujino, Application No. 20070172076. Filed: July 26, 2007. PCT No.: PCT/JP05/02043. OB
Speech Recongition Device, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto, European Patent: EP1691344, Publication Date: 08/16/2006, Application number: EP20040818533, Filing Date: 11/12/2004
Method and Apparatus for Determining Sound Source, Patent No. US 7,035,418, Issue date: Apr. 25, 2006. Filing date: June 7, 2000. Inventors: Hiroshi Okuno, Hiroaki Kitano, Yukiko Nakagawa, Assignee: Japan Science and Technology Agency. PCT/JP00/03695
音源同定装置及びその同定方法, 米国特許第7,035,418号, 発明者：奥乃博, 北野宏明, 中川由紀子, 特許日：2006年4月25日. 存続期限：2023年2月23日.
Robot audiovisual system Patent No. US 7,016,505. Issue date: Mar 21, 2006. Filing date: Nov 1, 2000. Inventors: Kazuhiro Nakadai, Hiroshi Okuno, Hiroaki Kitano, Assignee: Japan Science and Technology Agency.
ロボット聴覚装置及びロボット聴覚システム. 発明者：中臺一博, 奥乃博, 北野宏明, 特許第3780516号, 登録日 2006年3月17日. 発行日 2006年5月31日. 特願2002-502769号, 出願日: 2001年6月8日.
メロディーと歌詞の時間的対応付けプログラム, 京都大学デジタルコンテンツC20, Nov. 2006. 開発者: 藤原弘将, 後藤真孝, 奥乃博
Drumix: ドラムパートのリアルタイム編集機能つきオーディオプレイアー, 京都大学デジタルコンテンツC18, Jun. 2006. 開発者: 吉井和佳, 後藤真孝, 奥乃博

2006年度  ２００５年度（奥乃研究室） 2004年度

学位論文

神田直之: マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択法, 修士論文, Feb. 2006.
田崎豪: 人間親密度の空間マッピングによるロボットと複数人とのインタラクション, 修士論文, Feb. 2006.
服部佑哉: モダリティ間マッピングに基づく環境音を表現するロボット動作生成, 修士論文, Feb. 2006.
松本祥平: 人間ロボット協調のためのRNNPBを用いた疑似シンボルの獲得, 修士論文, Feb. 2006.
吉岡拓也: 室内伝達系と音声生成系の逆フィルタの同時推定によるブラインド残響除去, 修士論文, Feb. 2006.
糸山克寿: 多重奏中特定パートの自動採譜のための複数特徴量の重み自動推定, 卒業特別研究報告, Feb. 2006.
田口明裕: 擬音語・抑揚・リズムに基づく環境音記述用XMLタグの設計と自動付与, 卒業特別研究報告, Feb. 2006.
武田龍: ICAによる音源分離とミッシングフィーチャマスクの自動生成による同時発話認識, 卒業特別研究報告, Feb. 2006.
福林雄一朗: 音声対話システムにおけるドメイン概念木に基づく動的ヘルプ生成 , 卒業特別研究報告, Feb. 2006.
横矢龍之介: アクティブセンシングに基づくロボットによる模倣動作の自律的獲得, 卒業特別研究報告, Feb. 2006.
査読つきジャーナル論文
Yasuhiro Akiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Using Multiple Edit Distances to Automatically Grade Outputs from Machine Translation Systems, IEEE Transactions on Audio, Speech and Language Processing, Vol.14, No.2, (Mar. 2006) 393--402. doi:10.1109/TSA.2005.860770
Mototaka Suzuki, Kuniaki Noda, Yuki Suga, Tetsuya Ogata, and Shigeki Sugano: Dynamic Perception after Visually-Guided Grasping by a Human-Like Autonomous Robot, Advanced Robotics, Vol.20, Issue 2 (Feb. 2006) 233-254. VSP and Robotics Society of Japan. doi:10.1163/156855306775525785 IF: 0.510
Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Common Acoustical Pole Estimation from Multi-Channel Musical Audio Signals, IEICE Trans. on Fundamentals of Electronics, Communications, and Computer Sciences, Vol.E89-A, No.1 (Jan. 2006) 240-247, IEICE.
Tetsuya Ogata, Hayato Ohba, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno: Extracting Multi-Modal Dynamics of Objects using RNNPB, Journal of Robotics and Mechatronics, Vol.17, No.6 (Dec. 2005) pp.681-688, Special Issue on Human Modeling in Robotics. ,
Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Pitch-Dependent Identification of Musical Instrument Sounds, Applied Intelligence, Vol.23, No.3, pp.267-275, Springer-Verlag (formerly Kluwer Publishers). doi:10.1007/s10489-005-4612-1 IF: 1.853
小鷹研理, 尾形哲也, 奥乃博: 非線形振動子による引き込みを利用した仮想空間における歩行, ヒューマンインタフェース学会論文誌, Vol.7, No.4, 26-36, 2005.
山本俊一, 中臺一博, 辻野広司, 奥乃博: ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用, 日本ロボット学会誌, Vol.23, No.6 (Aug. 2005) 743-751. , 学会サーバ
白松俊, 宮田高志, 奥乃博, 橋田浩一: ゲーム理論による中心化理論の解体と実言語データに基づく検証. 自然言語処理, Vol.12, No.3 (July 2005) 91-110.
Tetsuya Ogata, Shigeki Sugano, and Jun Tani: Open-end Human-Robot Interaction from the Dynamical Systems Perspective - Mutual Adaptation and Incremental Learning, Advanced Roboics, Vol.19. No.6, pp.651-670, VSP and Robotics Society of Japan. doi:10.1163/1568553054255655 IF: 0.510
石田克久, 北原鉄朗, 武田正之: N-gram による旋律の音楽適否判定に基づいた即興演奏支援システム, 情報処理学会論文誌, Vol.46, No.7 (July 2005) pp.1548-1559, 情報処理学会. in html
章分担・解説論文・翻訳
Masahiro Nisiyama, Hiroaki Kawashima, Takatsugu Hirayama, Takashi Matsuyama: Facial Expression Representation based on Timing Structures in Faces, Proceedings of IEEE International Workshop on Analysis and Modeling of Faces and Gestures (AMFG 2005), LNCS 3723, pp.139-153, Beijing, Oct. 2005.
Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Distance-Based Dynamic Interaction of Humanoid Robot with Multiple People. Innovations in Applied Artificial Intelligence (IEA/AIE-2005), LNAI 3533, 111-120, Best paper award, Springer-Verlag. Bari, Italy, Jun. 2005. Paper doi:10.1007/11504894_18
内山勝利, 応地利明, 岡真理, 奥乃博, 鈴木博之, 深谷賢治, モジュタバ・サドリア, ユベール・デュルト: ワークショップ1「こころとトボス--こころのよりどころ」, 京都文化会議2005報告集, pp.64-73, Mar. 2006.
Katsutoshi Uchiyama, Toshiaki Ohji, Mari Oka, Hiroshi G. Okuno, Hiroyuki Suzuki, Kenji Fukaya, Modjtaba Sadria, Hubert Durt Kokoro and Topos -- Bastions of Kokoro, Kyoto Inernational Culture Forum 2005, pp.62-73, Mar. 2006.
吉岡拓也訳: センサネットワークによる生息環境モニタリング, CACM 日本語版, Vol.5, No.1 (Aug., 2005) pp.4-12
原著: Habitat Monitoring with Sensor Networks, by Robert Szewczyk, Eric Osterwell Joseph Polastre, Michael Hamilton, Alan Mainwaring, and Deborah Estrin, CACM, Vol.47, No.6 (June 2004) 34 - 40.
服部佑哉訳: ワイヤレスセンサネットワークを実現するプラットフォーム, CACM 日本語版, Vol.5, No.1 (Aug. 2005) pp.13-20
原著: The Platforms Enabling Wireless Sensor Networks, by Jason Hill, Mike Horton, Ralph Kling, and Lakshman Krishnamurthy, CACM, Vol.47, No.6 (June 2004) 34 - 40.
神田直之訳: センサネットワークにおける問い合わせ処理のネットワークサポート, CACM 日本語版, Vol.5, No.1 (Aug. 2005) pp.21-29
原著: Networking Support for Query Processing in Sensor Networks, by Alec Woo, Sam Madden, and Ramesh Govindan, CACM, Vol.47, No.6 (June 2004) 47 - 52.
田崎豪訳: ワイヤレスセンサネットワークにおけるセキュリティ, CACM 日本語版, Vol.5, No.1 (Aug. 2005) pp.30-36
原著: Security in Wireless Sensor Networks, by Adrian Perrig, Jhn Stankovic, and David Wagner, CACM, Vol.47, No.6 (June 2004) 53 - 57.
奥乃博丹羽治彦, 尾形哲也: 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識, 超音波テクノ, pp.79-84, 2005年9-10月号.
査読つき国際会議論文
Shun Shiramatsu, Kazunori Komatani, Takashi Miyata, Koiti Hasida, Hiroshi G. Okuno: Empirical Verification of Meaning-Game-based Generalization of Centering Theory with Large Japanese Corpus, Proceedings of the 19th Pacific Asia Conference on Language, Information, and Computation (PACLIC 19), 192-210, Taipei, Dec. 2005.
Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: INTER:D A Drum Sound Equalizer for Controlling Volume and Timbre of Druams, Proceedings of 2nd European Workshop on the Integration of Knowledge, Semantic and Digital Media Technologies (EWIMT 2005), pp.205--212, EU Commission, IEE Savoy Place, London, Nov. 2005. IEEE
Kenri Kodaka, Tetsuya Ogata, Hiroshi G. Okuno: Walking with Body-sense in Virtual Space Using the Nonlinear Oscillator, Proceedings of the International Conference on Systems, Man and Cybernetics (SMC-2005), 324--329, IEEE, Hawaii, Oct. 10-12, 2005. Finalist for Best Student Paper doi:10.1109/ICSMC.2005.1571166
Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: AdaMast: A Drum Sound Recognizer based on Adaptation and Matching of Spectrogram Templates, Proceedings of MIREX 2005, London, Sep. 2005. Paper . Best in Class Award.
Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: SINGER IDENTIFICATION BASED ON ACCOMPANIMENT SOUND REDUCTION AND RELIABLE FRAME SELECTION, Proceedings of 6th International Conference on Musical Information Retrieval (ISMIR-2005), 329-336, London, Sep. 2005.
Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: INSTRUMENT IDENTIFICATION IN POLYPHONIC MUSIC: FEATURE WEIGHTING WITH MIXED SOUNDS, PITCH-DEPENDENT TIMBRE MODELING, AND USE OF MUSICAL CONTEXT, Proceedings of 6th International Conference on Musical Information Retrieval (ISMIR-2005), 558-563, London, Sep. 2005.
Kazunori Komatani, Naoyuki Kanda, Tetsuya Ogata, Hiroshi G. Okuno: Contextual Constraints based on Dialogue Models in Database Search Task for Spoken Dialogue Systems, Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005), 877-880, Lisboa, Sep. 2005. .
Masamitsu Murase, Shun'ichi Yamamoto, Jean-Marc Valin, Kazuhiro Nakadai, Kentaro Yamada, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Multiple Moving Speaker Tracking by Microphone Array on Mobile Robot, Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005), 249-252, Lisboa, Sep. 2005. .
Tetsuro Kitahara, Katsuhisa Ishida, Masayuki Takeda: ism: Improvisation Supporting Systems with Melody Correction and Key Vibration, Proceedings of International Conference on Entertainment Computing (ICEC 2005), Mita, Hyogo, Sep. 2005.
Shun'ichi Yamamoto, Kazuhiro Nakadai, Jean-Marc Valin, Jean Rouat, Francois Michaud, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Making A Robot Recognize Three Simultaneous Sentences in Real-Time, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.4040-4045, IEEE, RSJ, Edmonton, Aug. 2005. . doi:10.1109/IROS.2005.1545094
Syunsuke Kurotaki, Noriaki Suzuki, Kazuhiro Nakadai, Hiroshi G. Okuno, Hideharu Amano: Implementation of Active Direction-Pass Filter on Dynamically Reconfigurable Processor, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.3175-3180, IEEE, RSJ, Edmonton, Aug. 2005. . doi:10.1109/IROS.2005.1545033
Tsuyoshi Tasaki, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Spatially Mapping of Friendliness for Human-Robot Interaction, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.1277-1282, IEEE, RSJ, Edmonton, Aug. 2005. . doi:10.1109/IROS.2005.1545034
Mikio Nakano, Naoyuki Kanda, Yuji Hasegawa, Toyotaka Torii, Yohane Takeuchi, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G. Okuno: A Two-Layer Model for Behavior and Dialogue Planning in Conversational Service Robots, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.3329-3335, IEEE, RSJ, Edmonton, Aug. 2005. . doi:10.1109/IROS.2005.1545198
Tetsuya Ogata, Hayato Ohba, Kazunori Komatani, Jun Tani, Hiroshi G. Okuno: Extracting Multi-Modal Dynamics of Objects using RNNPB Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005), pp.966-971, IEEE, RSJ, Edmonton, Aug. 2005. . doi:10.1109/IROS.2005.1544975
Kazunori Komatani, Ryoji Hamabe, Tetsuya Ogata, Hiroshi G. Okuno: Generating Confirmation to Distinguish Phonologically Confusing Word Pairs in Spoken Dialogue Systems Proceedings of 4th IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems, pp.40-45, July 2005.
Yuya Hattori, Hideki Kojima, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Gesture Generation from Environmental Sounds Using Inter-modality Mapping, Proceedings of Fifth International Workshop on Epigenetic Robotics (EpiRobo-2005), 139-140, Nara, July 2005.
Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Blind Estimation of Room Resonances Using Popular, Classical, and Jazz Music. Proceedings of AES 118th Convenvion, 6632, Audio Engineering Society, Barcelona, Spain, May 28-31, 2005.
Shun'ichi Yamamoto, Jean-Marc Valin Kazuhiro Nakadai, Hiroshi Tsujino, Jean Rouat, Francois Michaud, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno: Enhanced Robot Speech Recognition Based on Microphone Array Source Separation and Missing Feature Theory. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2005), 1477-1482, IEEE, Barcelona, Apr. 2005.
口頭発表（研究会・全国大会）
北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: Introgram: 楽器存在確率に基づく音楽視覚表現法, 音響学会春季講演会, 2-2-13, 715-716, Mar. 2006.
藤原弘将, 北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 調波構造抽出と高信頼度フレーム選択を用いた雑音下での話者識別, 音響学会春季講演会, 1-11-17, 55-56, Mar. 2006.
白松俊, 駒谷和範, 尾形哲也, 奥乃博: ゲーム理論に基づく中心化理論の再定式化と日英コーパスを用いた統計的検証, 言語処理学会第12回年次大会, A2-1, Mar. 2006.
駒谷和範, 河原達也, 奥乃博: 京都市バス運行情報案内システムにおける実ユーザのふるまいの分析言語処理学会第12回年次大会, B1-5, Mar. 2006.
横矢龍之介, 駒谷和範, 尾形哲也, 谷淳, 奥乃博: アクティブセンシングを用いたロボットによる模倣動作の自律的獲得, 情報処理学会第68回全国大会, 7L-7, Mar. 2006. 学生奨励賞
松本祥平, 駒谷和範, 尾形哲也, 谷淳, 奥乃博: RNNPB を用いて獲得した疑似シンボルによる人間とロボットの協調の実現, 情報処理学会第68回全国大会, 7L-6, Mar. 2006.
服部佑哉, 駒谷和範, 尾形哲也, 小嶋秀樹, 奥乃博: RNNPBを用いたモダリティ間マッピングによるロボットの動作生成, 情報処理学会第68回全国大会, 6L-8, Mar. 2006. 学生奨励賞
村瀬昌満, 中臺一博, 奥乃博: パーティクルフィルタによる音源追跡の性能評価, 情報処理学会第68回全国大会, 5M-9, Mar. 2006.
武田龍, 山本俊一, 駒谷和範, 尾形哲也, 奥乃博: ICAによる音源分離とミッシングフィーチャマスクの自動生成による同時発話認識, 情報処理学会第68回全国大会, 5M-8, Mar. 2006.
福林雄一朗, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおけるユーザの誤り原因推定に基づく動的ヘルプ生成, 情報処理学会第68回全国大会, 5M-2, Mar. 2006.
神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博: 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化, 情報処理学会第68回全国大会, 5M-1, Mar. 2006.
田崎豪, 駒谷和範, 尾形哲也, 奥乃博: 強化学習による人間位置に基づいたロボットの挙動選択, 情報処理学会第68回全国大会, 4S-4, Mar. 2006.
Hyun-Don Kim, 駒谷和範, 尾形哲也, 奥乃博: 音源定位及び唇の動き検出による複数ユーザ環境における発話者認識, 情報処理学会第68回全国大会, 4B-4, Mar. 2006.
山本俊一, 中臺一博, 中野幹生, 辻野広司, Jean-Marc Valin, 武田龍, 駒谷和範, 尾形哲也, 奥乃博: GAによる話者位置への同時発話認識システムの最適化, 情報処理学会第68回全国大会, 4B-3, Mar. 2006.
田口明裕, 北原鉄朗, 石原一志, 駒谷和範, 尾形哲也, 奥乃博: 擬音語表現を利用した環境音のためのXMLタグの設計と自動付与, 情報処理学会第68回全国大会, 3L-7, Mar. 2006. 学生奨励賞
西山正紘, 北原鉄朗, 駒谷和範, 尾形哲也, 奥乃博: 標題音楽アノテーションのための階層的物語タグの設計, 情報処理学会第68回全国大会, 3L-6, Mar. 2006.
糸山克寿, 北原鉄朗, 駒谷和範, 尾形哲也, 奥乃博: 多重奏中特定パートの自動採譜における複数特徴量の自動重み付け, 情報処理学会第68回全国大会, 2L-4, Mar. 2006.
吉井和佳, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: Drumix: ドラムパートのリアルタイム編集機能付きオーディオプレイヤー, インタラクション2006, インタラクティブセッション, 207-208, 情報処理学会, Mar. 2006. インタラクティブ発表賞
丹羽治彦, 駒谷和範, 尾形哲也, 奥乃博: 可聴域音波の広指向性と回折を利用した同時複数物体定位と遮蔽物検出, 音響学会超音波研究会, USs2005-110, Jan. 26, 2006.
神田直之, 駒谷和範, 中野幹生, 中臺一博, 辻野広司, 尾形哲也, 奥乃博: 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化, 情報処理学会第60回音声言語処理研究会, SLP, Feb. 2006.
北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 多重奏の音源同定における音の重なりに対する頑健性の改善, (社)音響学会関西支部第8回若手研究者交流研究発表会 , 2005年12月16日. 奨励賞
丹羽治彦, 駒谷和範, 尾形哲也, 奥乃博: 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識, (社)音響学会関西支部第8回若手研究者交流研究発表会 , 2005年12月16日.
山本俊一, 中臺一博, 中野幹生, 辻野広司, Jean-Marc Valin, 駒谷和範, 尾形哲也, 奥乃博: 音源分離と音声認識を統合した同時発話認識システムの同時発話文による評価, 第6回システムインテグレーション部門講演会 (SI2005), 計測自動制御学会, Dec. 2005.
海尻聡, 石原一志, 北原鉄朗, Jean-Marc Valin, 駒谷和範, 尾形哲也, 奥乃博: ロボットによる周囲状況把握のための雑音下での環境音認識, 第6回システムインテグレーション部門講演会 (SI2005), 計測自動制御学会, Dec. 2005.
北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 混合音からの特徴量テンプレート作成と音楽的文脈の利用による多重奏の音源同定, 音響学会秋季研究発表会, 3-10-15, pp.-, Sep. 2005.
山本俊一, Jean-Marc Valin, 中臺一博, 中野幹生, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博: ミッシングフィーチャ理論を適用した同時発話認識システムの同時発話文による評価, 第22回 AI チャレンジ研究会, SIG-Challenge-0522-17, pp.101--106, 人工知能学会, Nov. 2005.
川嶋宏彰, 西山正紘, 松山隆司: 表情譜:タイミング構造に基づく表情の記述・生成・認識, 第4回情報科学技術フォーラム, LI-006, pp.153-156, Sep. 2005 . FIT2005 船井ベストペーパー賞
服部佑哉, 小嶋秀樹, 駒谷和範, 尾形哲也, 奥乃博: モダリティ間マッピングを用いた環境音を表現するロボットジェスチャー生成, 日本ロボット学会第23回大会, 1H14, Sep. 2005.
松本祥平, 大谷拓, 駒谷和範, 尾形哲也, 谷淳, 奥乃博: 人間との対話のためのロボットによる疑似シンボル獲得とリアルタイム表情認識, 日本ロボット学会第23回大会, 1H15, Sep. 2005.
田崎豪, 駒谷和範, 尾形哲也, 奥乃博: ロボットによる複数人同時インタラクションのための人間密度空間マッピング, 日本ロボット学会第23回大会, 2H16, Sep. 2005.
村瀬昌満, 山本俊一, Jean-Marc Valin, 中臺一博, 山田健太郎, 駒谷和範, 尾形哲也, 奥乃博: 複数のカルマンフィルタを用いた複数移動話者追跡と精度評価. 日本ロボット学会第23回大会, 3C26, Sep. 2005.
黒瀧俊輔, 鈴木紀章, 中臺一博, 奥乃博, 天野英晴: アクティブ方向通過型フィルタの動的リコンフィギュラブルデバイスによる実装, 日本ロボット学会第23回大会, 3C34, Sep. 2005.
山本俊一, Jean-Marc Valin, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: ミッシングフィーチャー理論に基づく音源分離と音声認識のインターフェースの評価, 日本ロボット学会第23回大会, 3C35, Sep. 2005.
吉井和佳, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: ドラムパターン推定によるドラム音認識誤り補正手法, 音楽情報科学研究会, 2005-MUS-61, Vol.2005, No.82, pp.91-96, 情報処理学会, Aug. 2005. 山下記念研究賞
石原一志, 北原鉄朗: 擬音語を用いた音素材検索システム, デモンストレーション：若手による研究紹介II, 音楽情報科学研究会, 2005-MUS-61, Vol.2005, No.82, pp.29, 情報処理学会, Aug. 2005.
藤原弘将, 北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 伴奏音抑制と高信頼度フレーム選択に基づく楽曲中の歌声の歌手名同定手法, 音楽情報科学研究会, 2005-MUS-61, Vol.2005, No.82, pp.97-104, 情報処理学会, Aug. 2005.
奥乃博, 中臺一博: 聖徳太子ロボット - 視聴覚統合によるロボット聴覚, 画像センシングシンポジウム, 人間共存・協調ロボットセッション招待講演 (Jun. 2005), pp.87-92.
駒谷和範: 音声対話システムにおける対話のモデル, チュートリアル, 人工知能学会研究会資料, SIG-SLUD-A501-05, pp.27--32, 人工知能学会, Jun. 2004.
浜辺良二, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける音韻的類似表現の混同を防ぐための確認の自動生成. 第56回音声言語情報処理研究会 2005-NL-167 (13), 2005-SLP-56 (13), Vol.2005, No.50, pp.89-94, 情報処理学会, May 27, 2005.
北原鉄朗, 石田克久, 武田正之: 振動機能付鍵盤楽器「ぶるぶるくん」を用いた即興演奏支援システム, 音楽情報処理研究会, 2005-MUS-60 (1), Vol.2005, No.45, pp.25-30, 情報処理学会, May 2005.
黒瀧俊輔, 鈴木紀章, 中臺一博, 奥乃博, 天野英晴: 動的リコンフィギュラブルデバイスDRPを用いた音源分離フィルタの実装と評価, リコンフィギュラブルシステム研究会, RECONF2005-26 (2005-5), 信学技報 Vol.105, No.43, pp.67-72, 電子情報通信学会, May 2005.
西山正紘, 川嶋宏彰, 松山隆司: 表情譜: 顔パーツ間のタイミング構造の記述とその自動獲得. コンピュータビジョンとイメージメディア研究会 2005-CVIM-149-25, Vol.2005, 情報処理学会, May 13, 2005. 卒論セッション優秀賞
特許
音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム. 特開2006-5807号, 公開日 2006年1月5日, 発明者：後藤真孝, 吉井和佳, 奥乃博, 特願2004-181881号, 出願日 2004年6月18日, 登録日 2004年6月23日.
音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム. 発明者：吉井和佳, 奥乃博, 後藤真孝, 米国特許公開 US2005/0283361 A1, 公開日 2005年12月22日, 出願日 2004年12月21日.
Robot audiovisual system Patent No. US 6,967,455. Filing date: Mar 8, 2002. Issue date: Nov 22, 2005. Inventors: Kazuhiro Nakadai, Ken-ichi Hidai, Hiroshi Okuno, Hiroaki Kitano. Assignee: Japan Science and Technology Agency
Speech Recongition Device, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi Okuno, Shunichi Yamamoto, Wipo Patent: WO/2005/048239, Application Number: PCT/JP2004/016883, Publication Date: 05/26/2005, Filing Date: 11/12/2004.

2005年度  ２００４年度（奥乃研究室） 2003年度

学位論文

秋葉泰弘: Automatic Evaluation Methods for Machine Translation Systems (機械翻訳システムの自動評価法), 博士論文, Jan. 2005.
石原一志: 環境音からの擬音語への自動変換と環境音検索システムへの応用, 修士論文, Feb. 2005
小鷹研理: 一次反射音と身体的ダイナミクスを利用した仮想空間上の移動間隔提示, 修士論文, Feb. 2005
山本俊一: 音源分離との統合によるミッシングフィーチャーマスク自動生成に基づく同時発話音声認識, 修士論文, Feb. 2005
山口健: 唇画像を用いた母音認識における方向と距離の多用性に対する顔健化, 修士論文, Feb. 2005
吉井和佳: Drum Sound Recognition for Polyphonic Audio Signals by Adaptation of Spectral Templates and Suppression of Harmonic Structure, 修士論文, Feb. 2005
大庭隼人: ロボット動作生成のための RNNPB による物体ダイナミクスの能動知覚, 卒業特別研究報告, Feb. 2005
大谷拓: 人とロボットの協調作業のためのRNNPBによる疑似シンボルの獲得, 卒業特別研究報告, Feb. 2005
海尻聡: ロボットによる周囲状況把握のための雑音下での環境音認識 , 卒業特別研究報告, Feb. 2005
浜辺良二: 音声対話システムにおける音韻的類似表現の混同を防ぐための確認の自動生成, 卒業特別研究報告, Feb. 2005
藤原弘将: 調波構造抽出に基づいた歌声再合成による歌手名の同定, 卒業特別研究報告, Feb. 2005
村瀬昌満: 複数のカルマンフィルタと音響的特徴を用いた複数移動話者の追跡, 卒業特別研究報告, Feb. 2005
査読つきジャーナル論文
Tetsuya Ogata, Shigeki Sugano, and Jun Tani: Acquisition of Motion Primitives of Robot in Human-Navigation Task: Towards Human-Robot Interaction based on "Quasi-Symbol", 人工知能学会論文誌, Vol.20, No.3, pp.188-196. Mar. 2005. オンライン論文誌 doi:10.1527/tjsai.20.188
Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Shun'ichi Yamamoto, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance, 人工知能学会論文誌, Vol.20, No.3, pp.209-219, Mar. 2005. オンライン論文誌 doi:10.1527/tjsai.20.209
秋葉泰弘, 今村賢治, 隅田英一郎, 中岩浩巳, 山本誠一, 奥乃博: 複数の編集距離を用いた口語翻訳文の自動評価. 人工知能学会論文誌, Vol.20, No.3,pp.139-148 (2005). オンライン論文 doi:10.1527/tjsai.20.139
石原一志, 駒谷和範, 尾形哲也, 奥乃博: 環境音を対象とした擬音語自動認識. 人工知能学会論文誌, Vol.20, No.3, pp.229-236, Mar. 2004. オンライン論文誌 doi:10.1527/tjsai.20.229
翠輝久, 駒谷和範, 清田陽司, 河原達也: 音声対話によるソフトウェアサポートタスクのための効果的な確認戦略, 電子情報通信学会論文誌, Vol.88-D2, No.3 (Mar. 2005) 499-508, 電子情報通信学会.
Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: User Modeling in Spoken Dialogue Systems to Generate Flexible Guidance, User Modeling and User-Adapted Interaction, Special Issue on Language-Based Interaction: User Modeling and Adaptation, Vol.15, No.1-2 (2005) pp.169-183, Kluwer. Abstract doi:10.1007/s11257-004-5659-0
Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino: Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots, Speech Communication, Vol.44, Issues 1-4 (Oct. 2004) 97--112, Elsevier. doi:10.1016/j.specom.2004.10.010
Tino Lourens, Hiroshi G. Okuno, Hiroshi Tsujino: A computational model of monkey cortical grating cells. Biological Cybernetics, Vol.92, No.1 (Jan. 2005) 61--70. Springer-Verlag. doi:10.1007/s00422-004-0522-2
Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Effects of increasing modalities in recognizing three simultaneous speeches, Speech Communication, Vol.43, Issue 4, pp.347-359, Sep. 2004. doi:10.1016/j.specom.2004.03.008
Yasuhisa Hayakawa, Tetsuya Ogata, and Shigeki Sugano: Flexible Assembly Work Cooperating System based on Work State Identifications by Self-Organizing Map, IEEE/ASME Transactions on Mechatronics, Vol.9, No.3, accepted, Sept. 2004.
駒谷和範, 上野晋一, 河原達也, 奥乃博: 音声対話システムにおける適応的な応答生成を行うためのユーザモデル, 電子情報通信学会論文誌, Vol.87-D2, No.10 (Oct. 2004) 1921-1928, 電子情報通信学会.
Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid Robot, Applied Intelligence, Vol.20, No.3 (May/June, 2004), 253-266, doi:10.1023/B:APIN.0000021417.62541.e0 (accepted in Oct. 2002), Kluwer Publishers. IF: 1.853
渡邊太郎, 今村, 隅田英一郎, 奥乃博: 階層的句アライメントを用いた統計的機械翻訳, 電子情報通信学会論文誌, Vol.J87-D2, No.4 (Apr. 2004) 978-986, 電子情報通信学会.
章分担・解説論文・翻訳
セップ・リンハルト, 伊東久重, 奥乃博, 後藤靜夫, 帚木蓬生, 宮台真司, 山極寿一: ワークショップ2「こころの病理」, 京都文化会議2004報告集, pp.124-145, Mar. 2005
Kazushi Ishihara, Tomohiro Nakatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Sound-Imitation Word Recognition from Environmental Sounds Focusing on Ambiguity Problem in Determining Phonemes. PRICAI 2004: Trends in Artificial Intelligence, LNAI 3157, pp.909-918, Springer-Verlag, Auckland, Aug. 2004. doi:10.1007/b99563 html
Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: User Modeling in Spoken Dialogue Systems for Flexible Guidance Generation. Post-Proceedings of JSAI, LNAI 3609, in print, Springer-Verlag. doi:10.1007/3-540-45324-5_19
Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani, Kazuhiro Nakadai: Computational Auditory Scene Analysis and Its Application to Robot Audition, Post-Proceedings of the International Conference on Informatics Research for Development of Knowledge Society Infrastructure, pp.73-80, IEEE Computer Society Press, Jun. 2004, doi:10.1109/ICKS.2004.1313411
Kazunori Komatani, Ryosuke Itoh, Tatsuya Kawahara, Hiroshi G. Okuno: Recognition of Emotional States in Spoken Dialogue with a Robot. Innovations in Applied Artificial Intelligence (IEA/AIE-2004), LNAI 3029, 413-423, Springer-Verlag. Ottawa, May. 2004, doi:10.1007/978-3-540-24677-0_43
Tetsuya Ogata, Jun Tani: Open-end Human Robot Interaction from the Dynamical Systems Perspective: Mutual Adaptation and Incremental Learning. Innovations in Applied Artificial Intelligence (IEA/AIE-2004), LNAI 3029, 435-444, Springer-Verlag. Ottawa, May. 2004, Springer-Verlag
奥乃博: Lisp, 人工知能学事典, 共立出版, 2005.
奥乃博: 巻頭言, Webプロ年鑑'04, アルファ企画, 2004.
北原鉄朗訳: デジタル音楽配信のコンテンツ管理, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.1-6
原著: Content management for electronic music distribution. by Franc,ois Pachet, CACM, Vol.46, No.4 (April 2003) 71 - 75.
吉井和佳訳: セイレーンの歌と白鳥の歌音楽のよるデバッグ, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.7-14
原著: Siren songs and swan songs debugging with music. by Paul Vickers, James L. Alty, CACM, Vol.46, No.7 (July 2003) 86-93.
山本俊一訳: デジタル音楽とオンライシェアリング：ソフトウェアの著作権侵害2.0？ CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.15-21
原著: Digital music and online sharing: software piracy 2.0? by Sudip Bhattacharjee, Ram D. Gopal, G. Lawrence Sanders, CACM, Vol.46, No.7 (July 2003) 101 - 111.
櫻庭洋平訳: デジタル音楽に対する代替配信戦略, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.22-29
原著: Alternate distribution strategies for digital music. by G. Prem Premkumar, CACM, Vol.46, No.9 (September 2003) 71 - 75.
小鷹研理訳: MP3オープン標準とインターネット著作権侵害に対する音楽業界の対応, CACM 日本語版, Vol.4, No.2 (Jun. 2004) pp.36-41
原著: The MP3 open standard and the music industry's response to Internet piracy. by Easley, John G. Michel, Sarv Devaraj, CACM, Vol.46, No.11 (November 2003) 71 - 75.
査読つき国際会議論文
Hiroshi G. Okuno: Robot Audition: Its Issues and State of the Art (invited talk), Proceedings of 2nd International Symposium on Life Science, Kyoto, Feb. 2005.
Tetsuya Ogata, Shigeki Sugano, and Jun Tani: Acquisition of Motion Primitives of Robot in Human-Navigation Task: Towards Human-Robot Interaction based on "Quasi-Symbol", Proceedings of 2nd International Workshop on Man-Machine Symbiotic Systems, 315-326, Kyoto, Nov. 2004.
Tsuyoshi Tasaki, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Motion Control using Listener's Back-Channels and Head Gesture Information. Proceedings of 2nd International Workshop on Man-Machine Symbiotic Systems, 327-338, Kyoto, Nov. 2004.
Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Communication of Humanoid Robot with multiple people based on Interaction Distance, Proceedings of 2nd International Workshop on Man-Machine Symbiotic Systems, 385-392, Kyoto, Nov. 2004.
Yuki Suga, Hiroaki ARIE, Tetsuya Ogata, and Shigeki Sugano: Constructivist Approach to Human-Robot Emotional Communication: Design of Evolutionary Function for WAMOEBA-3, Proceedings of IEEE/RAS Interanational Conference on Humanoid Robots (Humanoids 2004), No.76, Los Angels, Nov. 2004.
Yuki Suga, Tetsuya Ogata, and Shigeki Sugano: Development of Emotional Communication Robot, WAMOEBA-3, Proceedings of International Conference on Advanced Mechatronics (ICAM 2004), 413-418, Oct. 2004.
Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: Automatic Drum Sound Description for Real-World Music Using Template Adaptation and Matching Methods Proceedings of 5th International Conference on Musical Information Retrieval (ISMIR-2004), 184-191, Barcelona, Spain, Oct. 2004.
Takuya Yoshioka, Tetsuro Kitahara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Automatic Chord Transcription with Concurrent Recognition of Chord Symbols and Boundaries. Proceedings of 5th International Conference on Musical Information Retrieval (ISMIR-2004), 100-105, Barcelona, Spain, Oct. 2004.
Tsuyoshi Tasaki, Takeshi Yamaguchi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Robot Motion Control using Listener's Back-Channels and Head Gesture Information. Proceedings of 2004 International Conference on Spoken Language Processing (ICSLP-2004), 1033-1036, ASA, ASJ, and ESCA, Korea, Oct. 2004.
Kazushi Ishihara, Yuya Hattori, Tomohiro Nakatani, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Disambiguation in Determining Phonemes of Sound-Imitation Words for Environmental Sound Recognition. Proceedings of 2004 International Conference on Spoken Language Processing (ICSLP-2004), 1485-1488, ASA, ASJ, and ESCA, Korea, Oct. 2004.
Kazuyoshi Yoshii, Masataka Goto, Hiroshi G. Okuno: Drum Sound Identification for Polyphonic Music Using Template Adaptation and Matching Methods Proceedings of ISCA Tutorial and Research Workshop on Statistical and Perceptual Audio Processing (SAPA-2004), accepted, ASA, ASJ, and ESCA, Korea, Oct. 2004.
Shun'ichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G. Okuno: Assessment of General Applicability of Robot Audition System by Recognizing Three Simultaneous Speeches. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.2111-2116, IEEE, RSJ, Sendai, Sep. 2004. IEEE 関西支部学生研究奨励賞 doi:10.1109/IROS.2004.1389721
Tetsuya Ogata, Masaki Matsunaga, Shigeki Sugano, and Jun Tani: Human Robot Collaboration Using Behavioral Primitives, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.1592-1597, IEEE, RSJ, Sendai, Sep. 2004. doi:10.1109/IROS.2004.1389721
Yuki SUGA, Tetsuya Ogata, and Shigeki Sugano: Aquisition of Reactive Motion for Communication Robots Using Interactive EC: Proc. of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2004), accepted, Sept. 2004. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.1198-1203, IEEE, RSJ, Sendai, Sep. 2004. doi:10.1109/IROS.2004.1389721
Yoshihiro Sakamoto, Tetsuya Ogata, and Shigeki Sugano: Human-Robot Communication Using Multiple Recurrent Neural Networks, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004), pp.1574-1579, IEEE, RSJ, Sendai, Sep. 2004.
Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Dynamic Communication of Humanoid Robot with multiple people based on Interaction Distance, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2004), 71-76, IEEE, Kurashiki, Sep. 2004. doi:10.1109/ROMAN.2004.1374732
Yuya Hattori, Kazushi Ishihara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno: Repeat Recognition for Environmental Sounds, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2004), 83-88, IEEE, Kurashiki, Sep. 2004. doi:10.1109/ROMAN.2004.1374734
Yusuke Akiwa, Yuki Suga, Tetsuya Ogata, and Shigeki Sugano: Imitation based Human-Robot Communication: Roles of Joint Attention and Motion Prediction, Proceedings of International Workshop on Robot and Human Interaction (Ro-Man-2004), 283-288, IEEE, Kurashiki, Sep. 2004.
Yasuhiro Akiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Using a Mixture of N Best Lists from Multiple MT Systems in Rank-Sum-Based Confidence Measure for MT Outputs. Proceedings of the 20th International Conference on Computational Linguistics (Coling-2004), 322-328, Geneva, Aug. 2004.
Kazunori Komatani, Teruhisa Misu, Tatsuya Kawahara, Hiroshi G. Okuno: Efficient Confirmation Strategy for Large-scale Text Retrieval Systems with Spoken Dialogue Interface. Proceedings of the 20th International Conference on Computational Linguistics (Coling-2004), 1100-1106, Geneva, Aug. 2004.
Katsuhisa Ishida, Masayuki Takeda, Tetsuro Kitahara: ism: Improvisation Supporting Systems with Melody Correction, Proceedings of the International Symposium on Musical Acoustics (NIME2004), 177-180, Hamamatsu, Jun. 2004.
Yasuhiro Akiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Incremental Methods to Select Test Sentence for Evaluating Translation Ability. Proceedings of the fourth international conference on Language Resources and Evaluation (LREC-2004), pp.2015-2018, Lisbon, Portugal, May 2004.
Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Category-level Identification of Non-registered Musical Instrument Sounds. Proceedings of 2004 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004), Vol.IV, 253-256, Montreal, IEEE, May 2004. doi:10.1109/ICASSP.2004.1326811
Yohei Sakuraba, Tetsuro Kitahara, Hiroshi G. Okuno: Comparing Features for Forming Music Streams in Automatic Music Transcription. Proceedings of 2004 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004), Vol.IV, 273-276, IEEE, Montreal, May 2004.
Shun'ichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Toshio Yokoyama, Hiroshi G. Okuno: Improvement of Robot Audition by Interfacing Sound Source Separation and Automatic Speech Recognition with Missing Feature Theory, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2004), 1517-1523, IEEE, New Orleans, May. 2004. IEEE Robotics and Automation Society Japan Chapter Young Award doi:10.1109/ROBOT.2004.1308039
Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Acoustical-similarity-based Musical Instrument Hierarchy and Its Application to Musical Instrument Identification, Proceedings of the International Symposium on Musical Acoustics (ISMA2004), 297-300, Nara, Apr. 2004.
口頭発表（研究会・全国大会）
奥乃博, 中臺一博: ロボット聴覚の課題と現状 (招待講演), 音響学会春季研究発表会, 3-7-7, pp.633-636, Mar. 2005.
吉岡拓也, 引地孝文, 三好正人, 駒谷和範, 尾形哲也, 奥乃博: 音楽音響信号による室内音場共振周波数のブラインド推定. 音響学会春季研究発表会, 3-6-9, pp.501-502, Mar. 2005.
丹羽治彦, 駒谷和範, 尾形哲也, 奥乃博: 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識, 音響学会春季研究発表会, 3-9-17, pp.969-970, Mar. 2005.
北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 多重奏の音源同定のための混合音からのテンプレート作成法, 情報処理学会第67回全国大会, 3G-4, Mar. 2005. 大会奨励賞 (平成17年5月26日)
吉井和佳, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 調波構造の抑制によるドラムス発音時刻検出の頑健化. 情報処理学会第67回全国大会, 3R-7, Mar. 2005. 学生奨励賞
藤原弘将, 北原鉄朗, 後藤真孝, 駒谷和範, 尾形哲也, 奥乃博: 歌声の調波構造抽出を用いた歌手名の同定. 情報処理学会第67回全国大会, 3R-8, Mar. 2005.
小鷹研理, 駒谷和範, 尾形哲也, 奥乃博: 簡易的インタフェースを用いた仮想空間移動のための歩行感覚の補償. 情報処理学会第67回全国大会, 1Z-8, Mar. 2005. 学生奨励賞, 大会優秀賞 (平成17年5月26日)
石原一志, 服部佑哉, 駒谷和範, 尾形哲也, 奥乃博: 擬音語自動認識に基づいた環境音検索システム. 情報処理学会第67回全国大会, 4R-1, Mar. 2005.
服部佑哉, 小嶋秀樹, 駒谷和範, 尾形哲也, 奥乃博: ドメイン間マッピングによる環境音に呼応したロボット動作生成. 情報処理学会第67回全国大会, 6X-6, Mar. 2005.
山本俊一, Jean-Marc Valin, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: マイクロフォンアレイによるお分離音声認識のてのミッシングフィーチャーマスク自動生成, 情報処理学会第67回全国大会, 4R-4, Mar. 2005.
村瀬昌満, 山本俊一, Jean-Marc Valin, 駒谷和範, 尾形哲也, 奥乃博: カルマンフィルタによる音声の時系列特徴を用いた複数移動話者の追跡. 情報処理学会第67回全国大会, 4R-8, Mar. 2005.
海尻聡, 石原一志, Jean-Marc Valin, 駒谷和範, 尾形哲也, 奥乃博: マイクロフォンアレイを用いて分離した環境音による状況認識. 情報処理学会第67回全国大会, 4R-3, Mar. 2005.
山口健, 駒谷和範, 尾形哲也, 奥乃博: 方向と距離の変化に対してロバストな唇認識, 情報処理学会第67回全国大会, 4R-5, Mar. 2005.
田崎豪, 松本祥平, 大庭隼人, 村瀬昌満, 大谷拓, 駒谷和範, 尾形哲也, 奥乃博: ロボットによる人間親密度の空間マッピングとインタラクションへの適用. 情報処理学会第67回全国大会, 6X-5, Mar. 2005.
松本祥平, 駒谷和範, 尾形哲也, 奥乃博: 音声情報と顔画像情報の統合によるパラ言語レベルの感情認識. 情報処理学会第67回全国大会, 4X-5, Mar. 2005. 学生奨励賞
大谷拓, 駒谷和範, 尾形哲也, 谷淳, 奥乃博: ロボットとの協調作業のためのRNNによる疑似シンボルの獲得. 情報処理学会第67回全国大会, 1M-4, Mar. 2005. 学生奨励賞
大庭隼人, 駒谷和範, 尾形哲也, 谷淳, 奥乃博: RNNによるロボットの物体操作のための物体ダイナミクスの抽出. 情報処理学会第67回全国大会, 2M-2, Mar. 2005. 学生奨励賞
神田直之, 駒谷和範, 尾形哲也, 奥乃博: データベース検索タスクの文脈的制約を用いた音声対話システムの実験的評価. 情報処理学会第67回全国大会, 4R-7, Mar. 2005.
浜辺良二, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける音韻的類似表現の混同を防ぐための確認の生成. 情報処理学会第67回全国大会, 4R-6, Mar. 2005. 学生奨励賞
神田直之, 駒谷和範, 尾形哲也, 奥乃博: データベース検索タスクの文脈的制約を用いた音声対話システムの実験的評価. 音声言語情報処理研究会 2004-SLP-, Vol.2005, No.12, pp.107-112, 情報処理学会, Feb. 2005.
奥乃博: 視聴覚統合による音の認識と生成 (キーノート講演), 第5回システムインテグレーション部門講演会 (SI2004), 1I3-1 (キーノート講演), 計測自動制御学会, Dec. 2004.
山本俊一, 中臺一博, 辻野広司, 奥乃博: ロボット聴覚におけるミッシングフィーチャ理論を応用した音源分離と音声認識の統合, 第5回システムインテグレーション部門講演会 (SI2004), 1I3-2, 計測自動制御学会, Dec. 2004. SI2004ベストセッション講演賞
山本俊一, Jean-Marc Valin, 中臺一博, 奥乃博: ロボットに装着したマイクロフォンアレイによる音源分離とミッシングフィーチャ理論に基づく音声認識, 第20回 AI チャレンジ研究会, SIG-Challenge-0420-5, pp.27--32, 人工知能学会, Dec. 2004.
石田克久, 北原鉄朗, 武田正之: 演奏者に振動で情報提示する鍵盤楽器「ぶるぶるくん」, Proceedings of the 12th Workshop on Interactive Systems and Software (WISS 2004), pp.59-64, Dec. 2004.
翠輝久, 清田陽司, 駒谷和範, 河原達也, 黒橋禎夫, 木戸冬子: 音声版ダイアログナビ：音声対話によるソフトウェアサポート, 音声言語情報処理研究会 2004-SLP-, Vol.2004, No., pp.-, 情報処理学会, Oct. 2004.
田崎豪, 松本祥平, 大庭隼人, 戸田充彦, 駒谷和範, 尾形哲也, 奥乃博: ヒューマノイドロボット SIG2 の近接学に基づく複数の人とのインタラクション, 日本ロボット学会第22回大会, 1E33, Sep. 2004.
松本祥平, 山口健, 駒谷和範, 尾形哲也, 奥乃博: ロボットでの利用を目的とした顔画像情報と音声情報の統合による感情認識, 日本ロボット学会第22回大会, 3D14, Sep. 2004.
尾形哲也, 菅野重樹, 谷淳: 動作プリミティブを介した人間とロボットの協調, 日本ロボット学会第22回大会, 3E11, Sep. 2004.
山本俊一, 中臺一博, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博: ミッシングフィーチャ理論に基づく音源分離と音声認識のインタフェースの評価, 日本ロボット学会第22回大会, 1C33, Sep. 2004.
吉井和佳, 後藤真孝, 奥乃博: 実世界の音楽音響信号に対するドラムスの音源同定手法を利用したドラムイコライズシステムINTER:Dの開発, FIT-2004 「情報科学技術レターズ」, LG-005, Sep. 2004. FIT2004論文賞
神田直之, 駒谷和範, 尾形哲也, 奥乃博: データベース検索タスクにおける文脈的制約を用いた音声対話システム, FIT-2004 「情報科学技術レターズ」, LG-001, Sep. 2004.
山本俊一, 中臺一博, 辻野広司, 奥乃博: ミッシングフィーチャ理論による音源分離と混合音声認識の統合型インターフェース, FIT-2004, G-007, Sep. 2004.
石田克久, 北原鉄朗, 武田正之: 統計モデルに基づく旋律妥当性判定手法を用いた即興演奏支援, 日本音響学会2004年秋季研究発表会講演論文集，2-6-8，pp.783−784, Sep., 2004.
北原鉄朗, 後藤真孝, 奥乃博: 混合音テンプレートを用いた多重奏の音源同定, 音楽情報科学研究会, 2004-MUS-56-9, Vol.2004, No.84, pp.57-64, 情報処理学会, Aug. 2004.
吉井和佳, 後藤真孝, 奥乃博: 単一テンプレート適応法による音楽音響信号を対象としたハイハットシンバルの音源同定, 音楽情報科学研究会, 2004-MUS-56, Vol.2004, No.84, pp.49-56, 情報処理学会, Aug. 2004.
吉岡拓也, 北原鉄朗, 駒谷和範, 尾形哲也, 奥乃博: 和音区間検出と和音名同定の相互依存性を解決する和音認識手法, 音楽情報科学研究会, 2004-MUS-56-6, Vol.2004, No.84, pp.33-40, 情報処理学会, Aug. 2004.
浜中雅俊, 北原鉄朗, 石田克久, 谷井章夫, 竹川佳成, 吉井和佳, 宮下芳明, 上田健太郎* デモンストレーション：若手による研究紹介, 音楽情報科学研究会, 2004-MUS-56, Vol.2004, No.84, pp.27-32, 情報処理学会, Aug. 2004.
小鷹研理, 尾形哲也, 奥乃博: 一次反射音が移動の感覚に与える影響について, 日本認知科学会第21回大会, R-22, Jul. 2004.
翠輝久, 駒谷和範, 清田陽司, 河原達也, 木戸冬子: 音声対話による大規模知識ベース検索システム - 音声版ダイアログナビ -. ヒューマンインタフェース研究会, 2004-HI-109, 音声言語情報処理研究会 2004-SLP-52, Vol.2004, No.74, pp.21-26, 情報処理学会, Jul. 2004.
北原鉄朗, 後藤真孝, 奥乃博: TimbreTree：音色の類似度に基づいた楽器の階層的分類, 日本音響学会音楽音響研究会資料, MA2004-7, Vol.23, No.2, pp.13-18, Jun. 2004.
吉岡拓也, 北原鉄朗, 尾形哲也, 奥乃博: 音楽音響信号を対象とした和音進行の認識, 日本音響学会音楽音響研究会資料, MA2004-8, Vol.23, No.2, pp.19-24, Jun. 2004.
神田直之, 駒谷和範, 尾形哲也, 奥乃博: データベース検索タスクにおける文脈的制約を用いた音声対話システム第41回言語・音声理解と対話処理研究会, 人工知能学会.
山本俊一, 中臺一博, 辻野広司, 奥乃博: ロボット聴覚へのミッシングフィーチャー理論の適用による三話者同時発話認識. 人工知能学会第18回全国大会, 1E2-01, 282-285, Jun. 2004.
山口健, 山本俊一, 駒谷和範, 尾形哲也, 奥乃博: 多方向の唇画像を利用した音声認識. 人工知能学会第18回全国大会, 1E2-02, 279-281, Jun. 2004.
石原一志, 中谷智広, 駒谷和範, 尾形哲也, 奥乃博: 環境音の擬音語変換のための環境音用音素の設計. 人工知能学会第18回全国大会, 1E2-03, 274-277, Jun. 2004.
菅佑樹, 秋和祐介, 尾形哲也, 菅野重樹: Interactive EC を用いた自動自律ロボットの進化に関する基礎研究, 日本機械学会ロボティクス・メカトロニクス講演会, 2PL2-L1-24, Jun. 2004.
菅佑樹, 秋和祐介, 尾形哲也, 菅野重樹: 動作模倣による人間とロボットのインタラクション - 手先軌道データを用いた動作予測システムの構築, 日本機械学会ロボティクス・メカトロニクス講演会, 2A1-H-61, Jun. 2004.
特許
ロボット視聴覚システム, 特許3632099号, 発明者：中臺一博, 奥乃博, 北野宏明, 登録日 2005年1月7日. 発行日 2005年3月23日. 特願2002-365764号, 出願日: 2002年12月17日.
情報処理システムおよび情報処理方法, 並びにプログラム, 発明者: 菅野重樹, 尾形哲也, 金天海, 特願2004-363742号, 15 Dec. 2005.
鍵盤楽器支援装置及び鍵盤楽器支援システム, 特願2004-333279号, 発明者：武田正之, 石田克久, 北原鉄朗, 出願日 2004年11月17日.
ロボット視聴覚システム, 特許3627058号, 発明者：中臺一博, 奥乃博, 北野宏明, 登録日 2004年12月17日. 発行日 2005年3月9日. 特願2002-056670号, 出願日 2002年3月1日.
鳴き声による音声ガイドシステム, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 特許第3590869号, 登録日 2004年9月3日. 発行日 2004年11月17日.
ロボット視聴覚システム, 特開2004-198656号, 発明者：中臺一博, 奥乃博, 北野宏明, 公開日 2004年7月15日. 特願2002-365764号, 出願日 2002年12月17日.
音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム. 発明者：吉井和佳, 奥乃博, 後藤真孝, 特願2004-181881号, 出願日 2004年6月18日, 登録日 2004年6月23日.
音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム. 発明者：吉井和佳, 奥乃博, 後藤真孝, 米国特許出願 11/020, 030, 出願日 2004年12月21日.

2004年度  ２００３年度（奥乃研究室） 2002年度

学位論文

渡邊太郎 : Example-Based Statistical Machine Translation (用例に基づく統計的機械翻訳の研究), 博士論文, Feb. 2004.
北原鉄朗: 音高による音色変化と未知楽器を考慮した楽器音の音源同定の研究, 修士論文, Feb. 2004.
桜庭洋平: 音色・定位・音楽知識を用いた多重奏の自動採譜, 修士論文, Feb. 2004.
戸田充彦: 距離を利用したマルチモーダル情報統合によるヒューマノイドロボットの挙動選択, 修士論文, Feb. 2004.
神田直之: 音声対話システムにおける話題の構造を用いた効率的な対話管理, 卒業特別研究報告, Feb. 2004.
田崎豪: 相槌認識による聞き手の理解状態推定を利用した協調的ロボットヒューマンインタラクション, 卒業特別研究報告, Feb. 2004.
松本祥平: ロボット挙動選択を目的とした顔画像信号と音声信号の感情空間へのマッピング, 卒業特別研究報告, Feb. 2004.
服部佑哉: 環境音の繰返し構造の認識, 卒業特別研究報告, Feb. 2004.
吉岡拓也: 音楽音響信号を対象とする和音進行仮説を用いた和音認識, 卒業特別研究報告, Feb. 2004.
査読つきジャーナル論文
北原鉄朗, 後藤真孝, 奥乃博: 音響的類似性を反映した楽器の階層表現の獲得とそれに基づく未知楽器のカテゴリレベルの音源同定, 情報処理学会論文誌, Vol.45, No.3 (Mar. 2004) pp.680-689, 情報処理学会. DL
石田克久, 北原鉄朗, 武田正之: N-gramによる即興演奏の旋律補正. 情報処理学会論文誌 (テクニカルノート), Vol.45, No.3 (Mar. 2004) pp.743-746, 情報処理学会. 電子図書館
山肩洋子, 河原達也, 奥乃博, 美濃導彦: 音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消. 人工知能学会誌, Vol.19, No.1 F (2004) pp.47-56 . オンライン論文誌 doi:10.1007/s11257-004-5659-0
渡邊太郎, 隅田英一郎, 奥乃博: 生成方向を考慮した統計的機械翻訳のためのデコーディングアルゴリズム, 情報処理学会論文誌, Vol.44, No.12 (Dec. 2003) 3202-3210, 情報処理学会. DL
北原鉄朗, 後藤真孝, 奥乃博: 音高による音色変化に着目した楽器音の音源同定: F0依存多次元正規分布に基づく識別手法. 情報処理学会論文誌, Vol.44, No.10 (Oct. 2003) 2448-2458, 情報処理学会. DL 電気通信普及財団テレコム技術学生賞
中臺一博, 日台健一, 奥乃博, 溝口博, 北野宏明: ヒューマノイドを対象にした視聴覚統合による実時間人物追跡: アクティブオーディションと顔認識の統合. 日本ロボット学会誌, Vol.21, No.5 (Jul. 2003), pp.517--525. , 学会サーバ
駒谷和範, 鹿島博晶田中克明, 河原達也: 複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム 情報処理学会論文誌, Vol.44, No.5 (May 2003) 1333-1342. in html
Hiroshi G. Okuno, Kazuhiro Nakadai, Active audition for humanoid robots that can listen to three simultaneous talkers. Journal of the Acoustical Society of America, Vol.113, No.4, Pt.2 of 2, Apr. 2003, pp.2230. Abstract at ASA.
章分担・解説論文
菅野重樹, 尾形哲也： "情"が作る真のコミュニケーション, 特集「ロボットから人間を読み解く」, 日経サイエンス, , Jan. 2004. アブストラクト
奥乃博, 中臺一博: ロボット聴覚の課題と現状. OA情報処理, Vol.44, No.11 (Nov. 2003) pp.1138-1144, 情報処理学会. Article
Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Pitch-dependent Musical Instrument Identification and Its Application to Musical Sound Ontology. In Chung, P,W.H., Hinde, C. and Ali, M. (Eds.) Developments in Applied Artificial Intelligence (IEA/AIE-2003), LNAI 2718, 112-122, Springer-Verlag. Loughborough, UK, Jun. 2003, doi:10.1007/3-540-45034-3_12
Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Design and Implementation of Personality of Humanoids in Human Humanoid Non-verbal Interaction. In Chung, P,W.H., Hinde, C. and Ali, M. (Eds.) Developments in Applied Artificial Intelligence (IEA/AIE-2003), LNAI 2718, 662-673, Springer-Verlag. Loughborough, UK, Jun. 2003, doi:10.1007/3-540-45034-3_67
Hiroshi G. Okuno, Kazuhiro Nakadai: Real-time Sound Source Localization and Separation based on Active Audio-Visual Integration. In Jose Mira and Jose R. Alvarez (Eds.): Computational Methods in Neural Modeling (IWANN 2003), Part 1, LNCS 2686, 118-125, Springer-Verlag. Ma\'{o}, Menorca,, Spain, June 2003, doi:10.1007/3-540-44868-3_16
奥乃博: 土屋俊編, 『AI事典』, ファイゲンバウム, マッカーシ. 共立出版, 2003.
査読つき国際会議論文
Hiroshi G. Okuno, Tetsuya Ogata, Kazunori Komatani: Computational Auditory Scene Analysis and Its Application to Robot Audition, Proceedings of the International Conference on Informatics Research for Development of Knowledge Society Infrastructure (ICKS 2004), pp.73-80, Mar. 2004, doi:10.1109/ICKS.2004.1313411
Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroaki Kitano: Applying Scattering Theory to Robot Audition System Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2003), 1147-1152, IEEE, Las Vegas, Oct. 2003.
Tetsuya Ogata, Shigeki Sugano, Jun Tani: Interactive Learning in Human-Robot Collaboration, Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2003), 162-167, IEEE, Las Vegas, Oct. 2003.
Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroaki Kitano: Active audition based humanoid system and ist evaluation: Localization, Seperation and Recognition of Simultaneous Speech. Proceedings of IEEE/RSJ International Conference on Humanoids (Humanoids-2003), Springer-Verlag, IEEE, Munchen, Oct. 2003.
Yohei Sakuraba, Hiroshi G. Okuno: Note Recognition of Polyphonic Music by Using Timbre Similarity and Direction Proximity. Proceedings of International Computer Music Conference (ICMC2003), 167-170, Singapore, Oct. 2003.
Yasuhiro AKiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, Hiroshi G. Okuno: Experimental Comparison of MT Evaluation Methods: RED vs. BLEU. Proceedings of MT Summit IX, 1-8, New Orleans, Sep. 2003.
Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Realizing Personality in Audio-Visually Triggered Non-verbal Behaviors. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2003), 392-397, IEEE, Sep. 2003.
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Robot Recognizes Three Simultaneous Speech By Active Audition. Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2003), 398-403, IEEE, Sep. 2003.
Yasuhiro AKiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, and Hiroshi G. Okuno: Experimental Comparison of MT Evaluation Methods: RED vs. BLEU. Proceedings of MT Summit IX, 1-8, New Orleans, Sep. 2003.
Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino: Improvement of Three Simultaneous Speech Recognition by Using AV Integration and Scattering Theory for Humanoid. Proceedings of Audio Visual Spoken Processing (AVSP-2003), 157-162, St. Jorioz, France, Sep. 2003.
Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: User Modeling in Spoken Dialogue Systems for Flexible Guidance Generation. Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), 745-748, Geneva, Sep. 2003.
Kazushi Ishihara, Yasushi Tsubota, Hiroshi G. Okuno: Automatic Transformation of Environmental Sounds into Sound-Imitation Words Based on Japanese Syllable Structure. Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), 3185-3188, Geneva, Sep. 2003.
Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno, Hiroshi Tsujino: Three Simultaneous Speech Recognition by Integration of Active Audition and Face Recognition for Humanoid, Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), 2705-2708, Geneva, Sep. 2003.
Tatsuya Kawahara, Ryosuke Ito, Kazunori Komatani: Spoken Dialogue System for Queries on Appliance Manuals using Hierarchical Confirmation Strategy. Proceedings of the Eighth European Conference on Speech Communication and Technology (Eurospeech-2003), accepted for presentation, Geneva, Sep. 2003.
Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: Flexible Guidance Generation using User Model in Spoken Dialogue Systems, Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics (ACL 2003), pp.256-263, Sapporo, Jul. 2003.
Taro Watanabe, Eiichiro Sumita, and Hiroshi G. Okuno: Chunk-based statistical translation, Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics (ACL 2003), pp.303-310, Sapporo, Jul. 2003.
Yasuhiro AKiba, Eiichiro Sumita, Hiromi Nakaiwa, Seiichi Yamamoto, and Hiroshi G. Okuno: A Statistical-Informmation-Based Selector of the Best among Multiple Outputs, Exhibition Brochure of the 41st Annual Meeting of the ACL (ACL 2003), 16, Sapporo, Jul. 2003.
Yoji Kiyota, Sadao Kurohashi, Teruhisa Misu, Kazunori Komatani, Tatsuya Kawahara, Fuyuko Kido: Dialog Navigator''A Spoken Dialog Q-A System based on Large Text Knowledge Base. ACL03 Interactive Poster/Demo Session, pp.149--152 (Companion Volume), 2003．
Kazunori Komatani, Fumihiro Adachi, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno: Flexible Spoken Dialogue System based on User Models and Dynamic Generation of VoiceXML Scripts. 4th SIGdial Workshop on Discourse and Dialogue, pp.87--96, 2003.
Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Musical Instrument Identification based on F0-dependent Multivariate Normal Distribution. Proceedings of 2003 International Conference on Muotimedia and Expo (ICME 2003), IEEE, Vol.III, pp.405-409, Baltimore, MD, Jul. 2003.
Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno: Musical Instrument Identification based on F0-dependent Multivariate Normal Distribution. Proceedings of 2003 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2003), Vol.5, pp.421--424, IEEE, Hong Kong, Apr. 2003.
口頭発表（研究会・全国大会）
駒谷和範, 翠輝久, 河原達也, 奥乃博: 大規模知識ベースの検索を行う音声対話システムの確認戦略の評価. 言語処理学会第10回年次大会, 87-90, Mar. 2004.
北原鉄朗, 後藤真孝, 奥乃博: 未知楽器のカテゴリーレベルの音源同定, 情報処理学会第66回全国大会, 3ZA-3, Mar. 2004. 学生奨励賞
櫻庭洋平, 尾形哲也, 奥乃博: 自動採譜における音色と定位と音楽知識を統合したパート形成, 情報処理学会第66回全国大会, 3ZA-2, Mar. 2004.
吉井和佳, 後藤真孝, 奥乃博: 音楽音響信号を対象としたドラムスの音源同定におけるテンプレート適応手法, 情報処理学会第66回全国大会, 3ZA-5, Mar. 2004.
吉岡拓也, 吉井和佳, 北原鉄朗, 櫻庭洋平, 尾形哲也, 奥乃博: 音楽音響信号を対象とした和音変化時刻と和音名の同時認識, 情報処理学会第66回全国大会, 3ZA-4, Mar. 2004.
小鷹研理, 尾形哲也, 奥乃博: 反射音が自己運動感覚に与える影響の考察, 情報処理学会第66回全国大会, 3P-8, Mar. 2004.
石原一志, 服部佑哉, 中谷智広, 尾形哲也, 奥乃博: 環境音の擬音語変換における音素決定曖昧性の解消, 情報処理学会第66回全国大会, 3Y-5, Mar. 2004. 学生奨励賞
服部佑哉, 石原一志, 尾形哲也, 奥乃博: 連続環境音の繰り返し構造の認識, 情報処理学会第66回全国大会, 3Y-2, Mar. 2004.
山本俊一, 中臺一博, 辻野広司, 駒谷和範, 尾形哲也, 奥乃博: ミッシングフィーチャ理論による三話者同時発話認識の向上, 情報処理学会第66回全国大会, 3Y-6, Mar. 2004.
戸田充彦, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博: マルチモーダル情報統合によるヒューマノイドロボットの挙動選択, 情報処理学会第66回全国大会, 1X-5, Mar. 2004. 学生奨励賞
山口健, 駒谷和範, 尾形哲也, 奥乃博: 唇情報を利用した混合音声の分離, 情報処理学会第66回全国大会, 1X-7, Mar. 2004.
田崎豪, 山口健, 戸田充彦, 駒谷和範, 尾形哲也, 奥乃博: マルチモーダル情報による相槌の認識とロボット対話への応用, 情報処理学会第66回全国大会, 1X-6, Mar. 2004.
松本祥平, 山口健, 駒谷和範, 尾形哲也, 奥乃博: ロボットの挙動選択のための顔情報と音声情報を統合した感情判別, 情報処理学会第66回全国大会, 1X-8, Mar. 2004.
神田直之, 駒谷和範, 尾形哲也, 奥乃博: 音声対話システムにおける話題の構造を用いた効率的な対話管理, 情報処理学会第66回全国大会, 4T-5, Mar. 2004. 学生奨励賞
石田克久, 北原鉄朗, 武田正之: ism: 即興演奏の不自然な旋律を補正する演奏支援システム, Proceedings of the 11th Workshop on Interactive Systems and Software (WISS 2003), pp.19-24, Dec. 2003.
秋葉泰弘，隅田英一郎，中岩浩巳，山本誠一奥乃博: 試験文数自動削減手法 --- 学習者の翻訳能力評価に向けて, 思考と言語研究会, 2003-TL- , 電子情報通信学会, Dec. 2003.
吉井和佳, 後藤真孝, 奥乃博: テンプレート適応を利用した実世界の音楽音響信号に対するドラムスの音源同定. 音楽情報処理研究会, 2003-MUS-53 情処研報, Vol.2003, No.127, pp.55-60, 情報処理学会, Dec. 2003.
中臺一博, 奥乃博, 辻野広司: ロボットを対象とした散乱理論による三話者同時発話の定位・分離・認識の向上. 第18回 AI チャレンジ研究会, SIG-Challenge-0318-6, pp.33--38, 人工知能学会, Nov. 2003.
石田克久, 北原鉄朗, 武田正之: ism: 即興演奏支援のためのリアルタイム旋律補正システム. 音楽情報処理研究会, 2003-MUS-52-2, Vol.2003, No.111, pp.9-15, 情報処理学会, Nov. 2003.
中臺一博, 松浦大輔, 奥乃博, 辻野広司: 階層的な視聴覚統合と散乱理論を利用したロボットによる三話者同時発話認識の向上. 日本ロボット学会大会, 2K14, Sep. 2003.
戸田充彦, 中臺一博, 宮下敬宏, 奥乃博: ヒューマノイドロボットにおける挙動選択の設計と実装. 日本ロボット学会大会, 3F23, Sep. 2003.
石原一志, 坪田康, 奥乃博: 聴者依存性に着目した環境音の擬音語へのシンボルグランディング日本ソフトウェア科学会第20回大会, Sep. 2003.
駒谷和範, 翠輝久, 河原達也, 奥乃博: ソフトウェアサポートタスクにおける効率的な確認を行うための対話戦略, FIT (情報科学技術フォーラム), LF-2, pp.95--96, 情報処理学会, 電子情報通信学会, Sep. 2003.
後藤真孝, 平田圭司，片寄晴弘，平井重行，浜中雅俊，武田春登，北原鉄朗: パネルディスカッション「音楽情報処理研究者{に，が}望むこと」, 音楽情報科学研究会, 2003-MUS-51, Vol.2003, No.82, pp.25-28, 情報処理学会, Aug. 2003.
櫻庭洋平, 奥乃博: 自動採譜におけるパート形成処理のための特徴量の検討. 音楽情報科学研究会, 2003-MUS-51, Vol.2003, No.82, pp.35-42, 情報処理学会, Aug. 2003.
吉井和佳, 北原鉄朗, 櫻庭洋平, 奥乃博: 自己組織化マップによる教師なしクラスタリングを利用したドラム演奏の自動採譜. 音楽情報科学研究会, 2003-MUS-51, Vol.2003, No.82, pp.43-50, 情報処理学会, Aug. 2003.
北原鉄朗, 後藤真孝, 奥乃博: 音響的類似性に基づく楽器の階層表現の獲得とそれに基づくカテゴリーレベルの楽器音認識の検討. 音楽情報科学研究会, 2003-MUS-51-9, Vol.2003, No.82, pp.51-58, 情報処理学会, Aug. 2003.
駒谷和範, 上野晋一, 河原達也, 奥乃博: ユーザモデルを導入したバス運行情報案内システムの実験的評価. 音声言語処理研究会, 情報処理学会研究会資料, 2003-SLP-47 (12), Vol.2003, No.75, pp.59-64, Jul. 2003. 山下記念研究賞
翠輝久, 駒谷和範, 河原達也, 奥乃博, 木戸冬子: 音声対話によるソフトウェアサポートタスクのための確認戦略. 音声言語処理研究会, 情報処理学会研究会資料, 2003-SLP-47 (11), Vol.2003, No.75, 53-58, Jul. 2003.
上野晋一, 駒谷和範, 河原達也, 奥乃博: 京都市バス運行情報案内システムの試験評価とユーザモデルの導入, 人工知能学会第16回全国大会, Jun. 2003. 優秀論文賞
石原一志, 坪田康, 奥乃博: 日本語の擬音語表現に着目した環境音自動認識, 音声研究会, Jun. 2003.
北出祐, 南條浩輝, 河原達也, 奥乃博: 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出. 音声言語情報処理研究会, 2003-NL-155 (13), 2003-SLP-46 (2) Vol.2003, No.58, pp.7-12, 情報処理学会, May 2003.
山本俊一, 和田俊和, 奥乃博: 色競合における適応的事例収集法, 2003-CVIM, pp.1--6, Vol.2003, No.41, 情報処理学会, May 2003. 電子図書館
山口健, 波部斉, 松山隆司: ドーム型ディスプレイによる全方位ビデオのインタラクティブ表示, 2003-CVIM, 情報処理学会, May 2003.
吉田尚史, 中谷智広, 奥乃博, 三好正人: 調波構造と音源方向に基づく音源分離法における残響耐性の改善, 音声研究会, 応用音響研究会, Apr. 2003.
特許
ロボット視聴覚システム, 特開2003-251583号, 発明者：中臺一博, 奥乃博, 北野宏明, 公開日 2003年9月9日. 特願2002-56670号, 出願日 2002年3月1日.

2003年度  ２００２年度（奥乃研究室） 2001年度

学位論文

天野眞家: Studies on Natural Language Processing for Kana-to-Kanji Conversion and Machine Translation (仮名漢字変換及び機械翻訳のための自然言語処理の研究), 博士論文, Feb. 2003.
駒谷和範: Spoken Dialogue Systems for Information Retrieval with Domain-Independent Dialogue Strategies (ドメイン非依存な対話戦略を備えた情報検索音声対話システム), 博士論文, Oct. 2002.
伊藤亮介: 音声対話における感情の自動判別と会話ロボットへの実装, 修士論文, Feb. 2003.
住吉貴志: 情報検索ＨＴＭＬフォームへの音声入力機能を有するＷｅｂブラウジングシステム, 修士論文, Feb. 2003.
長谷川将宏: 討論・講演音声に対するMPEG-7タグの設計と自動付与, 修士論文, Feb. 2003.
吉田尚史: 調波構造と音源方向に基づく音源分離システムにおける残響耐性の改善, 修士論文, Feb. 2003.
Ian R. Lane: Language Model Switching Based on Topic Detection for Multi-Domain Dialog Speech Recognition (話題同定に基づく言語モデル切替えによる複数ドメインの対話音声認識), 修士論文, Feb. 2003.
秋田祐也: 討論音声を対象とした教師なし話者インデキシングとそれに基づいた自動書き起こし, 修士論文, Aug. 2002.
石原一志: 日本語のモーラ構造に着目した環境音の擬音語への自動変換, 卒業特別研究報告, Feb. 2003.
北出祐: 談話標識と話題語に基づく統計的尺度による講演からの重要文抽出, 卒業特別研究報告, Feb. 2003.
翠輝久: 音声言語による大規模知識ベース検索システムのための対話戦略, 卒業特別研究報告, Feb. 2003.
山本俊一: 実時間人物追跡のための情報統合に基づく肌色の動的学習, 卒業特別研究報告, Feb. 2003.
吉井和佳: 教師なしクラスタリングと認識誤り補正による打楽器演奏の音源同定, 卒業特別研究報告, Feb. 2003.
査読つきジャーナル論文
Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid Robot. Applied Intelligence, Kluwer Publisher, accepted for publication, International Society for Applied Intelligence, 2003. doi:10.1007/3-540-45324-5_19 IF: 1.853
Hiroshi G. Okuno, Kazuhiro Nakadai, Ken'ichi Hidai, Hiroshi Mizoguchi, Hiroaki Kitano: Human-Robot Non-Verbal Interaction Empowered by Real-Time Auditory and Visual Multiple-Talker Tracking Advanced Robotics, Vol.17, Issue 2, pp.115-130, VSP and Robotics Society of Japan, 2003. doi:10.1163/156855303321165088 Online version, IF: 0.510
中臺一博, 奥乃博, 北野宏明: ヒューマノイドロボットを対象としたアクティブオーディション. 人工知能学会誌, Vol.18, No.2 F, pp.103-110 (Mar. 2003). オンライン論文誌 doi:10.1527/tjsai.18.104
駒谷和範, 河原達也: 音声認識結果の信頼度を用いた効率的な確認・誘導を行う対話管理, 情報処理学会論文誌, Vol.43, No.10, pp.3078--3086, 2002. in html
伊藤亮介, 駒谷和範, 河原達也: 機器操作マニュアルの知識と構造を利用した音声対話ヘルプシステム, 情報処理学会論文誌, Vol.43, No.7, pp.2147--2154, 2002. in html
長谷川将宏, 秋田祐哉, 河原達也: 談話標識の抽出に基づいた講演音声の自動インデキシング, 情報処理学会論文誌, Vol.43, No.7, pp.2222-2229, 2002. in html
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time Auditory and Visual Multiple-Speaker Tracking For Human-Robot Interaction. Journal of Robotics and Mechatronics, special issue on Human Robot Interaction, Vol.14, No.5 (2002) 479-489, Mechatronics Society of Japan.
梅澤健太郎, 齊藤孝道, 奥乃博: 権限証明書とSSL相互認証による匿名アクセス制御方式. 情報処理学会論文誌, Vol.43, No.8 (Aug. 2002) 1553-1562. DL
編著・章分担
Yuasa, T. and Okuno, H.G. (Eds.): Advanced Lisp Technology, Advanced Information Processing Technology, Vol.4, Taylor and Francis Publishers, London, UK, May, 2002.
日本認知科学会編: 『認知科学辞典』, 推論・問題解決, コミュニケーションとネットワーク, CHインターフェース. 共立出版, 2002.
Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Realizing Audio-Visually triggered ELIZA-like non-verbal Behaviors. In Ishizuka, M. and Slaney, J. (eds) PRICAI-2002 Topics in Artificial Intelligence, LNAI 2417, 552--562, Springer-Verlag, Tokyo, Aug. 2002. doi:10.1007/3-540-45683-X_59
Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Social Interaction of Humanoid Robot through Auditory and Visual Tracking. In Hendtlass, T., and Ali, M. (Eds.) Developments in Applied Artificial Intelligence (IEA/AIE-2002), Cairns, Australia, June 2002, LNAI 2358, pp.725-735, Springer-Verlag. doi:10.1007/3-540-48035-8_70
査読つき国際会議論文
Takamichi Saito, Toshiyuki Kitoh, Kentaro Umesawa, Hiroshi G. Okuno: Privacy-Enhanced SPKI Access Control on PKIX and Its Application to Web Server. Proc. of the Seventeenth International Conference on Advanced Information Networking and Applications (AINA 2003), 696--703, IEEE, Xi'an, China. Paper. doi:10.1109/AINA.2003.1192970
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Auditory Fovea Based Speech Separation and Its Application to Dialog System. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2002), 1320-1325, IEEE, Geneva, Oct. 2002. doi:10.1109/IRDS.2002.1043937
Yoko Yamakata, Tatsuya Kawahara, Hiroshi G. Okuno: BELIEF NETWORK BASED DISAMBIGUATION OF OBJECT REFERENCE IN SPOKEN DIALOGUE SYSTEM FOR ROBOT. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 170-176, ASA, ASJ, and ESCA, Denver, Sep. 2002.
Yasushi Tsubota, Tatsuya Kawahara, Hiroshi G. Okuno, Masatake Dantsuji: RECOGNITION AND VERIFICATION OF ENGLISH BY JAPANESE STUDENTS FOR COMPUTER-ASSISTED LANGUAGE LEARNING SYSTEM. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 1205-1208, ASA, ASJ, and ESCA, Denver, Sep. 2002.
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: AUDITORY FOVEA BASED SPEECH ENCHANCEMENT AND ITS APPLICATION TO HUMAN-ROBOT DIALOG SYSTEM. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 1817-1820, ASA, ASJ, and ESCA, Denver, Sep. 2002.
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: REAL-TIME SOUND SOURCE LOCALIZATION AND SEPARATION FOR ROBOT AUDITION. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 193-196, ASA, ASJ, and ESCA, Denver, Sep. 2002.
Taro Watanabe, Eiichiro Sumita: Statistical Machine Translation Decoder Base On Phrase. Proceedings of 2002 International Conference on Spoken Language Processing (ICSLP-2002), 1889-1892, Spec3Co2, ASA, ASJ, and ESCA, Denver, Sep. 2002.
Kazunori Komatani, Tatsuya Kawahara, Ryosuke Ito, Hiroshi G. Okuno: Efficient Dialogue Strategy to Find Users' Intended Items from Information Query Results, Proceedings of the Nineteenth International Conference on Computational Linguistics (Coling-2002), Vol.1, pp.481-487, Aug. 2002.
Taro Watanabe, Eiichiro Sumita: Bidirectional Decoding for Statistical Machine Translation. Proceedings of the Nineteenth International Conference on Computational Linguistics (Coling-2002), pp.1079- Aug. 2002.
Yasuhiro Akiba, Taro Watanabe, Eiichiro Sumita: Using Language and Translation Models to Select the Best among Outputs from Multiple MT Systems, Proceedings of the Nineteenth International Conference on Computational Linguistics (Coling-2002), pp. Aug. 2002.
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Exploiting Auditory Fovea in Humanoid-Human Interaction. Proceedings of Eighteenth National Conference on Artificial Intelligence (AAAI-2002), 431-438, AAAI, Edmonton, Aug. 2002. AAAI Contents
Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano: Non-Verbal Eliza-like Human Behaviors in Human-Robot Interaction through Real-Time Auditory and Visual Multiple-Talker Tracking. Proceedings of the Third International Workshop on Cognitive Robotics (CogRob-2002), AAAI, Edmonton, Jul. 2002.
Yoko Yamakata, Tatsuya Kawahara, Hiroshi G. Okuno: Belief Network based Disambiguation of Word Reference in Spoken Dialogue System for Robot. Proceedings of ISCA Tutorial and Research Workshop on Multi-Modal Dialogue in Mobile Environments, Germany, Jun. 2002.
Kazuhiro Nakadai, Ken'ichi Hidai, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time speaker localization and speech separation by Audio-Visual Integration, Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2002), pp.1043-1049, IEEE, May 2002. doi:10.1109/ROBOT.2002.1013493
口頭発表（研究会・全国大会）
奥乃博: 情報家電における混合音認識の重要性: 聖徳太子コンピュータ. 情報処理学会第65回全国大会, 特別講演, Mar. 2003.
北原鉄朗, 後藤真孝, 奥乃博: 音響的類似性に基づく楽器音の階層的クラスタリング, 情報処理学会第65回全国大会, 1P-1, Mar. 2003. 学生奨励賞
櫻庭洋平, 奥乃博: 音色類似度と定位類似度の統合による自動採譜, 情報処理学会第65回全国大会, 1P-2, Mar. 2003. 大会優秀賞
吉井和佳, 北原鉄朗, 櫻庭洋平, 奥乃博: 教師なしクラスタリングと認識誤りパターンを利用した打楽器音の音源同定, 情報処理学会第65回全国大会, 1P-3, Mar. 2003.
石原一志, 坪田康, 奥乃博: 日本語の擬音語表現に着目した環境音自動認識, 情報処理学会第65回全国大会, 4X-5, Mar. 2003. 学生奨励賞
山本俊一, 戸田充彦, 和田俊和, 奥乃博: 実時間人物発見のための視覚と聴覚を統合した肌色の動的学習, 情報処理学会第65回全国大会, 4R-2, Mar. 2003.
戸田充彦, 山本俊一, 中臺一博, 奥乃博: 人間に似た外見を持つロボット Replie における挙動選択システム. 情報処理学会第65回全国大会, 6ZA-1, Mar. 2003.
石田克久, 北原鉄朗, 柳川貴央, 武田正之: 統計的アプローチに基づく即興演奏補正. 情報処理学会第65回全国大会，2P-3, Mar. 2003.
駒谷和範, 上野晋一, 河原達也, 奥乃博: バス運行情報案内システムにおける適応的な対話管理を行うユーザモデルの評価言語処理学会第9回年次大会講演論文集, pp.59-62, 2003.
南條浩輝, 河原達也: 講演音声認識のための話題・話者・発音変動に適応した言語モデル, 日本音響学会研究発表会講演論文集, 3-4-2, 春季 2003.
秋田祐哉, 河原達也: 討論音声認識のための言語モデルと音響モデルの適応の検討, 日本音響学会研究発表会講演論文集, 春季 2003.
長谷川将宏, 河原達也, 奥乃博: 談話標識の抽出に基づいた討論音声へのMPEG-7タグの自動付与. 人工知能学会研究会資料, SIG-SLUD-A203-03, pp.15--20, 人工知能学会, Mar. 2003.
伊藤亮介, 駒谷和範, 河原達也, 奥乃博: ロボットとの音声対話におけるユーザの心的状況の分析. 音声言語情報処理研究会, SLP-45-18, Vol.2003, No.14, pp.107-112, 情報処理学会, Feb. 2003.
住吉貴志, 河原達也, 奥乃博: HTMLのフォーム入力のための文法の自動生成と SALT による実装. 音声言語情報処理研究会, SLP-45-21, Vol.2003, No.14, pp.125-130, 情報処理学会, Feb. 2003.
a鈴木紀章, 中臺一博, 天野英晴, 奥乃博, 北野宏明: 方向通過型音源分離フィルタへのFPGAの応用. 信学技法 VLD/CPSY-25, Vol.102, No.609, pp.79-84, 電気情報通信学会, システムLSI設計技術研究会, Vol.2003, No.7, pp.135-140, Jan. 2003, 情報処理学会.
中臺一博, 奥乃博, 北野宏明: アクティブオーディションに基づくヒューマン・ロボットインタラクション. 第3回システムインテグレーション部門講演会 (SI2002), 3P32-03, 計測自動制御学会, Dec. 2002. SI2002ベストセッション講演賞.
上野晋一, 駒谷和範, 河原達也, 奥乃博: バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成音声言語処理研究会, 情報処理学会研究会資料, SLP-42-2, pp.5-10, 2002.
西田昌史, 秋田祐哉, 河原達也: 討論音声を対象とした話者モデル選択による話者インデキシングと自動書き起こし, 電子情報通信学会技術研究報告, SP2002-157, pp.55-60, Dec. 2002.
中臺一博, 奥乃博, 北野宏明: アクティブオーディションによる複数音源の定位・分離・認識. 第16回 AI チャレンジ研究会, SIG-Challenge-0216-5, pp.25-32, 人工知能学会, Nov. 2002.
中臺一博, 松浦大輔, 奥乃博, 北野宏明: 聴覚中心窩を利用した方向通過型フィルタによる音源・分離, 日本ロボット学会全国大会, 1H18, Oct. 2002.
中臺一博, 松浦大輔, 宮下敬宏, 奥乃博, 北野宏明: ロボット聴覚実現に向けて --- ヒューマノイドロボット SIG2 の開発 ---, 日本ロボット学会全国大会, 1H19, Oct. 2002.
松浦大輔, 中臺一博, 奥乃博, 北野宏明: サポートベクターマシンを用いた話者トラッキング注意制御. 日本ロボット学会全国大会, 1H33, Oct. 2002.
北原鉄朗, 後藤真孝, 奥乃博: 音高の音色変化に着目した音源同定手法. 音響学会秋季研究発表会講演論文集, 1-1-4, pp.643-644, Sep. 2002.
南條浩輝, 河原達也: 講演音声認識における言語モデル適応の検討, 日本音響学会研究発表会講演論文集, 3-Q-16, 秋季 2002.
秋田祐哉, 河原達也: 多数話者との類似度に基づく討論音声の教師なし話者インデキシング日本音響学会研究発表会講演論文集, 3-5-10, 秋季 2002.
山肩洋子, 河原達也, 奥乃博, 美濃導彦: 音声対話におけるオブジェクト同定のための曖昧性の解消. FIT (情報科学技術フォーラム), K-29, 425--426, 情報処理学会, Sep. 2002.
駒谷和範, 上野晋一, 河原達也, 奥乃博: バス運航情報案内システムにおけるユーザモデルを用いた適応的応答の生成. FIT (情報科学技術フォーラム), LF-2, pp.95--96, 情報処理学会, 電子情報通信学会, Sep. 2002. FIT2002ヤングリサーチャー賞
秋田祐哉, 河原達也, 奥乃博: 多数話者音声データベースを用いた討論音声の教師なし話者インデキシング. 音声言語情報処理, 42-9, Vol.2002, No.65, pp.53-58, 情報処理学会, Jul. 2002.
上野晋一, 駒谷和範, 河原達也, 奥乃博: バス運行情報案内システムにおけるユーザモデルを用いた適応的応答の生成. 音声言語情報処理, 42-2, 情報処理学会, Jul. 2002.
北原鉄朗, 後藤真孝, 奥乃博: 楽器音を対象とした音源同定：音高による音色変化を考慮する識別手法の検討. 音楽情報科学研究会, SIG-MUS-46-1, 情処研報, Vol.2002, No.63, pp.1--8, 情報処理学会, Jul. 2002.
櫻庭洋平, 河原達也, 奥乃博: 定位情報と音色情報を用いた複数楽器音の認識, 音楽情報科学研究会, SIG-MUS-46-2, 情処研報, Vol.2002, No.63, pp.9--16, 情報処理学会, Jul. 2002.
山肩洋子, 河原達也, 奥乃博: 視覚情報を話題の対象とする音声対話システム. 人工知能学会研究会資料, SIG-SLUD-A201-03, pp.15--20, 人工知能学会, Jun. 2002. 人工知能学会, 研究会優秀賞
下岡和也, 河原達也, 奥乃博: 講演の書き起こしに対する統計的手法を用いた文体の整形. 自然言語処理 149-12, 音声言語情報処理 41-3, Vol.2002, No.44, pp.17--24, 情報処理学会, May 2002.
南條浩輝, 河原達也: 講演音声認識のための種々の形態素解析及び音響モデルの評価, 話し言葉の科学と工学ワークショップ, pp.47--52, 2002.
南條浩輝, 河原達也, 山田篤, 内元清貴: 講演音声認識のための言語モデルの教師なし適応, 電子情報通信学会技術研究報告，SP2002-152，NLC2002-75，2002. (情報処理学会研究報告 SLP-44-32，2002. )
特許
鳴き声による音声ガイドシステム, 特開2002-304191号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 公開日 2002年9月18日. 特願2001-67846号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特開2002-264058号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 公開日 2002年9月18日. 特願2001-67846号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特開2002-264053号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 公開日 2002年9月18日. 特願2001-67849号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特開2002-264052号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 公開日 2002年9月18日. 特願2001-67848号, 出願日 2001年3月9日.
ロボット視聴覚システム, 特開2002-264051号, 発明者：中臺一博, 日台健一, 奥乃博, 北野宏明, 公開日 2002年9月18日. 特願2001-67847号, 出願日 2001年3月9日.

2002年度  ２００１年度（奥乃研究室） 2000年度

学位論文

安達史博: VoiceXMLの動的生成に基づく自然言語による電話音声対話システム, 修士論文, Feb. 2002.
山肩洋子: ロボットとの音声対話のための信念ネットワークを用いた適応的言語理解, 修士論文, Feb. 2002.
Raux Antoine Roland: Intelligibility Assessment and Adaptive Drill Generation for a Computer-Assisted Pronunciation Learning System (発音学習支援システムのための了解度の評価と適応的なドリル生成), 修士論文, Feb. 2002.
上野晋一: 音声対話システムにおけるユーザモデルを用いた適応的応答の生成, 卒業特別研究報告, Feb. 2002.
櫻庭洋平: 定位情報と音色情報を用いた複数楽器音の認識, 卒業特別研究報告, Feb. 2002.
下岡和也: 講演の書き起こしに対する統計的手法を用いた文体の整形, 卒業特別研究報告, Feb. 2002.
横尾昌弘: 環境音の特徴量抽出と決定木学習による階層的分類, 卒業特別研究報告, Feb. 2002.
査読つきジャーナル論文
Hiroshi G. Okuno, Kazuhiro Nakadai, Lourens, T., Hiroaki Kitano: Sound and Visual Tracking by Active Audition. in Jin, Q., Li, J., Zhang, N., Cheng, J., Yu, C., and Noguchi, N (eds) Enabling Society with Information Technology pp.174-185, Springer-Verlag, 2002.
齊藤孝道, 梅澤健太郎, 奥乃博: プライバシーを重視するアクセス制御システムの一方式. 電子情報通信学会論文誌, Vol.J84-D1, No.11 (Nov. 2001) pp.1553-1562, 電子情報通信学会.
梅澤健太郎, 齊藤孝道, 奥乃博: プライバシーを重視したアクセス制御機構の提案. 情報処理学会論文誌, Vol.42, No.8 (Aug. 2001) pp.2067-2076. DL 電気通信普及財団テレコム技術学生賞
Tatsuya Kawahara, Akinobu Lee, Tetsunori Kobayashi, Koichi Takeda, N. Minematsu, Shigeki Sagayama, Katsuya Itou, A. Ito, M. Yamamoto, A. Yamada, T.Utsuto, Kiyohiro Shikano: Japanese Dictation ToolKit -- 1999 version --, Journal of Acoustic Society of Japan, Vol.57, No.3, pp.210--214, 2001
M. Mimura and Tatsuya Kawahara: Difference of acoustic modeling for read speech and dialogue speech, Acoustical Science & Technology, Vol.22, No.5, pp.373--374, 2001.
章分担・解説論文・翻訳
奥乃博, 中臺一博: ロボットの耳は二つで十分か. 日本音響学会誌, Vol.58, No.3 (Mar. 2002) pp.205-210.
北野宏明監訳: 奥乃博, 諸橋峰雄, 京田耕司, 中臺一博訳: 『PCクラスタ構築法 − Linux クラスタベオウルフ』, 産業図書, 2001.
Hiroshi G. Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid Robot, Engineering of Intelligent Systems: 14th International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems, IEA/AIE-2001, Proceedings, Budapest, Hungary, June 2001. LNAI 2070, 640-650, Springer. The Best Paper Award (1st Place) doi:10.1007/3-540-45517-5
Tino Lourens, Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Detection of Oriented Repetitive Alternating Patterns in Color Images -- A Computational Model of Monkey Grating Cells. Connectionist Models of Neurons, Learning Processes and Artificial Intelligence: Sixth International Work-Conference on Artificial and Natural Neural Networks, IWANN 2001, Proceeding, Part I, Granada, Spain, June 2001. LNCS 2084, 95-107, Springer-Verlag. doi:10.1007/3-540-45720-8_12/
Ian Frank, Kumiko Tanaka, Hiroshi G. Okuno, Jun'ichi Akita, Yukiko Nakagawa, K. Maeda, Kazuhiro Nakadai, Hiroaki Kitano: And The Fans are Going Wild! SIG plus MIKE. RoboCup 2000: Robot Soccer World Cup IV, LNAI 2019, 139-148, Springer-Verlag, May 2001. doi:10.1007/3-540-45324-5_12
Yukiko Nakagawa, Hiroshi G. Okuno, Hiroaki Kitano: Bridging gap between small sized league and simulator league. RoboCup 2000: Robot Soccer World Cup IV, LNAI 2019, 209-218, Springer-Verlag, May 2001. doi:10.1007/3-540-45324-5_19
査読つき国際会議論文
Kazuhiro Nakadai, Ken'ichi Hidai, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time Active Human Tracking by Hierarchical Integration of Audition and Vision. Proceedings of IEEE-RAS International Conference on Humanoid Robots (Humanoids2001), pp.91-98, IEEE, Nov. 2001.
Kazuhiro Nakadai, Tatsuya Matsui, Hiroshi G. Okuno, Hiroaki Kitano: Epipolar Geometry Based Sound Localization and Extraction for Humanoid Audition. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2001), 1395-1401, IEEE and RSJ, Oct. 2001. doi:10.1109/IROS.2001.977176
Hiroshi G. Okuno, Kazuhiro Nakadai, Ken-ichi Hidai, Hiroshi Mizoguchi, Hiroaki Kitano: Human-Robot Interaction Through Real-Time Auditory and Visual Multiple-Talker Tracking Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2001), 1402-1409, IEEE and RSJ, Oct. 2001. Nakamura Award for IROS-2001 Best Paper Nomination Finalist (2nd or 3rd Place) at IROS-2002 doi:10.1109/IROS.2001.977177
Tino Lourens, Hiroshi G. Okuno, Hiroaki Kitano: Automatic Graph Extraction from Color Images. Proc. of 11th International Conference Image Analysis and Processing (ICIAP 2001), pp.302-308, Granada, Spain, June 2001. doi:10.1109/ICIAP.2001.957026
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time Multiple Speaker Tracking by Multi-Modal Integration for Mobile Robots. Proceedings of European Conforence on Speech Processing (Eurospeech 2001), pp.2643-2646, Sep. 2001.
Hiroshi G. Okuno, Kazuhiro Nakadai, T. Lourens, Hiroaki Kitano: Separating Three Simultaneous Speeches with Two Microphones by Integrating Auditory and Visual Processing. Proceedings of European Conforence on Speech Processing (Eurospeech 2001), pp.1193-1196, Sep. 2001.
Akinobu Lee, Tatsuya Kawahara, and Kiyohiro Shikano: Gaussian mixture selection using context-independent HMM, Proc. IEEE-ICASSP, pp.69--72, 2001.
Hiroaki Nanjo, Tatsuya Kawahara: Speaking-Rate Dependent Decoding and Adaptation for Spontaneous Lecture Speech Recognition, Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2002), pp.725--728, 2002.
Kazunori Komatani, K.Tanaka, H.Kashima, and Tatsuya Kawahara: Domain-independent spoken dialogue platform using key-phrase spotting based on combined language model, Proceedings of European Conforence on Speech Processing (Eurospeech 2001), pp.1319--1322, 2001.
Akinobu Lee, Tatsuya Kawahara, and Kiyohiro Shikano: Julius -- an open source real-time large vocabulary recognition engine, Proceedings of European Conforence on Speech Processing (Eurospeech 2001), pp.1691--1694, 2001
Hiroaki Nanjo, Kazuomi Kato, and Tatsuya Kawahara: Speaking rate dependent acoustic modeling for spontaneous lecture speech recognition, Proceedings of European Conforence on Speech Processing (Eurospeech 2001), pp.2531--2534, 2001
Tatsuya Kawahara, Hiroaki Nanjo, and S.Furui: Automatic transcription of spontaneous lecture speech, Proc. IEEE workshop on Automatic Speech Recognition and Understanding, 2001.
Kazuhiro Nakadai, Ken-ichi Hidai, Hiroshi Mizoguchi, Hiroshi G. Okuno, Hiroaki Kitano: Real-Time Auditory and Visual Multiple-Object Tracking for Robots. Proc. of 17th International Joint Conference on Artificial Intelligence (IJCAI-01) , 1425-1432, Seattle, Aug. 2001. 電気通信普及財団テレコム技術賞奨励賞
Takamichi Saito, Kentaro Umesawa, Hiroshi G. Okuno: An Access Control with Handling Private Information Server. Proc. of the First International Workshop on Internet Computing and E-Commerce (ICEC01), IEEE, San Francisco, April 2001.
口頭発表（研究会・全国大会）
柳川貴央, 北原鉄朗, 武田正之: 即興演奏における演奏補正システム情報処理学会第64回全国大会，1L-5, Mar. 2002.
駒谷和範, 伊藤亮介, 河原達也: 情報検索システムにおける検索結果を絞り込むための対話戦略. 言語処理学会第8回年次大会講演論文集, pp.252-255, 2002.
安達史博, 河原達也, 奥乃博, 岡本隆志, 中嶋宏: VoiceXML の動的生成に基づく自然言語音声対話システム, 音声言語情報処理, Vol.2002, No.10, SIG-SLUD-40-23, 情報処理学会, Feb. 2002. 電子図書館
山肩洋子, 河原達也, 奥乃博: 視覚情報を話題の対象とする音声対話システム. 信学技報, NLC2001-62, SP2001-97, pp.81--86, 電子情報通信学会, 音声言語情報処理研究会, Vol.2001, No.123, pp.81-86, 情報処理学会, Dec. 2001.
奥乃博, 中臺一博: ロボット聴覚の課題と現状. 信学技報, NLC2001-60, SP2001-95, pp.69--74, 電子情報通信学会, 音声言語情報処理研究会, Vol.2001, No.123, pp.69-74, 情報処理学会, Dec. 2001.
梅澤健太郎, 齊藤孝道, 武田正之, 奥乃博: SPKI によるプライバシー重視のアクセス制御の PKIX を利用した実現. コンピュータセキュリティシンポジウム (CSS'2001), pp.331--336, 情報処理学会, Nov. 2001.
奥乃博: 感覚と環境. 平成13年度電気関連学会関西支部連合大会予稿集, S50, Nov. 2001.
中臺一博, 日台健一, 奥乃博, 北野宏明: アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG, 知能と複雑系, Vol.2001, No.97, pp.37--42, 情報処理学会, Oct. 2001. 電子図書館
中臺一博, 日台健一, 奥乃博, 北野宏明: 視聴覚のストリームベース統合による実時間人物追跡システム. 日本ロボット学会全国大会, Sep. 2001.
日台健一, 中臺一博, 奥乃博, 北野宏明: ステレオ視による実時間人物追跡システムの高精度化. 日本ロボット学会全国大会, Sep. 2001.
中臺一博, 日台健一, 奥乃博, 北野宏明: 視聴覚情報の階層的統合による実時間アクティブ人物追跡. 第13回 AI チャレンジ研究会, SIG-Challenge-0113-5, pp.35-42, 人工知能学会, Jun. 2001. 人工知能学会, 研究奨励賞
北原鉄朗, 後藤真孝, 奥乃博: 音高による音色変化に着目した音源同定手法. 音楽情報処理研究会, SIG-MUS-40-2, Vol.2001, No.45, pp.7-14, 情報処理学会, May 2001.
南條浩輝, 河原達也, 発話速度に依存したデコーディングと音響モデルの適応, 電子情報通信学会技術研究報告，SP2001-103，NLC2001-68，2001. (情報処理学会研究報告 SLP-39-20，2001. )
河原達也, 加藤一臣, 南條浩輝, 李晃伸: 話し言葉音声認識のための言語モデルとデコーダの改善",
情報処理学会研究報告 SLP-36-3，2001.
南條浩輝, 河原達也: 発話速度に依存した音素・音節モデル化の検討", 話し言葉の科学と工学ワークショップ, pp.93--100, 2001.
南條浩輝, 河原達也: 発話速度を考慮した音響モデルの適応, 日本音響学会研究発表会講演論文集 2-5-9, 春季 2002.
南條浩輝, 河原達也: 発話速度に依存したデコーディングの検討, 日本音響学会研究発表会講演論文集 1-1-6，秋季 2001.
特許
ロボット聴覚装置, 発明者：中臺一博, 奥乃博, 北野宏明, 特許第3277279号, 登録日 2002年2月15日. 発行日 2002年4月22日. 特願平11-341240, 1999年11月30日出願.
音源同定・分離装置及びその方法, 発明者：奥乃博, 中川由紀子, 北野宏明, 特許第3195920号, 登録日 2001年6月1日. 発行日2001年8月6日. 特願平11-165182, 1999年6月11日出願.
ROBOT ACOUSTIC DEVICE AND ROBOT ACOUSTIC SYSTEM, PCT Pub. No: WO 2001/095314, PCT No: PCT/JP2001/004858, Inventors: Nakadai, K., Okuno, H.G., and Kitano, H. PCT Filed: Jun. 8, 2001. PCT Pub. Date: Dec. 13, 2001.

2001年度  ２０００年度以前（音声メディア研究室）

査読つきジャーナル論文

Takahide Hoshide, Masayoshi Nose, Hisazumi Tsuchida, Kisaku Fujimoto, Hiroshi G. Okuno: Adaptive real-time planning for multimedia communication services by multiagent system, Electronics and Communications in Japan (Part I: Communications), Vol.84, No.2 (Feb. 2001) pp.90-98, Weiley. doi:10.1002/1520-6424(200102)84:2<90::AID-ECJA10>3.0.CO;2-C
中谷智広, 奥乃博: 音オントロジーに基づいた音環境理解システムの統合, 人工知能学会誌, Vol.14, No.6 (Nov. 1999) pp.1072--1079.
Hiroshi G. Okuno, Tomohiro Nakatani, Takeshi Kawabata: Listening to two simultaneous speeches, Speech Communication, Vol.27, Issue 3-4 (Apr. 1999) pp.299-310, doi:10.1016/S0167-6393(98)00080-6
Tomohiro Nakatani, Hiroshi G. Okuno: Harmonic Sound Stream Segregation Using Localization and Its Application to Speech Stream Segregation, Speech Communication, Vol.27, Issue 3-4 (Apr. 1999) pp.209-222, doi:10.1016/S0167-6393(98)00079-X
星出高秀, 野瀬昌禎, 土田尚純, 藤本喜作, 奥乃博: マルチエージェントによるマルチメディア通信サービスの適合的プラニング, 電子情報通信学会論文誌, B-I Vol.J81, No.7 (July 1998) pp.440--449.
Hiroshi G. Okuno, Shin-ichi Minato, Hideki Isozaki: On the propertyies of combination set operations, Information Processing Letters, Vol.66, Issue 4 (May 1998) pp.195-199, Elsevier. doi:10.1016/S0020-0190(98)00067-2 cited by Donald E. Knuth: The Art of Computer Programming, Volume 4, Fascicle 1: Bitwise Tricks & Techniques; Binary Decision Diagrams
明石修, 村上健一郎, 天海良治, 奥乃博: NueLinda モデルと自己記述による実装, コンピュータソフトウェア, 日本ソフトウェア科学会, Vol.15, No.1 (Jan. 1998) pp.24--33.
奥乃博, 長尾確, 古関義幸, 安原宏, 吉田健一: 検索機能を内蔵した独立型文献集 --- 10周年記念 CD-ROM 制作の経験 --- 人工知能学会誌, Vol.12, No.6 (Nov. 1997) pp.911--920.
奥乃博, 中谷智広, 川端豪: 音声ストリーム分離法の提案と複数音声の同時認識の予備実験, 情報処理学会論文誌, Vol.38, No. 3 (Mar. 1997) pp.510-523. DL
中谷智広, 後藤真孝, 川端豪, 奥乃博: 残差駆動型アーキテクチャの提案と音響ストリーム分離への応用, 人工知能学会誌, Vol.12, No.1 (Jan. 1997) pp.111--120.
正木寛人, 斎藤逸郎, 石塚満, 奥乃博: 二分決定グラフを用いた三面図の効率的理解, 情報処理学会論文誌, Vol.37, No.11 (Nov. 1996) pp.1969--1979. , DL
奥乃博, 下國治, 田中英彦: 二分決定グラフによる多重文脈型真偽維持システム BMTMS, 人工知能学会誌, Vol.11, No.3 (Mar. 1996) pp. 280--289.
奥乃博, 湊真一: 二分決定グラフによる制約充足問題の解法, 情報処理学会論文誌, Vol.36, No.8 (Aug. 1995) pp. 1789--1799. , DL
中谷智広, 奥乃博, 川端豪: 音環境理解のためのマルチエージェントによる調波構造ストリームの分離, 人工知能学会誌, Vol.10, No.2 (Mar. 1995) pp.232--241.
奥乃博, 湊真一: 二分決定グラフによる制約充足問題の解法, 情報処理学会論文誌, Vol.36, No.8 (Aug. 1995) pp. 1789--1799. , DL
奥乃博: 二分決定グラフによる探索型組合せ問題の解法での組合せ爆発抑制法, 情報処理学会論文誌, Vol.35, No.5 (May 1994) pp.739--753. , DL
Hiroshi G. Okuno: Experience of parallel AI programming with parallel Lisp, Future Generation Computer Systems, Vol.7, Issues 2-3 (April 1992) pp.211-219, doi:10.1016/0167-739X(92)90008-Y
山崎憲一, 奥乃博, 竹内郁雄: TAOにおける論理型プログラミングとその処理方式, 情報処理学会論文誌, Vol.32, No.9 (Sep. 1991) pp.1090-1101. , DL
奥乃博: 網: ATMSの新しい処理系とその共有メモリ型マルチプロセッサ上での並列処理, 人工知能学会誌, Vol.5, No.3 (May 1990) pp.333--342. 1990年度人工知能学会論文賞.
奥乃博, アヌープ・グプタ: 並列Lisp言語QLispによるOPS5の並列処理の記述, 情報処理学会論文誌, Vol.31, No.6 (June 1990) pp.822--831. , DL
Hiroshi G. Okuno, Nobuyasu Osato, Ikuo Takeuchi: Firmware approach to fast Lisp interpreter, SIGMICRO Newsletter, Vol.19, Issue 1-2 (June 1988) pp.5-11, ACM, ACM DL
竹内郁雄, 奥乃博, 大里延康, 山崎憲一: 知能処理用プログラミング言語TAO, 研究実用化報告, Vol.37, No.2 (Feb. 1987) pp.137-143.
杉村利明, 竹内郁雄, 奥乃博, 天海良治: ELISの日本語処理, 研究実用化報告, Vol.37, No.2 (Feb. 1987) pp.145-152. SKKの元になったかな漢字変換システ．
Ikuo Takeuchi, Hiroshi G. Okuno, Nobuyasu Osato: A List Processing Language TAO with Multiple Programming Paradigm, New Generation Computing, Springer, Vol.4, No.4 (1986) pp.401--444. doi:10.1007/BF03037392
Ikuo Takeuchi, Hiroshi G. Okuno, Nobuyasu Osato: TAO: a harmonic mean of Lisp, Prolog and Smalltalk, SIGPLAN Notices, Vol.18, Issue 7 (July 1983) pp.65-74, ACM DL
Ikuo Takeuchi, Hiroshi G. Okuno: A List Processor LIPQ, Review of the ECL, Vol.26, No.5--6 (May--Jun. 1978) pp.767--779.
奥乃博, 竹内郁雄: リストプロセッサLIPQとその処理系, 研究実用化報告, Vol.26, No.10 (Oct. 1977) pp.2889--2908.
Makoto Amamiya, Ikuo Takeuchi, Hiroshi G. Okuno, and Kohei Noshita: A Programming Language FORMAL-2 and Its Implementation, Review of the ECL, Vol.22, No.11--12 (Nov.--Dec., 1974) pp.1084--1096.
雨宮真人, 竹内郁雄, 奥乃博, 野下浩平: プログラミング言語FORMAL-2とその処理系, 研究実用化報告, Vol.22, No.8 (Aug. 1973) pp.2195--2214.
章分担・解説論文・翻訳
北野宏明監訳、奥乃博, 京田耕司, 諸橋峰雄, 中臺一博訳: 『PCクラスタ構築法 − Linux によるベオウルフ・システム』, 産業図書, Mar. 2001.
奥乃博: 聖徳太子をつくる技術：音環境理解: 混合音の認識をめざして, 情報処理, Vol.41, No.10, pp.1096--1101, 情報処理学会, Oct. 2000.
Hiroshi G. Okuno, Koji M. Kyoda, Mineo Morohashi, and Hiroaki Kitano: Initial Assessment of ERATO-1 Beowulf-Class Cluster, Ito, T. and Yuasa, T. (eds.) Parallel and Distributed Computing in Symbolic and Irregular Applications, World Scientific Publishing, 372--383, 2000.
Frank, I., Tanaka-Ishii, K., Hiroshi G. Okuno,Nakagawa, Y., Meada, K., Kazuhiro Nakadai, Hiroaki Kitano: And The Fans are Going Wild! SIG plus MIKE. RoboCup-2000, LNCS 2019, 267--276, Springer-Verlag, Melbourne, Aug. 2000.
Nakagawa, Y., Hiroshi G. Okuno, Hiroaki Kitano: Bridging gap between small sized league and simulator league. RoboCup-2000, LNCS 2019, 1--10, Springer-Verlag Melborne, Aug. 2000.
Kazuhiro Nakadai, Lourens, T., Hiroshi G. Okuno, Hiroaki Kitano: Humanoid Active Audition System Improved by The Cover Acoustics. In Mizoguchi, R. and Slaney, J. (eds) "PRICAI 2000 Topics in Artificial Intelligence" Lecture Notes in Artificial Intelligence 1886, 544--554, Springer-Verlag, Melborne, Aug. 2000. doi:10.1007/3-540-44533-1_55
Hiroshi G. Okuno, Tomohiro Nakatani, Takeshi Kawabata: Cocktail-Party Effect with Computational Auditory Scene AAnalysis -- Preliminary Report -- Advances in Human Factors/Ergonomics, Vol.20, Part2, 1995, pp.503-508, doi:10.1016/S0921-2647(06)80266-2
査読つき国際会議論文
Hiroshi G. Okuno, Kazuhiro Nakadai, T. Lourens, Hiroaki Kitano: Sound and Visual Tracking for Humanoid. Proceedings of 2000 International Conference on Information Society in the 21st Century: Emerging Technologies and New Challenges, Univ. of Aizu, 254--261, Aizu-Wakamatsu, Nov. 2000. Best Paper Award
Kazuhiro Nakadai, Matsui, T., Hiroshi G. Okuno, Hiroaki Kitano: Active Audition System and Humanoid Exterior Design. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2000), IEEE, 1453--1461, Takamatsu, Nov. 2000. doi:10.1109/IROS.2000.893225
Hiroaki Kitano, Hiroshi G. Okuno, Kazuhiro Nakadai, Sabisch, T., and Matsui, T.: Design and Architecture of SIG the Humanoid: An Experiemntal Platformfor Integratind Perception in RoboCup Humanoid Challenge. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2000), IEEE, 181--190, Takamatsu, Nov. 2000. doi:10.1109/IROS.2000.894602
Fermin, I., Ishiguro, H., Hiroshi G. Okuno, Hiroaki Kitano: A Framework for Integrating Sensory Information in a Humanoid Robot. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2000), IEEE, 1748--1753, Takamatsu, Nov. 2000. doi:10.1109/IROS.2000.894602
Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Humanoid Active Audition System. Proceedings of First IEEE-RAS Internationa l Conference on Humanoid Robots (Humanoids2000), Cambridge, Sep. 2000.
T. Lourens, Kazuhiro Nakadai, Hiroshi G. Okuno, Hiroaki Kitano: Selective Attention by Integration of Vision and Audition. Proceedings of First IEEE-RAS Internationa l Conference on Humanoid Robots (Humanoids2000), Cambridge, Sep. 2000.
Kazuhiro Nakadai, T. Lourens, Hiroshi G. Okuno, Hiroaki Kitano: Active Audition for Humanoid. Proceedings of the Seventeenth National Conference on Artificial Intelligence (AAAI-2000), 832--839, AAAI, Austin, Aug. 2000. AAAI Contents
Yukiko Nakagawa, Hiroshi G. Okuno, Hiroaki Kitano: Using Vision to Improve Sound Source Separation, Proceedings of the Sixteenth National Conference on Artificial Intelligence (AAAI-1999), 768--773, AAAI, Orlando, Aug. 1999. AAAI Contents
Tomohiro Nakatani, Hiroshi G. Okuno: Sound Ontology for Computational Auditory Scence Analysis, Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-1998), 1004--1009, AAAI, Madison, Aug. 1998. AAAI Contents
Hiroshi G. Okuno, Tomohiro Nakatani, Takeshi Kawabata: Understanding Three Simultaneous Speeches Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-1997), Vol.1, pp.30--35, IJCAI, Nagoya, Aug. 1997. IJCAI Contents
Hiroshi G. Okuno, Tomohiro Nakatani, Takeshi Kawabata: Interfacing Sound Stream Segregation to Automatic Speech Recognition -- Preliminary Results on Listening to Several Sounds Simultaneously, Proceedings of the Thirteenth National Conference on Artificial Intelligence (AAAI-1996), 1082--1089, AAAI, Portland, Aug. 1996. AAAI Contents
Tomohiro Nakatani, Hiroshi G. Okuno, Takeshi Kawabata: Residue-Driven Architecture for Computational Auditory Scene Analysis Proceedings of the Thirteenth International Joint Conference on Artificial Intelligence (IJCAI-1995), 165--174, IJCAI, Montreal, Aug. 1997. IJCAI Contents
Tomohiro Nakatani, Hiroshi G. Okuno, Takeshi Kawabata: Auditory Stream Segregation in Auditory Scene Analysis with a Multi-Agent System, Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-1994), 1082--1089, AAAI, Seattle, Aug. 1994. AAAI Contents
Saito, T., Umesawa, K., Hiroshi G. Okuno: Privacy Enhanced Access Control by SPKI, Proc. of the Seventh International Conference on Parallel and Distributed Systems: International Workshop on Next-Generation Internet Technologies and Applications 2000 (NGITA00), 301--306, IEEE, Iwate, July. 2000. doi:10.1109/PADSW.2000.884605
Saito, T., Umesawa, K., Hiroshi G. Okuno: Privacy-Enhanced Access Control by SPKI and Its Application to Web Server. Proc. of Ninth IEEE International Workshops on Enabling Technologies: Infrastructure for Collaborative Enterprises, IEEE, 201--206, NIST, Maryland, June 2000. doi:10.1109/ENABL.2000.883729
Hiroaki Kitano, Hiroshi G. Okuno, Kazuhiro Nakadai, Fermin, I., Sabisch, T., Nakagawa, Y., and Matsui, T.: Designing a huymanoid head for RoboCup challenge. Proceedings of the Fourth International Conference on Autonomous Agents (Agents2000), ACM, pp.17--18, Barcelona, June 2000. ACM DL
Tomohiro Nakatani, Masataka Goto, Hiroshi G. Okuno: Localization by harmonic structure and its application to harmonic sound stream segregation, Proceedings of 1996 International Conference on Acoustics, Speech, and Signal Processing (ICASSP-1996), Vol.2, 653-656, ASA, ASJ, and ESCA, Atlanta, doi:10.1109/ICASSP.1996.543205
Hiroshi G. Okuno, Tomohiro Nakatani, Takeshi Kawabata: A new speech enhancement: speech stream segregation, Proceedings of 1996 International Conference on Spoken Language Processing (ICSLP-1996), Vol.4, 2356-2359, ASA, ASJ, and ESCA, Yokohama, doi:10.1109/ICSLP.1996.607281
Tomohiro Nakatani, Takeshi Kawabata, Hiroshi G. Okuno: A Computational Model of Sound Stream Segregation with Multi-Agent Paradigm, Proceedings of 1995 International Conference on Acoustics, Speech and Signal Processing (ICASSP'1995), Vol.4, pp.2671--2674, IEEE, 1995. doi:10.1109/ICASSP.1995.480111
Hiroshi G. Okuno, Anoop Gupta: Parallel execution of OPS5 in QLISP, Proceedings of the Fourth Conference on Artificial Intelligence Applications, pp.268-273, IEEE, 1988. doi:10.1109/CAIA.1988.196114
Hiroshi G. Okuno, Nobuyasu Osato, Ikuo Takeuchi: Firmware approach to fast Lisp interpreter, Proceedings of the 20th Annual Workshop on Microprogramming (MICRO-20), pp.1-11, ACM, Boulder, 1987. ACM DL
Hiroshi G. Okuno, Ikuo Takeuchi, Nobuyasu Osato, Yasushi Hibino, Kazufumi Watanabe: TAO: A fast interpreter-centered system on LISP machine ELIS Proceedings of the 1984 ACM Symposium on LISP and functional programming (LFP'84) Austin, Texas, pp.140-149, 1984. ACM DL
口頭発表（研究会・全国大会）
白松俊, 伊藤誠悟, 橋田浩一, 奥乃博: 単語間二項関係の制約を使用したGDA-UNL変換システム, 自然言語処理研究会, Vol.2001, No.9, pp.21-26, Jan. 2001, 情報処理学会.
梅澤健太郎, 齊藤孝道, 奥乃博: SPKI によるプライバシ保護手法とその株主優待券の電子的実装への応用. コンピュータセキュリティ, Vol.2000, No.68, pp.203--210, 情報処理学会, Jul. 2000. 電子図書館
奥乃博, 京田耕司, 中臺一博, 北野宏明: BeowulfクラスクラスタERATO-1のチューニングとその評価, ハイパーフォーマンスコンピューティング, Vol.2000, No.23, pp.116--124, 情報処理学会, Mar. 2000. 電子図書館

ACM author profile page fun Most Prolific DBLP Authors

Last modified: Sat Aug 17 6:07:00 JST 2015
(C)

All Wrongs Reserved, 2001-2015.

音声メディア研究室 発表論文

[ 2015年度| 2014年度| 2013年度| 2012年度| 2011年度| 2010年度| 2009年度| 2008年度| 2007年度| 2006年度| 2005年度| 2004年度| 2003年度| 2002年度| 2001年度| (2000年度以前)| 受賞| English ]

２０１５年度（音声メディア研究室） 2014年度

2015年度 ２０１４年度（音声メディア研究室） 2013年度

2014年度 ２０１３年度（奥乃・吉井研究室） 2012年度

2013年度 ２０１２年度（奥乃研究室） 2011年度

2012年度 ２０１１年度（奥乃・尾形研究室） 2010年度

2011年度 ２０１０年度（奥乃・尾形研究室） 2009年度

2010年度 ２００９年度（奥乃・尾形研究室） 2008年度

2009年度 ２００８年度（奥乃・尾形研究室） 2007年度

2008年度 ２００７年度（奥乃・尾形研究室） 2006年度

査読なし国際会議論文

2007年度 ２００６年度（奥乃研究室） 2005年度

2006年度 ２００５年度（奥乃研究室） 2004年度

2005年度 ２００４年度（奥乃研究室） 2003年度

2004年度 ２００３年度（奥乃研究室） 2002年度

2003年度 ２００２年度（奥乃研究室） 2001年度

2002年度 ２００１年度（奥乃研究室） 2000年度

2001年度 ２０００年度以前（音声メディア研究室）

音声メディア研究室発表論文

2015年度２０１４年度（音声メディア研究室） 2013年度

2014年度２０１３年度（奥乃・吉井研究室） 2012年度

2013年度２０１２年度（奥乃研究室） 2011年度

2012年度２０１１年度（奥乃・尾形研究室） 2010年度

2011年度２０１０年度（奥乃・尾形研究室） 2009年度

2010年度２００９年度（奥乃・尾形研究室） 2008年度

2009年度２００８年度（奥乃・尾形研究室） 2007年度

2008年度２００７年度（奥乃・尾形研究室） 2006年度

2007年度２００６年度（奥乃研究室） 2005年度

2006年度２００５年度（奥乃研究室） 2004年度

2005年度２００４年度（奥乃研究室） 2003年度

2004年度２００３年度（奥乃研究室） 2002年度

2003年度２００２年度（奥乃研究室） 2001年度

2002年度２００１年度（奥乃研究室） 2000年度

2001年度２０００年度以前（音声メディア研究室）