2012年度
鹿野の定年退職にともない音情報処理学研究室(講座)の最後の年度である。これまで、本学だけでなく、関西を中心とした音声情報処理、音情報処理の多くの人材を育成してきた。音情報処理学講座開設当時の目標であった音声情報処理と音情報処理の融合もほぼ達成できた。博士の修得者が33名、修士の修了生が約200名となった。音情報処理学講座の19年間の活動において、発表論文は、学術論文が約160件、国際会議論文が約460件、その他研究発表が約940件であった。多くのプロジェクトや企業との共同研究を行い、総計10億円に迫る外部資金を獲得してきた。19年間の共同研究の延べ件数は約60件・約1.4億円、受託件数は約70件・約4.9億円、科学研究費は約40件・約1.5億円、奨学寄附金は約60件・約0.6億円であった。
最終年度であるが、博士課程2名、M2が9名、M1が8名在籍している。川波助教が研究代表の文部科学省の基盤研究Cの「機械学習および統計モデルに基づく音声対話システムの応答音声の生成」(2012年度〜2015年度)が採択され、4年間の研究を開始した。また、猿渡准教授が研究代表の「ハンズフリー音声対話システムにおける高次統計量追跡に基づく自律的システム最適化」が、テレコム先端技術研究支援センター研究助成プログラムに採択されました。川波助教が研究代表の「音声対話情報案内システムにおける機械学習理論に基づく自律的精度改善の研究」が、立石科学技術振興財団・研究助成(A)に採択されました。9月に助教の原が岡山大学に移った。
猿渡が高次統計量に基づく信号処理で市橋科学技術賞(功績賞)の受賞が内定した。宮崎(D1)が、エリクソン・ジャパンより第14回 エリクソン・ベスト・スチューデント・アワード、IEEE Signal
Processing Japan ChapterからStudent Paper Award、電気通信普及財団テレコムシステム技術学生賞を受賞した。さらに、宮崎(D1)は日本学術振興会・特別研究員(DC2)への採用も決まった。卒業生の平田将之君が日本音響学会より,第5回学生優秀発表賞を受賞した。さらに、大沼と金原が日本音響学会より,第6回学生優秀発表賞を受賞した。真嶋(M2)が修士のNAISTベストスチューデント賞に選ばれた。サクサシステムエンジニアリング(2012年度)から研究支援を受けた。
戸田助教にIEEE Signal Processing Society Young Author Best Paper Awardが、時系列単位の最尤推定に基づく声質変換に冠する論文で授与された。
今までの研究室の研究成果が、国際的にも高く評価された年度であり、ICASSPでロボット対話、残響下での音声対話システム、声質変換のspecial sessionでの3件の講演が招待された。また、InterSpeechでも、戸田がSilent SpeechのSpecial Sessionで、NAM (Non-Audible Murmurと声質変換)でkeynote speechを行った。一方、学生、スタッフにもいろいろな問題が起こり、教育上の問題を抱えたままの年度であった。
その他、高橋(D3)が、Blind spatial subtraction array に冠するIEEEの論文で、IEEE Signal Processing Society Japan Chapter Student Paper Awardと、NAISTのベストスチューデント賞(博士)を受賞した。土井(M2)と中村(D3)が、食道発声の改善でICASSPでのbest student paper awardを受賞した。稗方(D2)が、実時間ブラインド音源分離装置で日本音響学会技術開発賞を受賞した。猿渡准教授が、電子情報通信学会・基礎・境界ソサイエティにおいて編集活動感謝状を受賞した。鎌土(D1)、鈴木(M2)が「オーディオオブジェクト操作機能を有する圧縮符号化ソフトの開発」により2009年度上期未踏IT人材発掘・育成事業(未踏ユース)に採択されて研究を行った。
総務省の戦略的情報通信研究開発推進制度(SCOPE)に猿渡の「音情景分解に基づく音メディア・ユニバーサル・コミュニケーション・ システムの研究開発」と戸田の「発声障害者補助のための統計的声質変換技術」の研究開発も順調に進んだ。文部科学省のCRESTの研究「マルチモーダルな場の認識に基づくセミナー・会議の多層的支援環境」(京大河原教授)(2009年度〜2014年度)が採択され、分担研究を開始した。研究室の研究を担ってきた3人の博士課程の学生、高橋、大谷、中村と、社会人学生の稗方が、博士の学位を修得した。ロボット対話の研究を行ってきたJani Evenが、ATR知能ロボット研究所に移ることになった。中村は学位を修得し、学振のポスドクになり、4月から1年の予定でドイツのカールスルーエ大の客員研究員として渡欧した。フォスター電機(2009年度〜2012年度)の支援を受けた。
総務省の戦略的情報通信研究開発推進制度(SCOPE)に猿渡の「音情景分解に基づく音メディア・ユニバーサル・コミュニケーション・ システムの研究開発」(2008年度〜2010年度)と戸田の「発声障害者補助のための統計的声質変換技術の研究開発」(2008年度〜2010年度)が採択され、3年間の研究が開始された。文部科学省のリーディングプロジェクトe-Societyのプロジェクト(音声認識、音声合成)の事後評価が行われ、非常に高く評価された。NEDOの高齢者対応コミュニケーションRTシステムの中間評価も行われ、ハンズフリーロボット対話が高く評価された。
戸田助教の音声モーフィングの研究が世界から高く評価され、エリクソン・ヤングサイエンティスト・アワード、日本音響学会の独創研究奨励賞板倉記念、粟屋潔学術奨励賞が授与された。実時間音源分離技術でも電気通信普及財団テレコムシステム技術賞が授与された。宮部(PD: ジョージアテック大)が音場制御の研究発表で電気関連学会関西支部連合大会奨励賞を、高藤(M2)が両耳補聴器の研究発表で音響学会関西支部若手奨励賞を、Jani Even(PD)がロボット内部雑音のブラインド分離で音響学会のポスター賞を受賞した。上村(M)が修士のNAISTベストスチューデント賞に選ばれた。12月には、第28回の関西合同音声ゼミを開催した。BSSの研究で、ホシデン(2008年度〜2009年度)、三洋半導体(2008年度)の支援を受けた。M2の研究面での活躍は目覚しく、多チャンネル雑音抑圧、統計的音声モーフィング、音声検索、音場符号化などで研究が大いに進展した。
文部科学省のリーディングプロジェクトe-Societyが音声対話システム、ブラインド音源分離、非可聴つぶやき、音声モーフィングなど多くの成果を生み出して成功裏に終了した。このプロジェクトの成果をもとに、音声によるユニバーサルコミュニケーションの研究を発展させて行く。騒音下でのロボットとのハンズフリー音声対話システムの構築を世界に先駆けて構築した。研究室の音声認識技術、ブラインド音源分離のBSSAとを融合した成果であり、10人以上の学生とスタッフがシステム構築に貢献した。SIMO-ICAがブラインド音源分離の世界コンテストの非線形部門のトップになり、表彰を受け、猿渡准教授が招待講演を行った。戸田助教が電子情報通信学会の情報システムソサイエティ論文賞を音声合成の研究で名工大との共同研究で受賞した。学生の受賞も多く、高橋(D1)がBSSAで人工知能学会研究会優秀賞を、中村(D1)が発話障害者補助で音響学会関西支部若手奨励賞と電気関連学会関西支部連合大会奨励賞を受賞した。橘がNCSP'08国際会議で優秀学生論文賞を受賞した。文部科学省の基盤研究Aの「音声によるユニバーサルコミュニケーションの研究」(2007年度〜2010年度)が採択され、4年間の研究を開始した。信号処理の分野で、パナソニック(2007年度〜2011年度)、ヤマハ(2007年度〜2012年度)、ソニー(2007年度〜2009年度)との共同研究が開始された。
大迫(M)が修士のNAISTベストスチューデント賞を、Cincarek Tobiasが博士のNAISTベストスチューデント賞を授賞した。Cincarekは、修了生を代表して答辞を述べた。宮部は9月に学位を修得し、学振のポスドクになり、2月から1年の予定で米国のジョージアテック大の客員研究員として渡米した。戸田助教は、3月から6ヶ月の予定で、客員研究員として英国のケンブリッジ大に滞在している。鹿野は、日本音響学会関西支部長を務めた。
SIMO-ICAのDSP実装がさらに進展して、商品レベルに到達した。残響の復元で猿渡、山丈、鹿野などが今年度も電子情報通信学会から論文賞を受賞した。実時間BSSは、ロボットの国際会議(IROS)でも高く評価され、論文賞を受賞した。NAMによる個人認証の研究も進展して、小島(M)が、暗号と情報セキュリティシンポジウム SCIS2006論文賞を受賞した。高橋(M)も新しい音声認識向けBSSであるBSSAで、日本音響学会関西支部若手奨励賞を受賞した。李(元助手、現、名古屋工業大学助教授)が、たけまるくんの音声情報案内システムの開発と運用で、情報処理学会 山下記念研究賞を受賞した。音声モーフィングの研究も飛躍的に進展し、戸田助手が、IEEEのSP SocietyのMember of Speech Technical Committeeに選出された。戸田は、音声モーフィングの研究で、科学研究費若手研究(A) (2006年度〜2008年度)とIPAの未踏ソフトウェア創造事業に採択された。鹿野が、IEEEのFellowに選出された。中村(M)が修士のNAISTベストスチューデント賞を授賞し、修士の総代で学位記を受け取った。日立中央研究所とJuliusによる大語彙連続音声認識のSH-4およびSH-4Aへの実時間処理の実装を行った。M2の研究面で進展は目覚しいものがあり、NAMの個人認証、BSSによる音場符号化、NAMと音声モーフィングによる発話障害者補助などの新たな研究分野を切り開いた。修士課程の学生の頑張りが目立った年度であった。NEDOの高齢者ロボットコミュニケーションのプロジェクト(2006年度〜2008年度)が始まった。NEC(2006年度〜2008年度)、メガチップス(2006年度)の支援を受けた。
神戸製鋼との共同のSIMO-ICAのDSP実装が進展し、NHKニュースなどマスコミで多く取り上げられた。戸田が助手として着任し、音声モーフィングの研究が飛躍的に進展した。ATRとの総務省のSCOPEの研究「発話障害者補助」(2005年度〜2007年度)が採択され開始された。科研の萌芽研究としてNAMによる個人認証の研究(2005年度〜2006年度)が採択され、統計数理研究所の松井教授との共同研究を開始した。リィーディングプロジェクトのe-Societyの中間評価が行われ、高く評価された。近鉄学研北生駒駅に音声情報案内システムとロボット案内システム「キタちゃん」を設置した。KDDIとの共同研究(2005年度〜2006年度)を開始した。論文発表や報道発表が非常に多い活発な研究活動が行われた年度であった。非可聴つぶやき声の認識で、卒業生の中島、鹿野が最優秀論文賞「猪瀬賞」を授与された。高谷は、音響学会から独創研究奨励賞板倉記念を授与された。高谷は、ベストスチューデント賞(博士)も授賞した。森はNAISTベストスチューデント賞(修士)を授賞した。
SIMOモデルによる音源分離(BSS)のオンライン化、音声モーフィング技術による 無音声電話の可能性、たけまるモデルによる音声対話システムの普及などで大いに 研究が進展した。文部科学省のe-Society基盤ソフトェアの総合開発の一環としての「音声認識・合成」の研究 も順調に進展した。トヨタ自動車とのロボット音声対話システムの共同研究(2004年度〜2012年度)を開始した。 NAMの研究や音声対話システムの報道発表が10数件に及んだ。NAIST COEフェスティバルを開催し、 ミュンヘン工科大学からGerhard Rigoll教授を招聘した。4人が博士号を取得して、これまでの博士取得者が 20人になった。鹿野が電子情報通信学会のフェローに認証された。西川(D)がブライド音源分離で C&C若手優秀論文賞と船井情報科学奨励賞を受賞した。西川(D)は、博士のNAISTベストスチューデント賞も授賞した。 鵜飼(M)は修士のNAISTベストスチューデント賞を授賞した。中島(D)が情報科学研究科修了生を代表して 答辞を述べた。7月には、第19回の関西合同音声ゼミを開催した。李が名古屋工業大学へ助教授として転出した。
音源分離(BSS)、音声対話システム、無音声認識などで研究がさらに進展した。 鹿野が文部科学省のリーディングプロジェクトのe-Society基盤ソフトェアの総合開発の 一環として「音声認識・合成」の研究(約1億円x5年) (2003年度〜2006年度)を5年間の予定で開始した。 メンバーは、本学、京大、名古屋大学、和歌山大学、名工大、日立中央研究所、旭化成情報研究所、オムロンであった。また、科研基盤(B)の二つの申請「人にやさしい音声認識」(2003年度〜2007年度)と「音響拡張現実感」 (2003年度〜2006年度)の研究も開始された。 神戸製鋼と実時間BSSの共同研究(2003年度〜2006年度)を開始した。21世紀COEのポスドクとして、Panikos Helacleousが着任し、無音声認識の研究を強化した。 NAIST COEシンポジュームを開催し、ブラジルから博士課程の卒業生のAlexandre Girardi博士を招聘した。 COEプログラムの一環として言語科学講座の真下(D)がCMUで滞在研究を、戸田(PD)がCMUに学振のポスドクとして滞在した。 東京で研究室10周年記念の同窓会を開催し、多くの修了生が集まり、旧交をあたためた。 西村(D)が音声対話システム「たけまるくん」で、情報処理学会全国大会奨励賞を授賞した。 西村(D)は博士のNAISTベストスチューデント賞も授賞した。 鹿野が情報処理学会のフェローに認証された。 また、猿渡、西川(D)、雛元(M卒)が、音源分離の研究で、テレコム技術賞(電気通信普及財団)をNTTと共同授賞した。西川(D)はテレコム技術学生賞も授賞した。さらに、言語科学講座の中島(D)が、無音声認識で音響学会ポスター賞を授賞した。
音源分離(BSS)、音声対話システムなどで、大きく研究が進展した。BSSではSIMOモデルのアルゴリズムが見出された。音声対話では、生駒市の北コミュニティセンターの音声情報案内システム「たけまる」を設置して、実データの収録、実環境実験が可能になった。言語科学講座の中島が無音声認識、無音声電話の可能性を見出した。鹿野は文部科学省の21世紀COEプログラム(2002年度〜2006年度)の中核メンバーとなり、COEの採択および推移に大いに貢献した。NAIST COEシンポジュームを開催し、CMUからRichard Stern教授、Alex Waibel教授を招聘した。戸田(D)が、声質変換でテレコム技術学生賞(電気通信普及財団)を、言語科学講座の中島(M)が、無音声認識ISDI学生論文大賞(電通国際情報サービス)を授賞した。非常に忙しい一年であったが、この年も今後の研究の大きな基盤が築けた年であった。 日立(2002年度〜2007年度)、旭化成(2002年度〜2007年度)、生駒市(2002年度〜2008年度)、PtoP(2002年度)、熊本ソフトウェア(2002年度)の支援を受けた。
川波が助手として着任した.IPAの成果の一つとしてCD-ROMつきの「音声認識システム」の教科書を出版した.猿渡助教授が電子情報通信学会の論文賞を受賞した.音源分離関連で,分離ひずみが極めて小さいSIMO-ICAアルゴリズムが見出し、NTT-CS基礎研との共同研究(2001年度〜2003年度)を開始した。また、ロボティクス講座とロボット対話の研究を開始し、ロボット対話システムASKAを構築し、デモを行った。日産自動車(2001年度〜2004年度)、松下電工(2001年度〜2004年度)の支援を受けた。博士の取得者が11名になった.神沼がVR学会の論文賞を受賞した.李助手が音響学会の粟屋学術奨励賞を受賞した。33件の国際会議の発表を行い,多くの学生が海外出張した.猿渡助教授がベストティーチング賞を,西浦(D)が博士の,西川(M)が修士のベストスチューデント賞を受賞した.また,永田(M)が総代で修了証書を受け取った。今後の研究の大きな基盤が築けた年であった。
猿渡が助教授として,李が助手として着任した。10月に陸がATRに研究員として転出した。音源分離の研究を開始した。NEDOの「高齢者音声認識」(2000年度)のプロジェクトを,高山サイエンスのラボを設置して行った.収録した高齢者音声データベース(S-JNAS)を公開した。IPAのプロジェクトを引き継ぐ情処の連続音声認識コンソーシアム(2000年度〜2002年度)を立ち上げ、情報処理学会音声言語研究会(SLP)の特別幹事(2000年度〜2002年度)を務めた。Campbell客員教授のCRESTの「音声表情」(2000年度〜2004年度)と木戸出教授の「ウェアラブル」(2000年度〜2005年度)のプロジェクトの分担が始まった。IPAの「擬人化エージェント」のプロジェクトも開始された.研究成果のまとめも行い,20件の学術論文と25件の国際会議の発表を行った。学生もスタッフもATRの中村もよく働いた。この年からベストスチューデント賞とNAISTベストティーチング賞がはじまり、猿渡助教授がベストティーチング賞を,戸田が修士のベストスチューデント賞を受賞した。松下電産(2000年度〜2004年度)の支援を受けた。この年から、修士課程の学生も雇用して、研究の対価を支払うことにした。12月には、第12回の関西合同音声ゼミを開催した。
中村助教授(2000年度から猿渡)の科研基盤(B)「ハンズフリー音声認識」(99年度〜2002年度)の研究が開始された。ハーネス研究所 (99年度〜2000年度)アドバンスドメディア(99年度)の支援を受けた。中村がATRに室長として転出した。 IPAの「日本語ディクテーション」のプロジェクトが成功裏に終了し、京都大学の河原教授、李(D2)が開発した 大語彙連続音声認識プログラムJulius,Julianがフリーソフトェアとして、 広く利用されるようになった。JNAS、Juliusが日本の音声研究の標準として利用されるようになった。
学術論文,国際会議などの発表も増え,研究活動が活発化した。修士からの学生3名が学位を取得した。伊勢が音場再現原理で音響学会の佐藤論文賞を受賞した。伊勢が京都大学に助教授として転出した。マルチモーダル実験設備を拡張した。 研究ポテンシャルが向上し、9件の学術論文、18件の国際会議発表ができた。科研基盤(C)「日本語音声ディクテーションシステムの環境への適応化アルゴリズムの研究および評価」(98年度〜2001年度)、オムロン(98年度〜2005年度)、神戸製鋼(98年度)の支援を受けた。
研究が本格化し,鹿野を代表としたJNASの大学のメンバーを中心としたIPAの「日本語ディクテーション」(5千万円x3年)(96年度〜99年度),CRESTの和歌山大学河原教授の聴覚脳のプロジェクト(97年度〜2002年度)の分担が開始された。中村助教授のRWCPの音響データベース(97年度〜2000年度)の活動と支援、NTT(97年度)の支援を受けた。IPA、CRESTの大型プロジェクトによって、研究室の財政基盤が確立した年度であった。助手の陸が着任した。11月には、第6回の関西合同音声ゼミを開催した。2名の博士(社会人)が誕生した.音情報処理の授業内容を教科書「音声・音情報のディジタル信号処理」を出版した。
4名の博士課程の学生が入学してきた.多チャンネルの音場再現実験システムを導入した.8月には、JNASのWGによる音声認識基本技術講習会を会津大学で開催した。以後、現在まで、名前と主催者を変えながら継続されている。研究室の成果が,論文として掲載された.音声認識、音声合成の研究に加えて、 ハンズフリー音声認識、音場制御の研究が本格的に立ち上がった。科研基盤(C)「日本語音声ディクテーションシステム」(96年度〜97年度)、NTTアドバンスドテクノロジー(96年度)、ブラザー工業(96年度)の支援を受けた。
奈良での研究成果が研究会,全国大会などで発表できるようになった.10人の修士課程と2人の社会人博士課程の学生が入学してきた.音場再現実験などに利用できる音響実験室 の多チャンネルAD/DAシステムの整備を行なった。11月に、鹿野は情報処理学会音声言語情報処理研究会(SLP)に、大語彙連続音声認識データベースWGを立ち上げ、19大学、20企業の協力により、新聞読み上げ大規模音声データベース(JNAS)の作成を開始した。7月には、第1回の関西合同音声ゼミを開催した。以後、現在まで年2回のペースで継続されている。文部省総合研究(A) 「音の知覚」(95年度〜96年度)の分担、ATR、NTT、音響測器、松下電産(95年度)、NEC(94年度〜2000年度)、NTTデータ(95年度〜97年度)の支援を受けた。
鹿野,中村,伊勢の3名が,他の講座より1年遅れて4月に着任した.幸いやる気に満ちた10名の学生が講座を希望してくれて,研究活動を開始した.支援財団,ATR(94年度〜98年度)、NTT(94年度〜95年度)、音響測器(94年度〜96年度)、旭化成(94年度)、文部省重点領域「音声言語」(94年度〜95年度)などの支援にも助けられた.夏には、M1学生の企業へのインターンシップを行った。以後、講座では、夏のM1の外部でのインターンシップを続けている。
(文責 鹿野)