コミュニケーションの本質を解明し、機械との対話を工学的に実現
研究室DATA
菊池英明研究室
言語情報科学
Work
知能の本質としての言語
スマートフォンや人間型ロボットに語りかけて、ちぐはぐな返答に笑った経験がおありのことだろう。人と機械との音声対話がうまくいかないのは「コミュニケーションの本質がシステムに反映しきれていない」からだと菊池英明教授は指摘する。
菊池は往年のSF小説名作『アンドロイドは電気羊の夢を見るか?』に魅せられ、人間同様に話し、考え、感情を持つアンドロイドへの夢を膨らませた世代。大学在学中は「第2次AIブーム」の最中(1980年代)で、まだ数少ないAI研究室を探して自然言語処理研究に出会った。
その研究の過程で「人間と他の動物との最大の違いは言語コミュニケーションが可能かどうか。知能の本質は言語だと思い至った」と言い、これほど研究しがいのある対象はないと当初は文法や言語理論の工学的モデル化に取り組んだ。しかし、やがて単純なモデル化では会話に含まれる「豊かさ」が損なわれることに気付いた。
例えば「そうですか」というシンプルな5文字でも、その発語にこめた感情や意図を反映した語気・抑揚などにより、話者は時に100通り以上にも表現を変える。聞く人は、話者の言葉からテキストが含む意味以上のものを印象として理解する。機械にはそれが難しい。
現在普及している音声アシスタントやナビゲーションシステムなどは、人間の手による入力操作を代替しているだけだが、今後実用化が見込まれる介護/接客ロボットなどには人間と同じように対話できるパートナーとしての役割が求められる。そこでは音声発話の背後にある感情や意図を汲み取り、適切な対応ができなければならない。音声言語の豊かな含意を損なわずに、人間と同じような対話を工学的に実現するにはどうすればよいのか。菊池の主な関心はそこにある。
言語科学と情報科学を車の両輪に「言語情報科学」を追求
ITの発展は、対話の生データを大量に収集・蓄積できるインフラ整備につながり、ディープラーニングをはじめとする機械学習の利用も容易にした。これらを言語科学研究に応用し、理論を構築し、かつ検証して研究を深められる環境ができてきた。「情報科学の進歩を言語科学に利用し、言語科学の成果を情報科学に応用できる今なら、サイエンスとエンジニアリングを車の両輪として、言語のメカニズムを解明する『言語情報科学』研究を加速させることができるはず」と菊池は言う。
バラエティに富んだ独自研究テーマに取り組む研究室メンバー
言語情報科学は音声言語の豊かさを反映した広大なスコープを持つ。その多様性を前提に、研究室の約30名の学生はそれぞれ独自のテーマでバラエティに富んだ研究を行っている。
例えば、歌声の美しさ・明るさ・無邪気さ・力強さといった印象の自動評価システムが開発されている。これは印象の評価尺度表現と、収録した歌声の音響特徴量との相関を分析する仕組みだ。同様に音声の背後にある因子と作用を解明しようと「可愛い声が及ぼす生理的反応や行動変化」に科学的アプローチを図る学生もいれば、子どもの発話速度の発達段階を音声学的に明らかにする研究に取り組む学生もいる。またVR技術を利用し、CGのバーチャル面接会場で面接官と対話する面接練習システムや、バーチャルな講演会場で多数の聴衆を前にした講演をトレーニングできるスピーチトレーニングシステムも開発中。「対話にユーモアを盛り込む技術」の開発に取り組む学生は、ユーモア生成のためのニューラルネットのモデル化を進めているところだ。
「この研究室の学術的な使命は、音声言語を収集して活用可能なデータを集積し、分析できる基盤を作ることと、人間と機械のコミュニケーションの仲立ちをするHAI(Human-Agent Interaction)の実現です。一度対話すれば継続したいと思い、明日も対話したいと思うようなロボットや機器の実現に貢献する研究を続けています」と菊池。研究が進めば、やがて人間とロボットが談笑しながら仕事や生活を共にできる社会がやってきそうだ。