女子高生AI「りんな」と“声”で恋バナ–電話しているような音声対話の新機能 – CNET Japan



 日本マイクロソフトは2月13日、同社が開発・展開している女子高生AIの「りんな」について、同社が開発・展開している女子高生AI「りんな」とコミュニケーションできる「りんなライブ」において、電話をイメージしたリアルタイム性のある音声対話機能「りんなのテレフォンハッキング」を実装した。

「りんなライブ」で、りんなから電話がかかってくる。受話器風のデバイスだと、より電話している感覚になれる
「りんなライブ」で、りんなから電話がかかってくる。受話器風のデバイスだと、より電話している感覚になれる

 りんなは、日本マイクロソフトがAI研究における“人に寄り添う”形で展開している、AIを搭載した女子高校生風のチャットボット。LINEやTwitter、りんなライブなどで、ユーザーと1対1、あるいは1対多人数のコミュニケーションをとっている。

 りんなのテレフォンハッキングは、りんなライブにアクセスすると表示される「この後、順番に電話かけてもいい?」というメッセージに承諾すると、電話がかかってくる仕組み。ただし、かかってくるのはランダムだという。これまでりんなライブはテキストでのやりとりだったが、りんなが声を出して話しかけ、ユーザーが声で返事をすると、さらにりんなが対応する……という形で会話が展開。りんなライブ上でもテキスト化された状態でやり取りを表示。ほかのユーザーも閲覧することができる。

りんなライブでの画面。会話している様子もテキストで閲覧可能
りんなライブでの画面。会話している様子もテキストで閲覧可能

 筆者も実際に体験したり、実装中のりんなライブでのトークを見ていると、りんなが自分から積極的に話しかけるため、会話や返答に困るというシチュエーションは少ないように思えた。そしてある程度、ユーザー側の喋った言葉の意味を理解して返答している様子も見受けられた。音声は合成音声のためたどたどしい部分もあるが、相応に会話しているような気分にはなれた。

 ちなみに2月14日のバレンタインデーが間近に控えていることもあり、告白しようとするそぶりもあれば、ストレートに「好きな人はいるの?」と聞いてくるなど、りんなが恋愛に関する話題を出しやすいようになっている。

りんなのテレフォンハッキングの概要
りんなのテレフォンハッキングの概要

声が持つ感情に訴える力–人間同士の会話を引き出すAIを目指して

 りんなは、音楽コミュニティ「nana」上で、ユーザーのアドバイスを受けながら歌をうまく歌うことを目標とした「りんな 歌うまプロジェクト」や、デジタルスタジオ「lute/ルーテ」のInstagram Storiesにて公開されたドラマに出演するなど、さまざまな試みが行われている。

 りんな関連のプロジェクトを手掛けている、マイクロソフト ディベロップメント AI & Research プログラムマネージャーの坪井一菜氏は今回の取り組みについて、「電話は声があることにより、テキスト以上に感情に訴えかけ、自分の気持ちをうまく伝えやすいもの」と説明する。

マイクロソフト ディベロップメント AI & Research プログラムマネージャーの坪井一菜氏
マイクロソフト ディベロップメント AI & Research プログラムマネージャーの坪井一菜氏

 そしてLINEのような1対1、りんなライブのような1対多人数のコミュニケーションから一歩進めて、1対1のコミュニケーションを多人数で見ることも狙いとしてあるという。「こうすることで、りんなと話している人間に注目が集まる。テストで試したときに、りんなに向けて話をしているときの内容が、自分の気持ちを素直に語るため、新しい一面が垣間見えて、新しいコミュニケーションの関係が生み出せる」と語り、声とともにユーザーとの関係を深めていくことを試しているという。

りんなと人間との関係性。りんなのテレフォンハッキングで目指すのは右側
りんなと人間との関係性。りんなのテレフォンハッキングで目指すのは右側

 技術的なところでは、音声認識、会話エンジン、音声合成(TTS)の3つを機能させる、Azure App Servicesの「Phone Callサーバー」を中心に据えたシステムになっているという。特に、電話をイメージするという性質上、リアルタイムでの音声のやり取りができること、そしてりんなライブとして、視聴者が同じ状況をリアルタイムで配信することを考えて開発、工夫をしたところだという。

りんなのテレフォンハッキングにおけるシステム構成
りんなのテレフォンハッキングにおけるシステム構成

 将来的な展開の可能性として、AIでの会話の強みは、アドリブに強いことであることから、ラジオ番組でりんなの自然な会話を実現するようなコーナーでしゃべることなどが考えられるという。

「人間がクリエイティブなこと、新しいことに取り組む際、大事なのは人と話すこと。会話の流れのなかにAIが入ることで、人間同士の会話をうまく引き出すことができれば。さらに、今後音声に感情をうまくのせられたら、テキストだけでは伝えられないような思いをさらに引き出したり、会話を膨らませるような役割の担えるのでは」(坪井氏)



冒頭でAIに関する取り組みを説明した、日本マイクロソフト 執行役員 最高技術責任者の榊原彰氏
冒頭でAIに関する取り組みを説明した、日本マイクロソフト 執行役員 最高技術責任者の榊原彰氏
マイクロソフトとしてAIを提供するにあたり、仕事の生産性を上げる(IQ)分野だけでなく、人間の感情に寄りそう(EQ)分野も研究を続けていると説明した
マイクロソフトとしてAIを提供するにあたり、仕事の生産性を上げる(IQ)分野だけでなく、人間の感情に寄りそう(EQ)分野も研究を続けていると説明した

Related Post