ニュース

グーグル、AIが自然な会話を繰り広げる新技術「LaMDA」

 グーグル(Google)は、AIによる会話技術「LaMDA(ラムダ)」を発表した。19日(日本時間)のGoogle I/Oで紹介されたもので、英語による自然な会話のやり取りが披露された。

 これまで音声認識、検索クエリの解析など言語に対する技術を深化させてきた同社が今回発表する「LaMDA」は、「言語は人類の最も偉大なツールの一つであり、コンピュータサイエンスの最も難しいパズルの一つに、『会話』というピースを追加するもの」(同社ブログエントリーより引用)と位置づけられている。

 人と人が会話するとき、たとえばテレビを見ながらの会話では、番組で紹介されている国の話から始まり、その国の料理について話題が映るなど、会話の流れは蛇行するように移り変わっていく。

 こうした会話の流れは、一般的なチャットボットであれば、すぐ会話についていけなくなる、と同社では説明。「Language Model for Dialogue Applications」の略称というLaMDAでは、無限ともいえる数のトピックをキャッチアップして自由に会話できるようにする。

 LaMDAの会話能力は、BERTやGPT-3など、最近の多くの言語モデルと同じく、Google Researchが2017年に開発し、オープンソース化したニューラルネットワークアーキテクチャ「Transformer」をベースに構築されたという。このアーキテクチャーでは、多くの単語を読み、それらの単語が互いにどのように関係しているかに理解し、次に来ると思われる単語を予測するように訓練できるモデルを生み出す。

 この中で、LaMDAは会話を通じて学習を重ねた。その結果、ほかの言語モデルと異なる点として、会話に敏感な反応を示すようになった。

 たとえば誰かが「ギターのレッスンを始めたの」と語ったら、その会話では人であれば「それはすごいね! 私の母はビンテージのマーティンを持っていて、それを弾くのが好きなのよ」と答えるかもしれない。

 スンダー・ピチャイCEOは、「自然言語理解の最新のブレイクスルーであるLaMDAを紹介したい。まだ研究開発の段階だが、社内では、新しいインタラクションを模索している」と紹介。

 たとえば冥王星について、LaMDAと会話しようとすると、その地形や、惑星探査船のニューホライズンズについてやり取りする場面が披露された。しかしこうした会話は事前に準備されたものではなく、LaMDAが、学習データから合成したものだという。自然な会話が生成され、その会話も同じ道筋と二度通ることはなく、何を話しても会話が成立するのがLaMDAの特徴という。

 商用環境での実装は未定だが、Googleアシスタント、検索、Google Workspacesでの会話機能の組込みが想定されている。

 音声による言語だけではなく、画像、動画などさまざまな要素を活用するマルチモーダル・モデルにより、LaMDAの活用例として、たとえばドライブに出かける歳、グーグルのサービスを使ったルート検索で、「美しい景色を目にできるルート」を探してもらうこともできるようになるほか、動画内検索で「夕暮れにライオンが吠えるところを見せて」とリクエストしてその場面にアクセスする、といった使い方が実現する。

 一方、グーグルでは、LaMDAのような技術が、同社のAI原則を遵守しているかどうかが重要とも説明。「偏見を内面化したり、憎悪に満ちた発言を反映したり、誤解を招くような情報を複製したりすることで、その誤用を助長する可能性がある」として、そうしたリスクを最小限に抑えることを最も優先しており、今後の開発に活かす方針が示されている。