アマゾンのAI専門家が語る - 多言語対応技術が具現化するブランドアイデンティティ

Share:
Automotive Alexa Vehicles Alexa Custom Assistant

アマゾンは、自然で豊かな表現力を持つ音声AI対話技術の開発をリードしています。この革新的な技術により、自動車メーカーは自社のブランドらしさを保ちながらも、オフラインでも高品質な対話が可能な音声アシスタントを実現できるようになりました。この技術の特徴は、自社ブランドの個性に合わせて、人間らしい感情表現や特徴を持ち、複数の言語を自然に操る音声AIを生み出せる点にあります。

 

ニキル・シャルマ(Nikhil Sharma):

アマゾンが本社を置く米国のシアトルを拠点とするAI専門家。アマゾンのAGI(汎用人工知能)チームのシニアプロダクトリーダーとして、革新的な音声・音響生成技術の開発に携わっています。アマゾンでの8年以上の経験を持ち、様々な国でAlexaの音声を実現するなど、アマゾンの音声・音響機能の開発で重要な役割を果たしてきました。

 

自動車業界は、クルマをよりスマートで便利なものにすることに注力し続けています。様々な顧客ニーズに応えるため、クルマには高度な技術の搭載が必要になっています。しかし、利便性を高めるための技術が複雑化することで、ドライバーの負担が増す可能性があります。

そこでアマゾンは、ドライバーの利便性を高める手段として音声技術に着目しています。生成AIと大規模言語モデル(LLM)により、直感的でハンズフリーの対話体験が飛躍的に向上しました。さらに、自動車メーカーのブランドらしさを表現する個性や特徴を加えることで、運転する人も同乗する人も、そのクルマならではの体験ができるようになります。

自動車メーカーは自社のブランドの特徴や顧客ニーズを熟知しています。アマゾンは、メーカー独自の音声アシスタント開発に伴う課題—高度なカスタマイズのための投資負担、複雑な開発プロセス、市場投入までの時間—を軽減しつつ、目指す音声体験を実現するためのツールを提供しています。

 

 

Q: 多言語対応技術とは何で、どのようなメリットがありますか?

生成AIとLLMの技術を駆使して、機械に世界のほぼすべての言語を話させることができるようになりました。興味深いことに、この過程は人間が新しい言語を学ぶ方法に似ています。私たち人間がそうであるように、言語によって話し方が異なり、同じ言語でも話者によって表現が変わります。通常、基本的な語彙から始めて文法を学び、徐々に上達していきますが、これには相当な時間がかかります。人間が流暢に話せるようになるまでには平均2〜5年を要します。

そこで私たちのチームは、機械の言語習得を加速させるために多言語対応(ポリグロット)技術を開発しました。この技術は、様々な言語のネイティブデータを活用し、英語の音声AIに新しい言語の文法、構文、慣用句、フレーズを効率的に学習させます。これにより、アラビア語、ヒンディー語、フランス語など、多様な言語をより迅速に習得し、使用することが可能になりました。

最も画期的な点は、LLMが「学習の仕方を学ぶ」能力に優れていることです。AIは人間と異なり、複数の新しい言語を同時並行で学習できるのです。

 

Q: LLMにはどのようなことが期待でき、すでに何が実現されていますか?

LLMを音声生成に応用することで、音声はよりロボット的な印象から解放され、人間らしい豊かな表現が可能になりました。悲しみや共感、喜びや驚き、さらには適度な躊躇いまで、幅広い感情を表現できます。さらに、必要な言語データ量が大幅に削減され、新しい言語への対応も迅速になりました。

例えば、従来の多言語対応技術では、一つの言語につき声優による50〜100時間の録音が必要でしたが、LLMの活用により、その録音時間を約10分の1(言語により異なる)まで短縮できるようになりました。

 

Q:アレクサ・カスタム・アシスタント(ACA)技術も多言語対応技術をベースにしていると発表されましたが、この技術が自動車メーカーにとってどのような意味を持つのでしょうか?

オーナーのクルマへの思い入れは特別なものです。そのため自動車メーカーには、音声を含むクルマのあらゆる要素に、ブランドらしさを込めることが求められます。多言語対応技術の優れた点は、人間に近い自然な対話ができることです。まるで人間が新しい言語を習得するように、AI音声も複数の言語を自然に操りながら、声の個性をしっかりと保持できます。これにより、真の多言語対応が実現し、自動車メーカーは自社ならではの特徴を持つ、人間味のある音声アシスタントを手に入れることができます。

 

Q: 個人的な質問ですが、もし自分の声にどんな才能でも加えられるとしたら何を選びますか?

もちろん本人たちの許可が必要ですが(笑)、ビヨンセやシャキーラのような歌唱力を選びたいですね。彼女たちの素晴らしいリズム感や、聴くだけで踊りたくなるような音楽性には憧れます。私は歌も踊りも苦手なので、その個人的な弱点を補える最高の才能だと思います。

LinkedIn

HAQM Smart VehiclesのLinkedInで最新情報を発信しています。

お問い合わせ

アマゾンの車載用音声AIに関するお問い合わせは、以下からメールを送信してください。

ご提供頂く個人情報は、 HAQM.co.jpプライバシー規約に従い取り扱われます。

おすすめ記事

BMWグループが、アマゾンの車載用音声AI「Alexa Custom Assistant」を搭載する最初のOEMに

アマゾンの車載用音声AI「Alexa Custom Assistant(ACA)」を採用したBMWグループは、新しいBMWの「Intelligent Personal Assistan(IPA)」に最先端の音声操作技術で運転体験を向上させ、自然で滑らかな対話を実現しました。