network
リポビタンD TREND NET

今、知っておくべき注目のトレンドを、ネットメディアを発信する内側の人物、現代の情報のプロフェッショナルたちが日替わりで解説します。

24.08.07

自然な会話ができる『チャットGPT』の音声機能 注目すべきポイントは?

null

ネットニュースの内側にいるプロフェッショナルがニュースを読み解きます。
本日は、情報社会学がご専門の城西大学助教、塚越健司さんです。
今朝、取り上げるテーマはこちら!


【自然な会話ができる『チャットGPT』の音声機能 注目すべきポイントは?】

ユージ:オープンAIは先月30日、対話型AI「チャットGPT」に人と近い反応速度で会話ができる音声機能を追加したと発表しました。6月下旬の提供開始を予定していたのですが、安全性を高めるために1か月遅らせたということです。塚越さん、先週、提供が始まったそうですが、この音声機能について教えてください。


塚越さん:まずオープンAIは今年5月に、最新の「GPT-4o」というモデルを発表しました。これは「マルチモーダルAIモデル」といって、テキストや音声、画像といった様々な形式を組み合わせることができるものです。例えば写真を送ることで、そこに写っている人を判断することができます。他にも「写真の構図のアドバイスをください」と言うと、写真の撮り方と詳しく教えてくれます。今回はこのGPT-4oに「高度なボイスモード」のα版の提供を開始するということです。すでにチャットGPTとの音声会話はできるのですが、今回のボイスモードは、AIがユーザーの感情や声のトーンを理解して反応できるので、会話が早いだけでなく、より自然でリアルタイムな会話が可能になります。さらにリクエストすれば、キャラクターを演じ分けて話すこともできるということです。非常に高度です。この発表が注目されているのは、これがオープンAIが開発を進めているとされる、新世代の音声アシスタントを象徴するものだからです。Siriやアレクサなど、スマホやスマートスピーカーで会話ができる機能がありますが、実際はあまり使えていませんよね?


ユージ:頻度は多くないかな。


塚越さん:そうですよね。人間との会話でスピード的に違和感がなく、内容もすごいものが登場するとなれば、音声AI業界的には注目せざるを得ないものかなと思います。


ユージ:タイムラグでも結構メリットだと思います。


塚越さん:そう。全然それでも質問できます。


ユージ:質問してから間が空くだけで、嫌になります。


塚越さん:ですよね。これがないだけで素晴らしいです。ただ発表したとはいえ、まだα版=要するに試験的な段階であって、このモードが使えるのは一部の有料ユーザーに限定されます。私もまだ使えていませんが、秋にはすべての有料ユーザーが使えるようになる予定です。


吉田:この音声機能。提供開始が遅れた理由は何でしょうか?


塚越さん:もともとは6月下旬に提供予定でしたが、基準に達していないと判断され、およそ1か月遅れての発表となりました。例えば、オープンAIは、音声を使ったAIの回答に有害な内容が含まれていないかどうかについて、こういったものを調べるために100人以上の外部協力者と共に45の言語について検証したり、あるいは暴力的な内容だったり、著作権侵害の可能性がある要求を拒む仕組みを音声機能に加えたとも説明しています。というのも、AIの合成音声は、やはり他人の声を合成したり他人のフリをする「フェイク音声」が問題となっています。例えば、今年1月には、アメリカのニュー・ハンプシャー州の多数の家に、バイデン大統領の声を合成したフェイク音声で、予備選挙に投票しないように呼びかける電話がかかってきました。他にも、合成音声の詐欺電話なども問題になっています。オープンAIは、最初から4つの音声を用意して、それ以外の声にはできないようにして対策しています。全くもって他の人と同じ音声にしないようにしています。声マネはしても全く違う音声にしないとのことです。ただオープンAIにも問題はあります。今年の5月、チャットGPTの音声の1つが俳優のスカーレット・ヨハンソンの声に似ているとして、ヨハンソン自身が不快感を示したことがありました。それがあって、すぐにこの音声は使えないようになりました。そういう問題もありました。


ユージ:この音声機能。今後は、できることが増える可能性があるようですね?


塚越さん:オープンAIは5月にデモンストレーションを行っていますが、そこでは社員がスマホのカメラを紙に向けて、そこに書いてある数式を一緒に解いて欲しいと頼んでいます。またコンピュータの画面を共有して、プログラムをみせて問題解決の支援を頼むものもあります。現地点ではまだできないとのことですが、いずれ使えるようになるということをオープンAIが言っています。本当の意味でアシスタントになって色んなことをできるのではないかと言われています。


ユージ:すごい!塚越さんは、この音声機能についてどのようにご覧になりましたか?


塚越さん:フェイクの問題を別にすれば、やはり進化だと思います。2013年にAIアシスタントとの恋愛映画『her/世界でひとつの彼女』がありましたが、このようなAIとの会話がスムーズになるかなと思います。一方でそういうことを行うと、どんどんコンピュータばかりと会話して人間同士が会話しないという指摘があります。これは、バランスの問題かなと思いまして逆に音声アシスタントとたくさん会話をすることで、人間との会話を練習する方もいると思います。結局、人間と会話したいという欲望はなくならないかなと思います。そう考えるとまだまだ進化していく、ただオープンAIは最近幹部の方が会社を辞めて競合に移るというやり方があります。人材の流出なども言われたりしているので、様々な問題はオープンAIにも言われていますが、業界全体でみると活性化していることは間違いないと言えます。


  • X
  • Facebook
  • LINE
Top