OpenAIは、ChatGPT PlusおよびTeamsの加入者向けにAdvanced Voice Mode(AVM)の展開を発表しました。この新機能は、より自然な音声対話、5つの新しい音声、および改善されたアクセントを導入します。
(クレジット: OpenAI)
リニューアルされたデザインと新しい音声
新しい外観
AVM機能は、以前のアニメーションされた黒い点を置き換え、青いアニメーションスフィアを持つようになりました。このビジュアルの更新は、ユーザー体験をより魅力的で直感的にすることを目的としています。
拡張された音声オプション
新たに5つの音声—アーバー、メープル、ソル、スプルース、ヴェール—が追加され、合計で9つになりました。
これらの音声は自然にインスパイアされており、AVMの目標であるより自然な対話を実現します。しかし、以前紹介された音声「スカイ」は、スカーレット・ヨハンソンとの法的問題により削除されました。
機能の強化と制限
アクセントとカスタマイズの改善
OpenAIはAVMのさまざまなアクセントを理解する能力を向上させ、会話をよりスムーズで迅速にしました。さらに、ユーザーはカスタムインストラクションとメモリ機能を利用して、ChatGPTとの対話をパーソナライズできます。
地域的な可用性と欠落している機能
AVMは現在、EU、UK、スイス、アイスランド、ノルウェー、リヒテンシュタインを含むいくつかの地域では利用できません。さらに、今年初めに示されたビデオおよび画面共有機能はこの展開には含まれておらず、リリースの具体的なタイムラインは指定されていません。
競争環境と将来の展望
市場競争
OpenAIは他のテクノロジー企業からの競争が激化しています。Googleは最近、Gemini Live音声機能を発表し、Metaはそのプラットフォームでセレブの音声を導入する予定です。競争が激化する中でも、ChatGPTは週に2億人以上のアクティブユーザーを保持しています。
サブスクリプションプラン
高度な音声モードは、OpenAIのPlus、Team、またはEnterpriseプランの加入者向けに、月額20ドルから提供されます。AVMが利用可能になると、ユーザーはChatGPTアプリ内で通知を受け取ります。
編集者のコメント
OpenAIのAdvanced Voice Modeの展開は、AIとの対話をより自然でユーザーフレンドリーにするための重要なステップを示しています。
新しい音声の追加とアクセント認識の改善はユーザー体験を向上させますが、地域的な可用性やマルチモーダル機能の欠如は制限として残ります。
GoogleやMetaが音声AIの分野に参入する中、OpenAIの継続的な革新とユーザー中心の機能が市場リーダーを維持する上で重要となるでしょう。




