OpenAI는 ChatGPT Plus 및 Teams 구독자에게 고급 음성 모드(AVM)의 롤아웃을 발표했습니다. 이 새로운 기능은 더 자연스러운 음성 상호작용, 다섯 가지 새로운 음성, 개선된 억양을 소개합니다.
(크레딧: OpenAI)
개편된 디자인과 새로운 음성
새로운 모습
AVM 기능은 이제 이전의 애니메이션 블랙 점 대신 파란색 애니메이션 구체를 사용합니다. 이 시각적 업데이트는 사용자 경험을 더 매력적이고 직관적으로 만들기 위한 것입니다.
확대된 음성 옵션
다섯 가지 새로운 음성—Arbor, Maple, Sol, Spruce, Vale—가 추가되어 총 아홉 가지 음성이 되었습니다.
이 음성들은 자연에서 영감을 받아 AVM의 목표인 상호작용을 더 자연스럽게 느끼도록 하는 데 맞춰져 있습니다. 그러나 이전에 소개된 음성 "Sky"는 스칼렛 요한슨과의 법적 문제로 인해 제거되었습니다.
기능 향상 및 제한 사항
개선된 억양과 사용자 맞춤 설정
OpenAI는 AVM의 다양한 억양 이해 능력을 향상시키고 대화를 더 매끄럽고 빠르게 만들었습니다. 또한, 사용자들은 이제 사용자 맞춤 지침 및 메모리 기능을 사용하여 ChatGPT와의 상호작용을 개인화할 수 있습니다.
지역 가용성 및 누락된 기능
AVM은 현재 EU, 영국, 스위스, 아이슬란드, 노르웨이, 리히텐슈타인 등 여러 지역에서 사용할 수 없습니다. 게다가, 올해 초 시연된 비디오 및 화면 공유 기능은 이번 롤아웃에 포함되지 않았으며, 출시 일정도 정해져 있지 않습니다.
경쟁 환경 및 향후 전망
시장 경쟁
OpenAI는 다른 기술 대기업들과의 경쟁이 심화되고 있습니다. 구글은 최근 Gemini Live 음성 기능을 출시했고, 메타는 플랫폼에 유명인 음성을 도입할 계획입니다. 경쟁에도 불구하고, ChatGPT는 주간 활성 사용자 2억 명 이상을 유지하며 강력한 사용자 기반을 가지고 있습니다.
구독 계획
고급 음성 모드는 OpenAI의 Plus, Team 또는 Enterprise 계획 구독자에게 제공되며, 월 $20부터 시작합니다. AVM이 사용자에게 제공되면 ChatGPT 앱에서 알림을 받게 됩니다.
편집자의 댓글
OpenAI의 고급 음성 모드 롤아웃은 AI 상호작용을 더 자연스럽고 사용자 친화적으로 만드는 데 중요한 발전을 의미합니다.
새로운 음성과 개선된 억양 인식의 추가는 사용자 경험을 향상시키지만, 지역 가용성과 다중 모드 기능의 부재는 여전히 제한 사항으로 남아 있습니다.
구글과 메타가 음성 AI 분야에 진입하면서 경쟁이 치열해짐에 따라 OpenAI의 지속적인 혁신과 사용자 중심의 기능이 시장 선두를 유지하는 데 중요할 것입니다.




