감정 이해까지 가능한 고급 음성 인식 기술, 사용자 경험 향상
단계적 롤아웃, 2024년 가을까지 모든 사용자에게 제공 예정
[아웃소싱타임스 김민수 기자] 오픈AI가 최근 공개한 ChatGPT의 고급 음성 기능이 사용자들의 기대를 받고 있다.
이 기능은 2024년 5월에 처음 발표된 후, 점진적으로 일부 사용자들에게 제한적으로 제공되고 있다. 현재 5월에 약속된 기능이 단계적으로 배포 중이며, 전체 롤아웃 전 제한된 사용자에게 이메일로 사용가능 알림이 전송되었으며, 일부 사용자는 이미 기능을 사용 중이다. 가을까지는 모든 플러스 사용자가 이 기능을 사용할 수 있을 것으로 예상된다.
고급 음성 기능은 실시간 대화에서 더 자연스럽고 인간다운 반응을 제공하는 것이 특징이다. 음성 인식 기술인 Whisper를 활용해 사용자의 발화를 빠르게 텍스트로 변환하고, 오픈AI는 이 과정에서 사용자 목소리의 톤과 감정을 정확히 파악하는 데 집중하고 있다.
또한, 다양한 상황에서 음성을 활용해 사용자 경험을 향상시키고 있다. 예를 들어 스포츠 경기 해설 시연에서는 실시간으로 골 상황을 흥미진진하게 묘사하며, 숫자를 빠르게 세거나 멈춤 동작을 인식하는 등의 고급 기술을 선보였다.
특히 이 기능은 사용자와의 감정적 교감을 형성하는 데 탁월한 효과를 보이고 있다. 챗GPT는 사용자의 감정적인 발화를 정확히 해석해 이를 반영하는 방식으로 반응하며, 이는 대화의 자연스러움을 극대화하는 데 기여하고 있다.
이러한 발전은 단순한 음성 비서의 역할을 넘어, 교육, 심리적 지원, 시각 장애인을 위한 보조 도구 등 다양한 영역에서 활용될 가능성이 크다.
그러나 이러한 기술의 발전과 함께 음성 기술이 악용될 가능성에 대한 우려도 제기되고 있다. OpenAI는 음성 기능을 출시하며 사기 및 모방에 대한 안전장치를 강화했고, 유명 인사 음성을 모방하지 않도록 설정하는 등 법적 문제를 해결하기 위한 조치를 취하고 있다.
이번 음성 기능의 출시로 인해 AI와의 상호작용 방식이 크게 변화할 것으로 기대되며, 사용자들은 앞으로 더욱 자연스러운 대화형 AI를 경험할 수 있을 것이다.