OpenAI, el fabricante de ChatGPT, dijo el martes que retrasaría el lanzamiento de su función «Modo de Voz» un mes hasta julio debido a problemas técnicos.
La compañía había planeado originalmente implementar la experiencia de conversación de voz realista para un pequeño grupo de usuarios de ChatGPT Plus a fines de junio, pero dijo que lo estaba retrasando porque necesitaba tiempo para alcanzar su estándar de lanzamiento.
«Por ejemplo, estamos mejorando la capacidad del modelo para detectar y rechazar cierto contenido. También estamos trabajando para mejorar la experiencia del usuario y preparar nuestra infraestructura para escalar a millones mientras mantenemos respuestas en tiempo real», dijo OpenAI en una publicación en Plataforma de redes sociales X.
La función se lanzará inicialmente a un pequeño grupo de usuarios para recopilar comentarios y estará disponible para todos los usuarios Plus en el otoño, sujeto a controles de seguridad y confiabilidad, dijo la compañía. OpenAI también está trabajando en la implementación de nuevas capacidades de video y uso compartido de pantalla. En mayo, dijo que lanzaría un nuevo modelo de IA llamado GPT-4o, capaz de mantener conversaciones de voz realistas y poder interactuar a través de texto e imágenes, su último movimiento para mantenerse a la vanguardia en la carrera por dominar la tecnología de IA emergente. Las nuevas capacidades de audio permitirán a los usuarios hablar con ChatGPT y obtener respuestas en tiempo real sin demora, así como interrumpir a ChatGPT mientras está hablando, dos características de conversaciones realistas que los asistentes de voz de IA han encontrado desafiantes.
Información de Juby Babu en Ciudad de México; Edición de Pooja Desai
Fuente: reuters