Un nuevo equipo de clonación de voz de AI de una empresa británica afirma que una variedad de pronunciación del Reino Unido podrá reproducirse con mayor precisión en comparación con sus rivales estadounidenses y chinos.

Dado que los productos de IA para capacitar con voz, la mayoría de los datos utilizados en los datos tradicionales provienen de fuentes de habla inglesa del norte o del sur, muchas voces artificiales suenan similares.

Para luchar contra él, la compañía pasó un año para compilar la base de datos propia del Reino Unido con acentos regionales registrando personas en Synthesia Studios y recopilando material en línea.

Los usó para entrenar un producto llamado Voyes Express, que podría clonar la voz de una persona verdadera o crear una voz sintética.

Se pueden usar en contenido como videos de capacitación, asistencia de ventas y presentaciones.

La compañía dice que sus clientes quieren una presentación regional más precisa.

“Si usted es el CEO de una organización, o si solo es una persona normal, cuando mantiene su propia duplicación, desea ahorrar su acento”, dijo Yusuf Alam Mejjit, jefe de la investigación de Synthesia.

También agregó que los clientes de habla francesa también comentaron que la voz sintética francesa sonaba más que el francés-canadiense que Francia.

“Esto es solo porque estos modelos están haciendo que las empresas se inclinen hacia las empresas norteamericanas y hay un datos entre ellos que están sesgados hacia la población en la que se encuentran”, dijo.

La pronunciación más difícil en duplicado es la menos común, dijo Majjatti, porque el modelo AI tiene menos material registrado para la capacitación.

También hay informes de que los altavoces inteligentes, como los productos de IA promovidos por voz, tienen más probabilidades de luchar para comprender los diferentes acentos.

El año pasado, West Midlands expresó su preocupación por los documentos internos de la policía Los sistemas de reconocimiento de voz pueden entender si los acentos Brommy lo entienden.

Significar Como informes de Bloomberg En marzo

La firma dice que el collar tiene como objetivo reducir la “discriminación de pronunciación” experimentada por los trabajadores cuando no los entienden.

Existe la preocupación de que los idiomas y los dialectos se pierdan en la era digital.

“Alrededor de la mitad de los siete mil idiomas existentes se han puesto en peligro según la UNESCO hoy; aproximadamente un tercio de la presencia en línea es compatible; menos del 2 por ciento respaldado por la traducción de Google; y según el experimento propio de OpenAi, solo el cincuenta o 0.2 por ciento es compatible con una precisión del 80 por ciento con una precisión del 80 por ciento”.

“Los modelos de idiomas son el discurso homogéneo”, concuerda el experto en IA Henry Azad, quien aconseja a las agencias gubernamentales y de tecnología, incluida la sintesia.

Sin embargo, cuanto mejores serán estos productos, serán más efectivos en manos de estafadores.

El producto de la sintesia no será gratuito después de que se publiquen las próximas semanas y mantendrá los alrededores de discursos desagradables y elementos obvios.

Sin embargo, ya hay muchos equipos gratuitos de salto de voz de código abierto que es fácilmente accesible y menos protegido.

A principios de julio, los mensajes producidos por una voz clara se enviaron a los ministros bajo el disfraz del Secretario de Estado de los Estados Unidos, Marco Rubio.

Azder agregó: “El paisaje de código abierto para la voz se ha desarrollado tan rápido durante los últimos nueve a 12 meses”.

“Y es, desde el punto de vista de la protección, una verdadera preocupación”.

Enlace de fuente