El CEO de Meta, Mark Zuckerberg, anunció la integración del modelo de inteligencia artificial SeamlessM4T en Facebook, Instagram, Messenger, WhatsApp y Threads. Este modelo, considerado el primer modelo de traducción de IA multimodal y multilingüe todo en uno, permitirá a los usuarios comunicarse sin esfuerzo a través de voz y texto en diferentes idiomas.
SeamlessM4T facilita el reconocimiento de voz en casi 100 idiomas, así como la traducción de voz a texto, de voz a voz (en 36 idiomas), de texto a texto y de texto a voz (en 35 idiomas). Mediante esta integración, Meta pretende mejorar la traducción y transcripción del contenido compartido en estas redes sociales.
En un video presentado por Zuckerberg, se muestra cómo un audio en inglés es transcrito al español en cuestión de segundos y luego reproducido en este idioma. Este modelo de inteligencia artificial reduce los errores y los retrasos, lo que aumenta la eficiencia y la calidad del proceso de traducción. Además, permite que las personas que hablan diferentes idiomas se comuniquen más efectivamente.
Para permitir que los investigadores y desarrolladores utilicen este modelo de IA, SeamlessM4T ha sido publicado bajo una licencia de investigación. Asimismo, Meta ha liberado los metadatos de SeamlessAlign, el conjunto de datos de traducción multimodal más grande hasta la fecha, que cuenta con 270,000 horas de alineaciones de voz y texto extraídas.
Con esta integración, Meta busca enfrentar el desafío de construir un traductor universal de idiomas, ya que los sistemas existentes solo cubren una pequeña fracción de los idiomas del mundo. La empresa espera que esta mejora en la traducción y transcripción permita una comunicación más efectiva entre personas que hablan diferentes idiomas en las redes sociales de Meta.
Fuentes:
– Meta, comunicado de prensa.