miércoles, 29 de junio de 2022

Si uno levanta la vista del propio ombligo, a veces se sorprende

Según estadísticas probablemente infladas, en España hay 46 millones de personas que hablan castellano (vale decir, el 9% de la población mundial de hablantes de esa lengua); 9 millones que hablan catalán, 3.221.000​​ que hablan gallego, 395.000 que hablan vasco; etc. Con estos datos, resulta por lo menos curiosa la apreciación de Judit Castaño, en su artículo del 12 de junio pasado, en el diario La Vanguardia, de Barcelona, cuando refiriéndose a las nuevas capacidades del traductor de Google pone en el rango de “dialectos o idiomas poco conocidos” al bhojpuri, de India y Nepal, con 50 millones de hablantes; al lingala, de varias naciones africanas, con 40 millones de hablantes; al maithili, de la India, con 34 millones de hablantes; al asamés, de la India, con 25 millones de hablantes; al luganda, de Ruanda y Uganda, con 20 millones de hablantes; al bambara, de Mali, con 14 millones de hablantes; al quechua, con 10 millones de hablantes, y al guaraní con 7 millones de hablantes, para citar sólo algunas de estas "nuevas lenguas mayoritarias". ¿Será la suya una versión eurocéntrica? El que título de la nota, ¿es total o parcialmente imbécil? ¿Será el artículo algún tipo de publicidad encubierta?

Google Translate ya habla quechua, guaraní y 22 lenguas más que no sabías ni que existían

¿Se puede viajar por el mundo sin hablar inglés u otro idioma? La respuesta es sí. Solo necesitas un dispositivo (móvil, tableta u ordenador) y conexión a Internet. Google Translate hace el resto. Y ahora no solo podrás comunicarte en inglés, francés o chino, entre otras muchas lenguas mayoritarias, también podrás hacerlo en aymara, guaraní, bhojpuri, twi o quechua: idiomas poco conocidos, pero muy utilizados en algunas regiones de África, Asia y América del Sur.

Google acaba de incorporar en su herramienta de traducción 24 idiomas más, por lo que ya son 133 las lenguas que habla Google Translate. De hecho, tal y como expone la compañía de Mountain View en su blog, a pesar de que son dialectos e idiomas poco conocidos por el público general, son hablados por más de 300 millones de personas en el mundo. Además, para hacerlo posible, se ha usado un sistema de aprendizaje automático llamado Zero-Shot.
 
Desde que se lanzó en 2006, hace dieciséis años, Google Translate se ha convertido en una herramienta imprescindible para viajar, en el trabajo o en nuestra vida personal. Cuantas parejas habrán iniciado una relación gracias al traductor de Google... Ya son 133 los idiomas que incluye, aunque le faltaba incorporar lenguas muy utilizadas en ciertos rincones del mundo, pero que en su mayoría han sido marginadas durante mucho tiempo. Como es el caso del aymara, guaraní o quechua, habladas por grupos indígenas o minoritarios en América del Sur.

Con estas incorporaciones, Google pone fin a una reclamación histórica de algunas comunidades indígenas que desde hacía años reclamaban al gigante tecnológico que incluyeran sus particulares lenguas y dialectos al traductor. Con ello, no solo se rompen barreras y se conectan comunidades de todo el mundo, también se contribuye a la supervivencia de culturas y sociedades enteras a menudo minoritarias e invisibles para el resto.

Los nuevos idiomas van desde el bhojpuri, hablado por hasta 50 millones de personas en el norte de la India, Nepal y Fiji, hasta el dhivehi con unos 300.000 hablantes en las Maldivas.

La comunidad que ha liderado esta iniciativa ha sido la quechua, o quichua. El quechua era la lengua franca del Imperio Inca, que se extendía desde lo que ahora es el sur de Colombia hasta el centro de Chile. Ahora, es utilizada por unos 10 millones de personas en Perú, Bolivia, Ecuador y países vecinos. Agregar el quechua a los idiomas reconocidos por Google ha sido una gran victoria para los activistas indígenas a favor de la conservación de su lengua. Luis Illaccanqui, un peruano que creó el sitio web Qichwa 2.0, que incluye diccionarios y recursos para aprender el idioma, ha destacado en declaraciones a Associated Press que este cambio ayudará a poner el quechua y el español "en el mismo estatus".

Illaccanqui, cuyo apellido en quechua significa 'tú eres el rayo', dijo que el traductor también ayudará a mantener vivo el idioma en una nueva generación de jóvenes y adolescentes, “que hablan quechua y español y que les fascinan redes sociales."

En su blog, Google advirtió que la calidad de las traducciones en los idiomas recién agregados “todavía está muy por detrás” del resto de lenguas, como el inglés, español y alemán. La compañía ha señalado que los modelos “cometerán errores y exhibirán sus propios sesgos”.

La incorporación de estos 24 nuevos idiomas ha sido también un hito técnico para Google Translate, ya que son los primeros que se agregan utilizando la traducción automática Zero-Shot, un modelo de aprendizaje automático que aprende a traducir a otro idioma sin ver un ejemplo antes.

Este modelo de machine learning sólo está siendo entrenado mediante texto monolingüe. La traducción no es perfecta, avisan desde la compañía, pero trabajarán para asegurar una traducción al nivel de la que existe actualmente para los idiomas más comunes.

No hay comentarios:

Publicar un comentario