La española Loreto Corredoira es profesora de Derecho de la Información de la Universidad Complutense. El pasado 14 de marzo, publicó el siguiente artículo en el diario digital El Confidencial, sobre otra de las fallas de la Inteligencia Artificial cuando se la emplea para traducir.
Los sesgos de traducción de las IA automáticas
Educar a las “máquinas” (si se puede decir así) con que tratamos y vivimos en nuestras casas y trabajos siempre ha sido necesario. Decirle al navegador o al Word lo que no queremos que nos haga, o establecer preferencias de uso de un programa es algo elemental. En el caso de las inteligencias artificiales que hacen traducciones automáticas (sin intervención humana) y que nos facilitan tanto la comunicación internacional y el acceso al conocimiento ocurre igual. Quizá es incluso más necesario estar atentos a sus “sesgos” (bias) de funcionamiento que crecen exponencialmente.
El sesgo indica prejuicios y discriminación de ideas, personas, conceptos, etc. algo que, en un mundo de servicios global, con subtitulados automáticos en videos o en muchas webs, no digamos periódicos online o pódcast, puede causar fallos tremendos. Lo mismo que ocurre con las IA generativas como ChatGPT, Gemini o Copilot, pues estas funcionan (simplificando) a base de “redes neuronales” que utilizan millones de datos y textos en las que se basan sus respuestas.
Comparto una experiencia que he tenido recientemente, editando una voz para la Enciclopedia Oxford de Comunicación sobre la "Comunicación como derecho humano" que acabo de entregar en colaboración con Ignacio Bel, en concreto con el traductor Deepl PRO y Deepl Write en la versión de pago, tanto de traducción como de mejora de la redacción -algo que a los no native speakers- nos viene de perlas-. En general el resultado es excelente, pero hay que estar muy atento a "cosas que escriben solas" y a algunos de sus sesgos, algunos muy pronunciados.
Se inventan cosas
He observado que añade citas a autores por su cuenta y riesgo, y curiosamente nunca a un español o latinoamericano -habrá que soplarles a sus entrenadores algunas cosas-. Este era el original de Bel y mío: “En febrero de 1671 se promulga también en Inglaterra la Bill of Rights/Declaración de Derechos, que se centra en la petición de los derechos de corte político, económico, social y religioso de los ciudadanos frente a las arbitrariedades de los reyes. Una característica de esta declaración, al igual que las señaladas anteriormente, es que no hay ninguna referencia a la libertad de expresión, ni por supuesto como es lógico a la información”
Y esta la atribución que hace de la idea a un tal Smith, hasta con el número de página. In February 1671, the Bill of Rights was also promulgated in England, which focused on the demand for the political, economic, social and religious rights of citizens in the face of the arbitrary actions of kings. One characteristic of this declaration, like those mentioned above, is that there is no reference to freedom of expression, nor, of course, to information (Smith, 1996, p. 99).
Curiosamente en esta línea de atribuir ideas a autores, también ha sustituido uno por otra. Decíamos nosotros: “Se culminaba en esa fecha de 1948 el proceso para establecer a nivel mundial un conjunto derechos y libertades que reflejasen, de la mejor manera posible, el afán de libertad propio del ser humano, independientemente de sus condiciones sociales, económicas, políticas o religiosas. Esa lucha es consecuencia directa de la “violencia ofensiva” según Rothbard (1998), en las relaciones interpersonales, en las cuales prevalece en muchas ocasiones la agresión de unos contra otros”.
Y en cambio atribuye la idea a Ayn Rand (1904), una filósofa rusa desconocida para nosotros: The establishment of a comprehensive set of rights and freedoms at a global level that would reflect, in the most optimal manner, the universal desire for freedom, irrespective of social, economic, political or religious conditions, reached its zenith in 1948. This struggle is a direct consequence of the 'offensive violence' (Ayn Rand, 1998) in interpersonal relationships, in which aggression often prevails. The concept of freedom endeavours to mitigate this violence by achieving the greatest possible independence from authoritative entities, which can be viewed as both political and economic in nature. These two domains have historically demonstrated the most significant resistance to the promotion of citizens' freedom.
Sesgos ideológicos: habíamos quedado que Dios no existe
Me ha parecido más preocupante la selección y censura de determinadas ideas. En varios intentos ha quitado la mención expresa a Dios nada menos que a Milton en la famosa cita del discurso Areopagítica pronunciado en el Parlamento inglés. Este era nuestro original: “It was in 1644 that Milton delivered his famous speech Areopagitica. In this passage, the author posits the notion that God endowed individuals with the faculties of reason, free will, and conscience, thereby empowering them to discern the merits of ideas independently, rather than relying on the approval of a licensing authority”.
Y esta la traducción que en las distintas versiones que ofrece (traducción académica, de negocios o normal) elimina a Dios (abajo) claramente:
In this seminal work, Milton advanced the notion that individuals possess inherent faculties, including reason, free will, and conscience, empowering them to discern and evaluate ideas autonomously, without external licensing constraints.
Otro ejemplo curioso y difícil de entender escribiendo en inglés, ha sido el relativo a la eliminación de algunos derechos humanos civiles y sociales que enunciábamos en el trabajo como derechos universales.
Enumerábamos en el original en español los principales derechos humanos informativos de la Declaración Universal de Derechos Humanos de 1948. Comenzábamos recordando por ejemplo en su artículo primero que “Todos los seres humanos nacen libres...”. Idea de libertad que se repite, con distinto enfoque, en los artículos dos (raza, sexo, religión..), tres (vida), trece (circulación), dieciséis (consentimiento matrimonial), dieciocho (pensamiento y conciencia) diecinueve (opinión y expresión), veinte (reunión), veintiuno (voto), veintitrés (trabajo), veintiséis (educación), veintisiete (cultura), veintiocho (orden social) y treinta (supresión de derechos).
Curiosamente en la traducción -se “come” estos seis derechos políticos y sociales que podría entenderse en una IA de China o Irán- señalados arriba en negrita (nada menos que el derecho de reunión, voto, educación o trabajo). In the paragraph preceding the enumeration of articles, the concept of 'respect for these rights and freedoms' is reiterated. Within the articles themselves, numerous references to freedom are evident. For instance, the first article asserts: 'All human beings are born free...'. The notion of freedom is reiterated, albeit with a shift in emphasis, in articles two (race, sex, religion...), three (life), thirteen (movement), sixteen (consent to marriage), eighteen (thought and conscience), nineteen (opinion and expression).
Sesgos de género
Finalmente, este asunto es más conocido y no es nuevo en internet. De hecho, hay investigaciones que salen al paso de estos sesgos también en Google o en Microsoft. En este caso he tenido que corregirle varias veces el uso del “man” por seres humanos, en neutro, persona o humanidad (le ha costado aprenderlo). “The raison d'être of human rights lies in the very existence of man”.
Ya en 2021 se denunciaba ese sesgo básico de género
Así que concluyo, al utilizar estupendas herramientas como esta, que son imparables y que van a reemplazar muchos trabajos hasta ahora humanos, hay que estar muy, muy atentos/as. A mí Deepl Pro, el Google Translator o las IA de mi Samsung, me han salvado de muchos apuros, pero no puede uno abandonar la confianza del todo.
Me preocupa su uso especialmente en obras que se ofrecen en línea ya traducidas sin supervisión humana, sin revisión mínimamente experta por el manejo del original, y me temo que esa es una práctica habitual en las traducciones en línea que hay de muchas obras. No quiero pensarlo en medios informativos “predeterminados” por una narrativa sesgada. Es la nueva “basura” que trae la IA: contenidos de bajísima calidad generados con o sin intención de perjudicar (acuñada en el término slop IA).
A nivel usuario se puede entrenar y ofrecer terminología alternativa, grabar en la web un glosario habitual, cosa recomendable, para lo que también hemos de dedicar un “tiempo” a esas nuevas herramientas, conocerlas y “hackearlas” para que hagan las cosas que les pedimos. A nivel de periódicos digitales como este que ustedes leen ahora mismo, hemos de seguir defendiendo hoy, como Milton en el siglo XVII, la palabra, la expresión y, más que nunca, la veracidad de la información.
No hay comentarios:
Publicar un comentario