Glokalize: La Lengua Digital

Los traductores que trabajan con textos científicos ya saben que esta es una de las pocas profesiones donde el mundo de las artes y de las letras está condenado a entenderse con el mundo de la ciencia y de la ingeniería. Seamos sinceros: los estudiantes de bellas artes no suelen irse de copas con los de ingeniería química. Y así sigue la vida después de la universidad. Años después, sin embargo, cuando los dos trabajan juntos en revistas científicas, de repente se dan cuenta de que tienen que entenderse. Esto tal vez explique por qué se entiende tan poco sobre las posibilidades del futuro de la traducción automática, y hasta la interpretación automática, como veremos en este artículo.

Los métodos de Monte-Carlo (para trabajar con cantidades enormes de números) se usan desde hace mucho tiempo como una manera “bruta” de buscar soluciones matemáticas. Un ejemplo clásico se da tal vez con el ordenador Deep Blue y sus “caminos aleatorios” para decidir la próxima jugada en sus famosas partidas de ajedrez contra Gary Kasparov. Sospecho que muchos científicos querían ver el ordenador ganar al humano, sobre todo los que crearon a la bestia, pero la mayoría de los humanos probablemente teníamos un deseo secreto de ver el humano salir de la contienda como vencedor. De hecho, el ruso ganó una partida y empató tres, pero perdió dos. Tan pocos resultados no son estadísticamente significativos, pero queda claro que Kasparov, con la "desventaja" de ser humano, era incapaz de generar miles de millones de posibles jugadas como su rival y, sin embargo, era capaz de ganarle. ¿Cómo es posible? Creo que la respuesta, y la analogía, se pueden aplicar a la traducción automática.

Tomemos como ejemplo la herramienta de traducción proporcionada por un motor de búsqueda archiconocido. Con la cantidad astronómica de palabras que pasan por sus servidores todos los días, esta empresa sin duda tiene una gran cantidad de palabras con qué trabajar a través de su software de traducción (si es que lo hace). Al elegir la moda, es decir, la "palabra más usada" en el Internet, la máquina elige la traducción que considera la más probable para una palabra específica mediante la comparación / el alineamiento de muchos textos en diferentes idiomas. (Dicho sea de paso, si lees muy bien los reglamentos antes de configurar una cuenta de correo con estas grandes proveedores de servicios de Internet, entenderás por qué nunca deberías enviar tus textos traducidos a través de ellos – puede que estés añadiéndolos a las enormes memorias de traducción de la empresa.) Esto no es tan distinto a lo que hacen los diccionarios más usados en el mundo cuando realizan encuestas para ver cuántas personas usan una palabra antes de que oficialmente sea aceptada en el diccionario. Aun así, hay dos problemas con este método, y es aquí donde los traductores humanos, sin duda, podemos engañar a la máquina al igual que Kasparov. La máquina tropieza con algunas excepciones a las reglas (Kasparov hizo lo inesperado al no siempre elegir la "mejor" jugada) y con la licencia poética. La metáfora, por ejemplo, lo puede descarrilar.

Es evidente que los traductores deben tener enorme cuidado al usar estas herramientas, y siempre y únicamente como una ayuda. Por ejemplo, después de traducir un texto puede resultar útil meter una sección (no todo el texto) en el traductor automático para ver las palabras que elige el ordenador; te dará algunas ideas nuevas que tal vez no te hubieran ocurrido a ti, actuando como un diccionario de sinónimos. Pero incluso en este caso, no debemos olvidar nunca que la moda matemática no siempre acierta. Sólo hace falta ver los ejemplos en la historia humana de las mayorías absolutas ganadas por dictadores radicales en elecciones para darnos cuenta de que la mayoría a menudo puede elegir mal debido a su ignorancia. El hecho de que una palabra se utiliza con mayor frecuencia no significa que sea correcta; hay que verificar las fuentes oficiales y considerar el contexto específico. También existe la amenaza del plagio: un autor científico con una nueva patente no se va a quedar muy contento al descubrir que su secreto celosamente guardado ahora está en la memoria de traducción de un motor de búsqueda al alcance de todo el mundo.

Por cierto, los ordenadores también se pueden utilizar de forma inteligente para "generar" su propia literatura. En su ya clásico libro Engañados por el Azar, Nassim Nicholas Taleb habla de cómo usó el “motor de Dada” de Andrew C. Bulhak para producir frases como esta: "Muchas narraciones sobre el papel del escritor como observador podrán ser reveladas. Se podría decir que si la narrativa cultural se mantiene, tenemos que elegir entre el paradigma de la dialéctica de la narrativa y el marxismo neo-conceptual. El análisis de Sartre de la narrativa cultural sostiene que la sociedad, paradójicamente, tiene un valor objetivo." A lo mejor semejantes sandeces pseudo-intelectuales te suenan si has traducido textos de crítica de arte mal escritos. Aun así, suena humano.

Luego tenemos la tentadora perspectiva de la interpretación automática, una posibilidad que tal vez no sea tan descabellada como muchos todavía creen. Cada vez que hablas por teléfono, tu voz se digitaliza antes de llegar al receptor, y esto ha sido así desde hace muchos años. No es tu madre a quién escuchas al teléfono; es un ordenador que la imita. Un ordenador también puede "aprender" la voz de un ser humano individual y reproducirla con nuevas frases propias. Alguna escena de las películas de Terminator ya no parece tan fantástica, ¿verdad? Esto tal vez ya sea un truco que conoce bien James Bond o la CIA, lo cual nos lleva a pensar que ahora se puede tomar el próximo paso. De hecho, creo que la BBC ya casi lo está haciendo, aunque sin darse cuenta. La corporación usa el subtitulado en directo desde hace años. Para ello, se puede contratar a cualquiera que sepa teclear muy rápido o...usar un ordenador. Básicamente, el ordenador reconoce la voz y pone las palabras que ha entendido en la pantalla. Por lo que he visto, yo diría que acierta con alrededor del 90%, lo cual en mi opinión es bastante impresionante, especialmente cuando se tiene que trabajar con tantos acentos. Imagínate un entrevistado en la calle en Cádiz diciendo: «Ho'tía. ¡El sol me e’tá cegando!» La máquina podría entender que ha dicho «¡O, tía! El sol meta segando», por ejemplo. Sin embargo, este obstáculo también tiene solución. Después de procesar a miles de entrevistas en Cádiz, sólo hay que decirle al ordenador dónde o a quién se está traduciendo para que sepa qué acento está escuchando. Otro paso adelante sería usar un dispositivo de GPS para informar de forma automática al ordenador cuando se encuentra en Glasgow o en Los Ángeles, para que pueda ajustar su reconocimiento de voz y el vocabulario según el lugar.

Así que ahí lo tenemos: nuestro intérprete de bolsillo para un futuro no tan lejano.

domingo, 13 de mayo de 2012

La Lengua Digital

No hay comentarios:

Publicar un comentario