Alain Colmerauer, pionero de la traducción de motores

Grupo TAUM mostrando una pieza de salida de Q-System

alrededor de 1970


Mi cumpleaños reciente, mis 88 años, se vio oscurecido por la noticia de que alguien con quien había trabajado hace casi 50 años había muerto. Él era Alain Colmerauerun excelente informático francés, Caballero de la Legión de Honor (equivalente francés de caballería), profesor emérito de la Universidad de Marsella-Luminy. Mi trabajo para él duró solo tres años, de 1968 a 1971, pero fueron años formativos para mí. También para los demás; He recibido mensajes de otros dos ex compañeros diciendo que lo influyeron. Eso fue todo en los días previos a que me encontrara con la noción de traducción natural, cuando formaba parte de un grupo canadiense que investigaba la traducción automática. Habrá muchos comentarios y homenajes a él, pero me gustaría agregar algunos recordatorios personales.

A fines de la década de 1960, trabajaba como asistente de investigación lingüística en el proyecto de traducción automática en la Universidad de Montreal, una universidad de habla francesa. Adquirimos un modelo lingüístico del proceso de traducción del principal grupo de investigación en Francia, el de la Universidad de Grenoble. Era la gramática de dependencia del lingüista francés Lucien Tesnière. Pero no teníamos software para implementarlo.

Luego, en 1968, Alain vino a Canadá y a la Universidad de Montreal como cooperativa. el es cooperativas eran jóvenes graduados de una universidad francesa, bajo un esquema ideado por el gobierno de De Gaulle, que fueron enviados a trabajar durante dos años en países en desarrollo en lugar de su servicio militar obligatorio. Durante ese tiempo solo recibieron salarios del ejército. Por razones diplomáticas, presumiblemente por sus relaciones con Québec, Canadá fue incluido entre los países receptores. Con Alan vinieron al menos otros dos graduados en informática cooperativa que conocí, Michel van Canaghem y Guy de Chastellier. Procedían de la Universidad de Grenoble; ella tenía un sólido departamento de informática, pero Alain tenía experiencia en matemáticas. A la temprana edad de 28 años, recientemente tuvo una Doctorado por Etat, un excelente doctorado competitivo de Francia que ya no existe. Un día en su oficina me preguntó si me gustaría ver su tesis doctoral. Así que me lo mostró. Tenía unas 40 páginas. Me sorprendió que pudiera Doctorado por Etat con una disertación de sólo 40 páginas. Él sonrió y respondió: «Excepto en matemáticas».

Si bien el proyecto de traducción automática de Grenoble era famoso, Alain no estaba allí y no vino directamente a nuestro proyecto en Montreal. Llegó por primera vez al departamento de informática. La universidad tenía un centro de computación de última generación con un mainframe de CDC y un gerente de ingeniería emocionante, Juan Baudot, que estaba interesado en la lingüística. Pero el jefe del proyecto MT, chico rondeau, era un buen talento (¡después de todo, me reclutó a mí!) y nunca perdió la oportunidad de reclutar a Alain. Y así golpeamos. Rondeau luego abandonó apresuradamente la universidad y necesitaba un reemplazo creíble para asegurar su lucrativo contrato de investigación de MT con el Consejo Nacional de Investigación de Canadá (NRC). Eso es lo que pensó Alain, y así me llevaron.

Una de las primeras cosas que hizo Alain fue suspender la publicación trimestral de nuestros trabajos de investigación. Dijo que no debemos publicar hasta que tengamos algo muy importante que presentar. Me enseñó a despreciar el punto de vista de «publicar o morir» que prevalece en nuestras universidades, que produce más artículos pequeños y disertaciones de las que la gente tiene tiempo para leer. Finalmente nos quedamos dos años.

Empezó a proporcionar el software que necesitábamos. La gramática modificada (TG) fue el principal paradigma lingüístico de la época. Alain conocía bien a TG Noam Chomsky a través de su esposa, quien estaba escribiendo su tesis doctoral sobre él. Su primer producto fue un programa de TI que introdujo W-Gramática porque se inspiró en el lenguaje de programación Algol inventado por el científico informático holandés A. van Wijngaarden. De hecho, fue a través de Alain que conocí el estilo europeo de un programa presentado por Algol, que era más lógico y transparente que los lenguajes estadounidenses como Fortran en este momento. W-Grammar se podía usar para MT, así que escribí la primera (y posiblemente la única) pieza de traducción de prueba de concepto allí, con solo una oración. Alain estaba un poco decepcionado de que solo usara Chomskyan TG pero el modelo de dependencia de Tesnière. Sin embargo, tenía la mente abierta y más tarde me dio tiempo y recursos para trabajar en mi propio proyecto paralelo, The Transformer (el precursor de las memorias de traducción). Él también estaba seguro de sí mismo. Unos compañeros le enseñaron informática, por motivos teóricos. que los Sistemas Q pueden no funcionar; pero pensó que el peligro era insignificante y siguió adelante de todos modos.

Me gustaba W-Grammar y quería continuar con él, pero pronto salió algo mejor que lo hizo obsoleto. Este era su mejor conocido. Sistemas Q. (La Q significaba Québec). Q-Systems se puede describir aquí, ya que tienen un buen artículo en Wikipedia. Alain era un científico informático portátil: estaba orgulloso de haber registrado Q-Systems en Algol él mismo en seis semanas difíciles.

Q-Systems era un lenguaje de alto nivel, una herramienta revolucionaria para nosotros los lingüistas. Con ellos pudimos idear un sistema de traducción automática del inglés al francés. La tarea era demasiado para una sola persona, por lo que se dividió en etapas y se presentó. Dada la cadena de programas en Q-Systems esto fue posible. Tuve que diseñar y programar el analista morfológico inglés con la ayuda de un estudiante, Laurent Belisle. Alain una vez pagó lo que para mí era muy loable: «Brian, tu morfología nunca falla».

Para 1971 estábamos listos para hacer una presentación a la NRC y publicar. La publicación es instantánea. TAUM 71. (TAUM significa Traduction automatique à l’Université de Montréal.) Es difícil de encontrar hoy en día porque estaba destinado únicamente a la NRC, pero es un clásico del llamado enfoque regulado MT. Ese paradigma fue abolido por la invención de la MT estadística a fines de la década de 1980, por lo que puede parecer que estábamos ladrando al árbol equivocado. Sin embargo, el árbol correcto no estaba disponible para nosotros, porque las computadoras de la época no podían manejar las enormes bases de datos requeridas para las estadísticas de MT.

Para 1971, con TAUM 71 publicado y un cooperativa Alain fue absuelto y regresó a Francia. Un efecto secundario fue que dejó sus grandes apartamentos en Montreal en una isla nativa prominente en el río St. Louis. Lawrence con sus muebles antiguos. Pero poco después me fui de Montreal a Ottawa. Después de eso hubo una variación tan amplia entre nuestros intereses, sus intereses en la programación y mi interés en la teoría de la traducción, que tuve poco contacto con él. Lo visité una vez en su oficina en la Universidad de Marsella-Luminy y allí estuve presente en un debate en el que el bisnieto Michel van Canaghem le rogó que se pasara a lo último en informática, la microinformática. Asistí a la boda de Guy de Chastellier en la Basílica de Montreal. Pero en estos días puedes mirar las carreras de personas distantes en Internet. Y, como puede juzgar por lo anterior, esos años felices en Montreal dirigidos por Alain todavía están vivos en mi memoria.

Referencias

Alain Colmerauer (editor). TAUM 71. Montreal: Projet de Traduction Automatique de l’Université de Montréal, 1971. 223 p. Hacer clic [here] o accede a https://books.google.es/books/about/Projet_de_traduction_automatique_de_l_un.html?id=4lL_nQEACAAJ&redir_esc=y.

Alain Colmerauer y Guy de Chastellier. W-Gramática. Departamento de informática, Université de Montréal, c 1969, 8 p. Hacer clic [here] o vaya a alain.colmerauer.free.fr/alcol/ArchivesPublications/Wgrammar/Wgrammar.pdf.

Sistemas Q. Wikipedia. 2016.

Brian Harris y Laurent Belisle. Analizador de morfología gráfica POLYGRAM para inglés. yo TAUM 71págs. 46-105.

Imagen

La producción de Q-System está a cargo de Alain Colmerauer. Lejos a la izquierda de la tubería está Michel van Canaghem. Con el pelo largo, mirando más allá de la salida, está Jules Dansereau, un analista lingüístico canadiense para el francés. Richard Kittredge, un lingüista estadounidense, puede estar detrás de Jules.

Foto cortesía de Colette Colmerauer.