Machine translation and human translation:
In competition or complementation?
Traducción automática y traducción humana: ¿en competición o en complementación?

John Hutchins (University of East Anglia, Norwich)
[Email: WJHutchins@compuserve.com]

[From: International Journal of Translation 13, 1-2 Jan-Dec 2001, pp.5-20. Special theme issue
on machine translation, edited by Michael S. Blekhman]

[De: La Revista internacional de la traducción 13, 1-2 enero-diciembre 2001, pp.5-20. Edición especial del tema sobre traducción automática, corregida por Michael S. Blekhman]
http://ourworld.compuserve.com/homepages/WJHutchins/IJT.htm

1. Introduction
Ever since the idea of using computers to translate natural languages was first proposed in the 1940s and since the first investigations were begun in the 1950s, translators have watched developments either in scorn or in trepidation. Either they have dismissed the very notion that anyone could even believe that translation could be mechanized, or (at the other extreme) they have feared that their profession would be taken over entirely by machines.

The first of these attitudes found expression as early as 1951 in a report for Unesco by J.E. Holmström. He believed that from a machine translation (MT) system, "the resulting literary style would be atrocious and fuller of 'howlers' and false values than the worst that any human translator produces". The reason was that "translation is an art; something which at every step involves personal choice between uncodifiable alternatives; not merely direct substitutions of equated sets of symbols but choices of values dependent for their soundness on the whole antecedent education and personality of the translator" (Holmström 1951). His comments preceded by three years the first tentative demonstration of a small prototype system, and were based on pure speculation.

Nevertheless, such comments have been repeated again and again by translators for nearly fifty years, and no doubt they shall be heard again in the next fifty.

The second attitude has also persisted to the present day. However, there is now no doubt that computer-based translation systems are not rivals to human translators, but they are aids to enable them to increase productivity in technical translation or they provide means of translating material which no human translator has ever attempted. In this context we must distinguish (1) machine translation (MT), which aims to undertake the whole translation process, but whose output must invariably be revised; (2) computer aids for translators (translation tools), which support the professional translator; and (3) translation systems for the 'occasional' non-translator user, which produce only rough versions to aid comprehension. These differences were not recognised until the late 1980s. The previous assumption had been that MT systems, whether running on a mainframe or a microcomputer, could serve all these functions with greater or lesser success. In part, this failure to identify different needs and to design systems specifically to meet them has contributed to misconceptions about translation technology and its impact for the professional translator.

2. The first MT systems
When machine translation (MT) was in its infancy, in the early 1950s, research was necessarily modest in its aims (Hutchins 1986, 1997). It was constrained by the limitations of hardware, in particular by inadequate computer memories and slow access to storage (of dictionaries and texts), and by the unavailability of high-level programming languages. Even more crucially it could look to no assistance from the language experts. Syntax was a relatively neglected area of linguistic study and semantics was virtually ignored. The earliest researchers knew that whatever systems they could develop would produce poor quality results, and they assumed major involvement of human translators both in the pre-editing of input texts and in the post-editing of the output. To reduce problems of ambiguity - seen as the crucial difficulty - they proposed also the development of controlled languages and the restriction of systems to specific subject areas.

In this atmosphere the first demonstration system was developed, a collaboration between IBM and the Georgetown University in 1954. Based on small vocabularies and carefully selected texts, the translations produced were impressively colloquial. Consequently, the general public and potential sponsors of MT research were led to believe that good quality output from automatic systems was achievable within a matter of a few years. The belief was strengthened by the emergence of greatly improved computer hardware, the first programming languages, and above all by developments in syntactic analysis based on research in formal grammars (e.g. by Chomsky and others.) For the next decade MT research grew in ambition. It became widely assumed that the goal of MT must be the development of fully automatic systems producing high quality translations. The use of human assistance was initially regarded as an interim arrangement. The emphasis of research was therefore on the search for theories and methods for the achievement of 'perfect' translations. It was of course this assumption that alarmed professional translators and that was famously criticised by Bar-Hillel (1960), who castigated current MT projects for their pursuit of the unattainable goal of 'fully automatic high quality machine translation'.

For most MT researchers in the 1960s, however, the current systems were temporary solutions to be superseded in the near future. They continued the 'perfectionist' goal and gave virtually no serious consideration to how 'less than perfect' MT could be used effectively and economically in practice. Even more damaging was the almost total neglect of the expertise of professional translators, who naturally became anxious and antagonistic. They foresaw the loss of their jobs, since this is what many MT researchers themselves believed was inevitable.

Progress was much slower than expected, and the output of systems showed no sign of improvements. Promises and forecasts of imminent breakthroughs did not come. With such lack of progress it was not surprising that in 1966 a committee set up by US sponsors of research - the Automatic Language Processing Advisory Committee (ALPAC 1966) - found that MT had failed according to its own aims, since there were no fully automatic systems capable of good quality translation and there seemed little prospect of such systems in the near future. The committee was also convinced that, as far as US government and military needs for Russian-English translation were concerned, there were more than adequate human translation resources available.

 

While the report by ALPAC brought to an end many MT projects in the United States (and indeed worldwide), it did not banish the public perception of MT research as essentially the search for fully automatic solutions. The subsequent history of translation technology is in part the story of how this mistaken emphasis of the early years has had to be repaired and corrected. The neglect of the translation profession has been made good eventually by the provision of translation tools and translator workstations. MT research has itself turned increasingly to the development of realistic practical systems where human involvement at different stages of the process is fully accepted as an integral component of their design architecture.

 

Since the early 1970s development has continued in three main strands: computer-based tools for translators, operational MT systems involving human assistance in various ways, and 'pure' theoretical research towards the improvement of MT methods in general.

1. Introducción
Desde que la idea de usar computadoras para traducir idiomas naturales fue propuesta por primera vez en los años 40, y puesto que las primeras investigaciones fueron comenzadas en los años 50, los traductores han observado los progresos con desprecio o con temor. O han descartado la noción misma que cualquier persona pudiera incluso creer que la traducción podría ser mecanizada, o (en el otro extremo) han temido que las máquinas se apoderarían de su profesión enteramente.

La primera de estas actitudes se formó tan temprano como 1951 en un informe para la UNESCO por J.E. Holmström. Él creyó que de un sistema de traducción automática (TA), "el estilo literario resultante sería atroz y más lleno de 'faltas garrafales' y de valores falsos que el peor que produciría cualquier traductor humano". La razón era que "la traducción es un arte; algo que en cada paso implica la opción personal entre los alternativas descodificables; no simplemente sustituciones directas de juegos de símbolos equivalentes pero de opciones de valores dependientes para su validez en toda la educación anterior y la personalidad del traductor" (Holmström 1951). Sus comentarios precedieron por tres años la primera demostración tentativa de un pequeño sistema prototipo, y fueron basados en pura especulación.


Sin embargo, tales comentarios han sido repetidos una y otra vez por traductores por casi cincuenta años, y no cabe duda que serán oídos otras veces en los próximos cincuenta años.


La segunda actitud también ha persistido hasta hoy día. Sin embargo, ahora no hay duda que los sistemas de traducción computarizados no son rivales de los traductores humanos, sino que son ayudas para permitirles aumentar la productividad en la traducción técnica o les proporcionan medios para traducir el material que ningún traductor humano haya intentado. En este contexto debemos distinguir (1) la traducción automática (TA), que pretende emprender el proceso entero de la traducción, pero que produce salida que necesariamente debe ser revisada; (2) recursos computarizados para traductores (herramientas de traducción), las cuales apoyan al traductor profesional; y (3) sistemas de traducción para el simple usuario 'ocasional', que producen solamente versiones del borrador para ayudar la comprensión. Estas diferencias no fueron reconocidas hasta los finales de los años 80. La suposición previa había sido que los sistemas de TA, ya sea en una computadora central o en una microcomputadora, podrían servir todas estas funciones con mayor o menor éxito. En parte, esta falta de identificar diversas necesidades y diseñar sistemas con medios específicos para resolverlos, ha contribuido a los conceptos erróneos sobre la tecnología de traducción y su impacto sobre el traductor profesional.


2. Los primeros sistemas de TA
Cuando la traducción automática (TA) estaba en su infancia, en los comienzos de los años 50, investigación era necesariamente modesta en sus metas (Hutchins 1986, 1997). Fue obligado por las limitaciones del hardware, especialmente por capacidades de memoria inadecuadas y el muy lento acceso al almacenaje (de diccionarios y de textos), y por la indisponibilidad de lenguajes de programación de alto nivel. Más crucialmente no podría esperar ninguna ayuda de los expertos en lenguas. La sintaxis fue una área relativamente descuidada en los estudios lingüísticos y virtualmente no le hacía caso a la semántica. Los primeros investigadores sabían que cualquier sistema que ellos pudieran desarrollar produciría resultados de baja calidad, y supusieron una participación importante de traductores humanos en la revisión anterior de los textos de entrada y en la corrección posterior de la salida. Para reducir los problemas de ambigüedad --vista como la dificultad crucial-- propusieron también el desarrollo de idiomas controlados y la restricción de sistemas a temas específicos.


En este ambiente se desarrolló el primer sistema de demostración, una colaboración entre la IBM y la Universidad de Georgetown en 1954. Proporcionado de vocabularios pequeños y textos cuidadosamente seleccionados, las traducciones producidas fueron contundentemente coloquiales. Por lo tanto, al público en general, y a los patrocinadores potenciales de la investigación de la TA, les hicieron creer que salida de buena calidad de sistemas automáticos sería alcanzable dentro de unos pocos años. Esta creencia fue forzada por la aparición de hardware muy mejorado, los primeros lenguajes de programación, y sobre todo por avances en el análisis sintáctico basado en la investigación de gramáticas formales (p.ej. por Chomsky y otros). Durante la siguiente década la investigación de TA creció en ambición. La suposición se difundió extensamente que la meta de la TA debiera ser el desarrollo de sistemas completamente automáticos para la producción de traducciones de alta calidad. El uso de ayuda humana fue considerado inicialmente como arreglo provisional. Por lo tanto el énfasis de la investigación se enfocó en la búsqueda para teorías y métodos para el logro de traducciones 'perfectas'. Era por supuesto esta suposición que asustó a los traductores profesionales y que fue célebremente criticado por Bar Hillel (1960), quien castigó los proyectos actuales de la TA por su búsqueda de la meta inalcanzable de 'traducción completamente automatizada de alta calidad'.


Para la mayoría de los investigadores de la TA de los años 60, sin embargo, los sistemas actuales eran soluciones temporales que se suplantarían en el futuro cercano. Continuaron buscando la meta 'perfeccionista' y no dieron virtualmente ninguna consideración cómo la TA 'menos que perfecta' se podría utilizar eficazmente y económicamente en la práctica. Incluso más dañosa fue la negligencia casi total de la competencia de los traductores profesionales, quienes naturalmente se volvieron ansiosos y antagonistas. Previeron la pérdida de sus trabajos, desde que esto es lo que muchos de los investigadores de la TA mismos creyeron fue inevitable.


El progreso era mucho más lento de lo esperado, y la salida de los sistemas no demostró ninguna evidencia de mejoramientos. Promesas y pronósticos de adelantos inminentes no dieron fruto. Con tal falta de progreso no fue de extrañar que en 1966 un comité instalado por los patrocinadores estadounidenses de la investigación --el Comité Consultivo del Procesamiento Automático de la Lengua (ALPAC, 1966)-- encontró que la TA había fallado según sus propios propósitos, dado que no había sistemas completamente automatizados capaces de hacer traducciones de buena calidad, y parecía poca perspectiva de la aparición de tales sistemas en el futuro cercano. El comité también estaba convencido de que, en cuanto a los requisitos gubernamentales y militares de E.E.U.U por la traducción rusa-inglesa, había recursos de traducción humanos disponibles que eran más que adecuados.


Mientras que el informe de ALPAC puso fin a muchos de los proyectos de la TA en Estados Unidos (y ciertamente en el mundo), no borró la impresión del público de que la investigación de la TA era esencialmente una búsqueda para soluciones completamente automáticas. La historia subsiguiente de la tecnología de traducción es en parte la historia de cómo este énfasis equivocado de los primeros años ha tenido que ser reparado y corregido. El descuido de la profesión de traducción fue recuperado eventualmente por la provisión de herramientas de traducción y de terminales para traductores. La investigación de la TA por sí mismo ha recurrido cada vez más al desarrollo de sistemas prácticos y realistas donde la participación humana en las diversas etapas del proceso se acepta como componente integral de su diseño arquitectural.


Desde los comienzos de los años 70 el desarrollo ha continuado en tres hilos principales: herramientas computarizadas para traductores, sistemas operacionales de TA que incluyen ayuda humana en varias maneras, y investigación teórica 'pura' hacia el mejoramiento de los métodos de la TA en general.