Catalán Checo Francés Inglés Rumano
El proyecto FAUST desarrollará sistemas de traducción automática (TA) que respondan rápida e inteligentemente al feedback del usuario.
Los sistemas actuales de TA sobre Internet proporcionan un gran volumen de traducciones sin apenas interacción real con el usuario. La mayoría de estos sistemas no conceden a los usuarios la oportunidad de ofrecer opiniones o correciones sobre los resultados de la traducción. Es cierto que algunos sistemas piden feedback a los usuarios, pero el usuario no percibe ningún beneficio immediato: la traducción no varía en respuesta al feedback proporcionado. Nuestro objetivo es desarrollar sistemas de traducción de gran volumen capaces de adaptarse al feedback del usuario en tiempo real.
Para ello emplearemos los avanzados sistemas de TA estadística comerciales desarrollados por Language Weaver y explotados por Softissimo Inc en http://www.reverso.net/. Nuestra investigación considerará la traducción bidireccional entre cinco pares de lenguas, todas ellas oficiales en la UE:

- Checo-Inglés ; Francés-Inglés ; Rumano-Inglés ; Español-Inglés ; Español-Catalán
- Mejorar el sistio web de traducción de gran volumen Reverso.net con una infraestructura experimental y de evaluación que permita el estudio del feedback de usuario instantáneo en TA.
- Desplegar nuevos mecanismos de recolección de feedback en Internet que reduzcan el ruido del mismo y aumenten la utilidad de las contribuciones en la red.
- Adquirir automáticamente nuevas colecciones de datos para estudiar la traducción teniendo en cuenta el feedback de usuario.
- Desarrollar mecanismos para la incorporación instantánea de feedback de usuario en los motores de TA que se emplean en los entornos de producción, como los que abastecen al sitio web Reverso.net.
- Crear nuevos métodos de evaluación de la calidad de la traducción que reflejen las preferencias aprendidas del feedback de usuario.
- Desarrollar nuevos modelos de traducción a partir de los datos de feedback de usuario e integrar técnicas de generación de lenguaje natural directamente en TA con el fin de mejorar la fluidez y reducir el feedback negativo de los usuarios.