La imparable expansión de internet ha incrementado el interés en el desarrollo de métodos que permitan crear, gestionar y explotar la ingente cantidad de información multilingüe que se genera en la red. La colaboración masiva de los usuarios de la red junto con la contribución de la ciencia al desarrollo de sistemas eficientes de procesamiento de la información multilingüe pueden constituir el empuje definitivo que permita acabar con las barreras lingüísticas que limitan actualmente el acceso universal a los recursos textuales de internet. Esta colaboración a gran escala implica un cambio de paradigma en la forma en la que la gente crea, organiza y transforma la información con consecuencia en muchos otros frentes, además del lingüístico, como es el de la educación. La creciente disponibilidad de contenidos multilingües, por otro lado, hace imprescindibles sistemas eficientes de almacenamiento y recuperación de esta información. Los objetivos básicos de este proyecto son la creación de herramientas informáticas de código abierto que permitan: apoyar con métodos científicos la creación y el procesamiento de los recursos que se generan o podrían generarse gracias al efecto sinérgico de la colaboración a gran escala de personas no expertas en la red, especialmente en los terrenos lingüístico y educativo; aumentar las facilidades para la inferencia parcialmente automática guiada por no expertos de los recursos lingüísticos necesarios para el procesamiento de información multilingüe;
simplificar el proceso de corrección (postedición) de la salida de los sistemas de traducción automática y hacerlo asequible a los no expertos de forma que, además, se mejore el motor de traducción subyacente; definir una plataforma de reutilización social de contenidos basada en bibliotecas digitales; desarrollar nuevos métodos de indexación y recuperación de información en entornos altamente multilingües.