Hola,
¿eres nuevo aquí?

Regístrate gratis y conecta tu empresa con financiación pública, partners y proyectos.

Tengo cuenta

Regístrate

Ver video

MONOTRANS

Financiado

Cerrado

Statistical Machine Translation Using Monolingual Corpora

As evidenced by a number of machine translation competitions, statistical machine translation is producing encouraging results for language pairs where large corpora of previously translated texts are available for training. Howev... ver más

28/02/2011

URV

208K€

Presupuesto del proyecto: 208K€

Líder del proyecto

UNIVERSIDAD ROVIRA I VIRGILI No se ha especificado una descripción o un objeto social para esta compañía.

Total investigadores 8

Fecha límite participación Sin fecha límite de participación.

Financiación concedida El organismo FP7 notifico la concesión del proyecto el día 2011-02-28 No tenemos la información de la convocatoria

0% 100% 100%

Características del participante

Este proyecto no cuenta con búsquedas de partenariado abiertas en este momento.

Información adicional privada

No hay información privada compartida para este proyecto. Habla con el coordinador.

1 Participantes

URV

0.00€ | Lider

Conecta tu I+D

¿Tienes un proyecto y buscas un partner? Gracias a nuestro motor inteligente podemos recomendarte los mejores socios y ponerte en contacto con ellos. Te lo explicamos en este video

Líder del proyecto

UNIVERSIDAD ROVIRA I VIRGILI No se ha especificado una descripción o un objeto social para esta compañía.

Total investigadores 8

Presupuesto del proyecto 208K€

Fecha límite de participación Sin fecha límite de participación.

Descripción del proyecto As evidenced by a number of machine translation competitions, statistical machine translation is producing encouraging results for language pairs where large corpora of previously translated texts are available for training. However, in practice the availability of such data is often a severe bottleneck. We therefore propose a methodology that only requires a bilingual dictionary and monolingual text corpora of the source and the target language, which should considerably relieve the data acquisition problem. What we suggest is a two stage procedure. In the first step we create a database of translation equivalents by extracting them from a pair of comparable monolingual corpora using a bilingual dictionary in combination with automatically generated thesauri of related words. In the second step we translate new sentences by retrieving appropriate translation equivalents from the database and by merging them using a combinatorial approach.

Conecta tu I+D

Entra hoy

¿Olvidé mi contraseña?

Financiación

Empresas

CTIs/Universidades

Proyectos

Investigadores