Popis Projektu

Projekt FAUST bude rozvíjet systémy strojového překladu (SP), které budou rychle a inteligentně reagovat na zpětnou vazbu od uživatelů. Současné systémy SP na síti poskytují velkoobjemové překládání s minimem skutečné interakce. Většina systémů neposkytuje uživatelům žádnou možnost okomentovat nebo opravit výsledky překladu. Další systémy zpětnou vazbu chtějí, ale uživatelé nevidí žádné zlepšení, které by jejich činnost přinesla: překlad se v reakci na uživatelskou zpětnou vazbu nemění. Našim cílem je vyvinout velkoobjemový překladový systém, který na uživatelskou zpětnou vazbu bude reagovat v reálném čase. Budeme stavět na nejlepších současných komerčních statistických systémech SP vyvinutých firmou Language Weaver a dostupných přes firmu Softissimo na adrese http://www.reverso.net. Náš výzkum bude založen na obousměrných překladech mezi těmito pěti dvojicemi oficiálních jazyků EU:

  • čeština-angličtina,
  • francouzština-angličtina,
  • rumunština-angličtina,
  • španělština-angličtina,
  • španělština-katalánština.
Také budeme studovat překlady z arabštiny a čínštiny do angličtiny. Systémy, které vyvineme, budou uživatelům přímo k dispozici na stránce http://www.reverso.net. Vyvineme nové mechanismy na zpracovávání zpětné vazby, které podpoří uživatele v interakci se stystémem a v poskytování zpětné vazby. Tímto způsobem získáme data, která se budou sestávat z uživatelských posudků kvality překladu a zpětné vazby pro opravování překladů, podle nichž budeme svůj výzkum dál směrovat.

Cíle projektu:

  • Vylepšit stránku pro velkoobjemový překlad Reverso.net experimentální a evaluační infrastrukturou, která umožní studovat okamžitou uživatelskou zpětnou vazbu ve SP.
  • Vytvořit nové mechanismy pro sbírání zpětné vazby na síti, které omezí šum v uživatelské zpětné vazbě a zvýší užitečnost vstupů z
  • internetu.
  • Automaticky získávat nová data na zkoumání překladů doplněných uživatelskou zpětnou vazbou.
  • Vyvinout mechanismy pro okamžité začleňování uživatelské zpětné vazby do systémů strojového překladu, které jsou v nepřetržitém provozu, jako například systém na stránce Reverso.net.
  • Vytvořit nová automatická měření kvality překladu, která budou reflektovat preference naučené z uživatelské zpětné vazby.
  • Vyvinout nové překladové modely založené na datech z uživatelské zpětné vazby a integrovat generování přirozeného jazyka přímo do SP; tím vylepšit plynulost překladů a omezit negativní zpětnou vazbu od uživatelů.

Partneři projektu

University of Cambridge University of Cambridge, Department of Engineering, Velká Británie,
University of Cambridge, Computer Laboratory, Velká Británie,
Universitat Politecnica de Catalunya Universitat Politecnica de Catalunya, Španělsko,
Charles University in Prague Univerzita Karlova v Praze, Ústav formální a aplikované lingvistiky, Ȍeská republika,
Language Weaver Inc. Language Weaver Inc., USA,
Language Weaver SRL, Rumunsko,
Softissimo Inc. Softissimo Inc., Francie.

Content: David Mareček.
Site is valid XHTML 1.0 and valid CSS.
2010 © Ústav formální a aplikované lingvistiky. All Rights Reserved.

Site navigation: