Ondřej Bojar: Čeština a strojový překlad: Strojový překlad našincům, našinci strojovému překladu

Ondřej Bojar: Čeština a strojový překlad: Strojový překlad našincům, našinci strojovému překladu

BOJAR, ONDŘEJ (2012). Čeština a strojový překlad: Strojový překlad našincům, našinci strojovému překladu. ISBN 978-80-904571-4-0. 168 pp.

Preview BibTeX Buy

Abstrakt:

Strojový překlad je výzvou pro lingvisty i filozofy, informatiky i statistiky; pro počítačovou lingvistiku je úplnou výkladní skříní jazykových jevů, zajímavých problémů i postupů. Čeština není v oblasti strojového překladu nijak zanedbaným jazykem, právě naopak. Kromě jazykovědných teorií budovaných českými lingvisty se dnes můžeme opřít také o rozsáhlé sbírky českých nebo i česko-anglických textů, které lingvisté v posledních zhruba deseti letech obohatili o podrobné rozbory, tzv. anotace. Díky tomu představuje čeština vynikající studijní materiál i pro mezinárodní vědeckou veřejnost, ve strojovém překladu mezi češtinou a angličtinou se dokonce každoročně soutěží. Vlastní strojový překladač si dnes může sestavit z volně dostupných součástí každý programátor.

Je proto nejvyšší čas souborně představit téma strojového překladu širšímu publiku. Důraz klademe na vysvětlení nejpodstatnějších částí aktuálních teorií, přístupů i algoritmů. Věříme, že četné ilustrace pochopení usnadní. Snad vás téma zaujme, a přiložíte-li ruku k dílu, jistě se nám podaří udržet náskok, který má čeština např. ve srovnání s ostatními slovanskými jazyky.

Summary

Machine translation is a challenging goal for linguists and philosophers, computer scientists as well as statisticians; it is a showcase of interesting language phenomena and problems that computational linguistics faces. The Czech language is surprisingly well researched: there are established linguistic theories and extensive collections of Czech and Czech-English texts annotated at various layers of linguistic description. Czech thus represents an outstanding subject even for international researchers. Czech is also one of the few languages that are examined in a annual competition in machine translation. Thanks to open source data and software available these days, anyone can build their own machine translation systems and take part.

The book "Čeština a strojový překlad" comes just in time to introduce the topic of machine translation to a wider Czech audience. We focus on explaining the core components of current theories, approaches and algorithms, supporting the understanding with many illustrations. If enough Czech researchers are attracted to the topic of machine translation, Czech will keep the lead e.g. compared to other Slavic languages.