REST - Dokumentace projektu

Stručnou a jasnou formou bez jazykových korektur dokumentujeme projekt s akronymem REST, ve kterém jsme se věnovali anotaci Českého akademického korpusu. Dokumentaci píšeme pro sebe (rozuměj řešitele projektu), abychom i za rok (za dva, za tři, ...) věděli, co a jak jsme dělali, a i pro ostatní, pokud by se chtěli inspirovat našimi přístupy ve vlastních projektech. Jakýkoli komentář směřujte na adresu rest@ufal.mff.cuni.cz

O projektu - obecné informace

Stručná anotace: The project focuses on fulltext information systems (containing both written and spoken materials) in Czech (when standard methods fail due to the different type of languages they have been developed for). The project aims to strengthen and improve current methods for morphological analysis of Czech, in order to attain higher precision in identifying lexical units and in some cases also their meaning. The project will use state-of-the-art statistical technology and machine learning based on linguistically annotated data. Within the project, such data will be prepared (at a fraction of the usual cost) by conversion of older resources, and tools will be created (based on the resulting larger corpus) that would have parameters needed for a successful application in end-user information systems.
Doba řešení, rozpočet: July 2004 - December 2008, 17,7M CZK (UK MFF 12,4M + ÚJČ 5,3M)
Poskytovatel: Grant Agency of the Academy of Sciences of the Czech Republic
Oficiální stránky projektu: REST
Přijatý návrh projektu (proposal): Návrh projektu
Spoluřešitelé: Viz domovská stránka projektu.
Průběžné zprávy: Viz domovská stránka projektu.

Resources and Tools for Information Systems (REST) - interní dokumentace projektu

O projektu - obecné informace

Resources and Tools for Information Systems (REST)
- interní dokumentace projektu