Technical Reports

The ÚFAL Technical Report Series (ISSN 1214-5521)

The ÚFAL (and former ÚFAL/CKL) technical report series has been established with the aim of disseminating topical results of research currently pursued by members, cooperators, or visitors of the Institute. The technical reports published in this Series are results of the research carried out in the research projects supported by the Grant Agency of the Czech Republic, GAČR 405/96/K214 (“Komplexní program”), GAČR 405/96/0198 (Treebank project), grant of the Ministry of Education of the Czech Republic VS 96151, and project of the Ministry of Education of the Czech Republic LN00A063 (Center for Computational Linguistics). Since November 1996, the following reports have been published.

ÚFAL TR-2023-73 Zdeňka Urešová, Cristina Fernández-Alcaina, Eva Fučíková, Jan Hajič: SynSemClass Czech and English Annotation Guidelines

ÚFAL TR-2022-72 Cristina Fernández-Alcaina, Eva Fučíková, Zdeňka Urešová: Annotation guidelines for Spanish verbal synonyms in the SynSemClass Lexicon

ÚFAL TR-2022-71 THEaiTRobot 2.0, Josef Doležal, Klára Vosecká, Tomáš Musil, David Mareček, Rudolf Rosa: Permeation / Prostoupení

ÚFAL TR-2021-70 Zdeňka Urešová, Eva Fučíková, Jan Hajič, Karolina Zaczynska: Annotation guidelines for German verbal synonyms included in SynSemClass Lexicon

ÚFAL TR-2021-69 Niyati Bafna, Jan Bodnár, Lukáš Kyjánek, Emil Svoboda, Madga Ševčíková, Jonáš Vidra, Zdeněk Žabokrtský: Towards Universal Segmentations: Survey of Existing Morphosegmentation Resources

ÚFAL TR-2021-68 Markéta Lopatková, Václava Kettnerová, Anna Vernerová, Eduard Bejček, Zdeněk Žabokrtský: Valenční slovník českých sloves VALLEX

ÚFAL TR-2021-67 THEaiTRobot 1.0, David Košťák, Daniel Hrbek, Rudolf Rosa, Ondřej Dušek: AI: When a Robot Writes a Play

ÚFAL TR-2021-66 Anna Nedoluzhko, Michal Novák, Martin Popel, Zdeněk Žabokrtský, Daniel Zeman: Coreference meets Universal Dependencies – a pilot experiment on harmonizing coreference datasets for 11 languages

ÚFAL TR-2021-65 Rudolf Rosa: Technická zpráva o vývoji projektu THEaiTRE v roce 2020

ÚFAL TR-2020-64 Marie Mikulová, Jan Hajič, Jíří Hana, Hana Hanová, Jaroslava Hlaváčová, Emil Jeřábek, Barbora Štěpánková, Barbora Vidová Hladká, Daniel Zeman: Manual for Morphological Annotation. Revision for Prague Dependency Treebank – Consolidated 2020 release

ÚFAL TR-2019-63 Ján Faryad: Identifikace derivačních vztahů ve španělštině

ÚFAL TR-2019-62 Zdeňka Urešová, Eva Fučíková, Eva Hajičová: CzEngClass: Contextually-based Synonymy and Valency of Verbs in a Bilingual Setting (CzEngClass: Kontextová synonymie a valence sloves v bilingvním prostředí)

ÚFAL TR-2018-61 Lukáš Kyjánek: Morphological Resources of Derivational Word-Formation Relations

ÚFAL TR-2016-60 Kira Droganova, Daniel Zeman: Conversion of SynTagRus (the Russian dependency treebank) to Universal Dependencies

ÚFAL TR-2015-59 Kateřina Rysová, Magdaléna Rysová, Eva Hajičová: Topic–Focus Articulation in English Texts on the Basis of Functional Generative Description

ÚFAL TR-2015-58 Zdeňka Urešová, Eva Fučíková, Jana Šindlerová: CzEngVallex: Mapping Valency between Languages

ÚFAL TR-2014-57 Anna Nedoluzhko, Eva Fučíková, Jiří Mírovský, Jiří Pergler, Lenka Šíková: Annotation of coreference in Prague Czech-English Dependency Treebank

ÚFAL TR-2014-56 Veronika Kolářová: Valence vybraných typů deverbativních substantiv ve valenčním slovníku PDT-Vallex

ÚFAL TR-2014-55 Rudolf Rosa: Depfix Manual

ÚFAL TR-2013-54 Marie Mikulová, Eduard Bejček, Jiří Mírovský, Anna Nedoluzhko, Jarmila Panevová, Lucie Poláková, Pavel Straňák, Magda Ševčíková, Zdeněk Žabokrtský: From PDT 2.0 to PDT 3.0 (Modifications and Complements)

ÚFAL TR-2013-53 Marie Mikulová, Eduard Bejček, Jiří Mírovský, Anna Nedoluzhko, Jarmila Panevová, Lucie Poláková, Pavel Straňák, Magda Ševčíková, Zdeněk Žabokrtský: Úpravy a doplňky Pražského závislostního korpusu (Od PDT 2.0 k PDT 3.0)

ÚFAL TR-2013-52 Marie Mikulová: Annotation on the tectogrammatical level. Additions to annotation manual (with respect to PDTSC and PCEDT)

ÚFAL TR-2013-51 Marie Mikulová: Anotace na tektogramatické rovině. Dodatky k anotátorské příručce (s ohledem na anotování PDTSC a PCEDT)

ÚFAL TR-2013-50 Jan Berka, Ondřej Bojar, Mark Fishel, Maja Popović, Daniel Zeman: Tools for Machine Translation Quality Inspection

ÚFAL TR-2013-49 David Mareček, Martin Popel, Loganathan Ramasamy, Jan Štěpánek, Daniel Zeman, Zdeněk Žabokrtský, Jan Hajič: Cross-language Study on Influence of Coordination Style on Dependency Parsing Performance

ÚFAL TR-2012-48 Nathan Green, Zdeněk Žabokrtský: Ensemble Parsing and its Effect on Machine Translation

ÚFAL TR-2012-47 Lucie Poláková, Pavlína Jínová, Šárka Zikánová, Zuzanna Bedřichová, Jiří Mírovský, Magdaléna Rysová, Jana Zdeňková, Veronika Pavlíková, Eva Hajičová: Manual for annotation of discourse relations in the Prague Dependency Treebank

ÚFAL/CKL TR-2011-46 Martin Majliš, Zdeněk Žabokrtský: W2C – Large Multilingual Corpus

ÚFAL/CKL TR-2011-45 David Mareček, Zdeněk Žabokrtský: Unsupervised Dependency Parsing

ÚFAL/CKL TR-2011-44 Anna Nedoluzhko, Jiří Mírovský: Annotating Extended Textual Coreference and Bridging Relations in the Prague Dependency Treebank

ÚFAL/CKL TR-2011-43 Ngụy Giang Linh, Michal Novák, Anna Nedoluzhko: Coreference Resolution in the Prague Dependency Treebank

ÚFAL/CKL TR-2011-42 Loganathan Ramasamy, Zdeněk Žabokrtský: Tamil Dependency Treebank (TamilTB) – 0.1 Annotation Manual

ÚFAL/CKL TR-2009-41 Marie Mikulová: Pokyny k překladu určené překladatelům, revizorům a korektorům textů z Wall Street Journal pro projekt PCEDT

ÚFAL/CKL TR-2008-40 Lucie Mladová: Diskurzní vztahy v češtině a jejich zachycení v Pražském závislostním korpusu 2.0

ÚFAL/CKL TR-2008-39 Zdeněk Žabokrtský, Ondřej Bojar: TectoMT, Developer's Guide

ÚFAL/CKL TR-2008-38 Marie Mikulová: Rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny. Manuál pro anotátory

ÚFAL/CKL TR-2008-37 Silvie Cinková, Marie Mikulová: Spontaneous speech reconstruction for the syntactic and semantic analysis of the NAP corpus

ÚFAL/CKL TR-2007-36 Magda Ševčíková, Zdeněk Žabokrtský, Oldřich Krůza: Zpracování pojmenovaných entit v českých textech

ÚFAL/CKL TR-2006-35 Silvie Cinková, Jan Hajič, Marie Mikulová, Lucie Mladová, Anja Nedolužko, Petr Pajas, Jarmila Panevová, Jiří Semecký, Jana Šindlerová, Josef Toman, Zdeňka Urešová, Zdeněk Žabokrtský: Annotation of English on the tectogrammatical level

ÚFAL/CKL TR-2006-34 Markéta Lopatková, Zdeněk Žabokrtský, Václava Benešová (in cooperation with Karolína Skwarska, Klára Hrstková, Michaela Nová, Eduard Bejček, Miroslav Tichý): Valency Lexicon of Czech Verbs. VALLEX 2.0

ÚFAL/CKL TR-2006-33 Jan Hajič, Marie Mikulová, Martina Otradovcová, Petr Pajas, Petr Podveský, Zdeňka Urešová: Pražský závislostní korpus mluvené češtiny. Rekonstrukce standardizovaného textu z mluvené řeči

ÚFAL/CKL TR-2006-32 Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Jiří Havelka, Veronika Kolařová, Lucie Kučová, Markéta Lopatková, Petr Pajas, Jarmila Panevová, Petr Sgall,Magda Ševčíková, Jan Štěpánek, Zdeňka Urešová, Kateřina Veselá, Zdeněk Žabokrtský: Annotation on the tectogrammatical level in the Prague Dependency Treebank (Reference book)

ÚFAL/CKL TR-2006-31 Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Jiří Havelka, Veronika Kolařová, Lucie Kučová, Markéta Lopatková, Petr Pajas, Jarmila Panevová, Petr Sgall, Magda Ševčíková, Jan Štěpánek, Zdeňka Urešová, Kateřina Veselá, Zdeněk Žabokrtský: Anotace na tektogramatické rovině Pražského závislostního korpusu (Referenční příručka)

ÚFAL/CKL TR-2006-30 Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Jiří Havelka, Veronika Kolařová, Lucie Kučová, Markéta Lopatková, Petr Pajas, Jarmila Panevová, Magda Razímová, Petr Sgall, Jan Štěpánek, Zdeňka Urešová, Kateřina Veselá, Zdeněk Žabokrtský: Annotation on the tectogrammatical level in the Prague Dependency Treebank (Annotation manual)

ÚFAL/CKL TR-2005-29 Petr Pajas, Jan Štěpánek: A Generic XML-Based Format for Structured Linguistic Annotation and Its application to the Prague Dependency Treebank 2.0

ÚFAL/CKL TR-2005-28 Marie Mikulová a kol.: Pražský závislostní korpus (The Prague Dependency Treebank) Anotace na tektogramatické rovině (úroveň 3)

ÚFAL/CKL TR-2005-27 Jiří Hana, Daniel Zeman: Manual for Morphological Annotation (Revision for PDT 2.0)

ÚFAL/CKL TR-2004-25 Jan Hajič, Zdeňka Urešová, Alevtina Bémová, Marie Kaplanová: The Prague Dependency Treebank, Annotation on tectogrammatical level

ÚFAL/CKL TR-2004-24 Jan Hajič, Zdeňka Urešová, Alevtina Bémová, Marie Kaplanová: Anotace na tektogramatické rovině (úroveň 3)

ÚFAL/CKL TR-2004-23 Jan Hajič a kol.: Anotace na analytické rovině, návod pro anotátory

ÚFAL/CKL TR-2004-22 Daniel Zeman: Neprojektivity v Pražském závislostním korpusu (PDT)

ÚFAL/CKL TR-2004-21 Silvie Cinková: Manuál pro tektogramatickou anotaci angličtiny

ÚFAL/CKL TR-2003-20 Kateřina Veselá, Jiří Havelka: Anotování aktuálního členění věty v Pražském závislostním korpusu

ÚFAL/CKL TR-2003-19 Lucie Kučová, Veronika Kolářová, Zdeněk Žabokrtský, Petr Pajas, Oliver Čulo: Anotování koreference v Pražském závislostním korpusu

ÚFAL/CKL TR-2003-18 Markéta Lopatková, Zdeněk Žabokrtský, Karolina Skwarska, Václava Benešová: Valency Lexicon of Czech Verbs VALLEX 1.0

ÚFAL/CKL TR-2003-17 Pavel Květoň: Language for Grammatical Rules

ÚFAL/CKL TR-2002-16 Radu Gramatovici and Martin Plátek: D-trivial Dependency Grammars with Global Word-Order Restrictions

ÚFAL/CKL TR-2002-15 Markéta Lopatková, Zdeněk Žabokrtský, Karolína Skwarská and Vendula Benešová: Tektogramaticky anotovaný valenční slovník českých sloves

ÚFAL/CKL TR-2002-14 Jiří Hana, Hana Hanová: Manual for Morphological Annotation

ÚFAL/CKL TR-2002-13 Pavel Pecina and Martin Holub: Sémanticky signifikantní kolokace

ÚFAL/CKL TR-2001-12 Eva Hajičová, Jarmila Panevová and Petr Sgall: Manuál pro tektogramatické značkování (III. verze)

ÚFAL/CKL TR-2001-11 Markéta Straňáková: Homonymie předložkových skupin v češtině a možnost jejich automatického zpracování

ÚFAL/CKL TR-2001-10 Zdeněk Žabokrtský: Automatic Functor Assignment in the Prague Dependency Treebank

ÚFAL/CKL TR-2000-09 Eva Hajičová, Jarmila Panevová and Petr Sgall: A Manual for Tectogrammatical Tagging of the Prague Dependency Treebank

ÚFAL TR-2000-08 Tomáš Holan, Vladislav Kuboň, Karel Oliva, Martin Plátek: On Complexity of Word Order

ÚFAL TR-1999-07 Eva Hajičová, Jarmila Panevová and Petr Sgall: Manuál pro tektogramatické značkování (in Czech)

ÚFAL TR-1999-06 Vladislav Kuboň: A Robust Parser for Czech

ÚFAL TR-1998-05 Geert-Jan M. Kruijff: Basic Dependency-Based Logical Grammar

ÚFAL TR-1997-04 Jan Hajič and Barbora Hladká: Tagging Inflective Languages: Prediction of Morphological Categories for a Rich, Structural Tagset

ÚFAL TR-1997-03 Alla Bémová at al.: Anotace na analytické rovině, Návod pro anotátory (in Czech)

ÚFAL TR-1997-02 Vladislav Kuboň, Tomáš Holan and Martin Plátek: A Grammar-Checker for Czech

ÚFAL TR-1996-01 Eva Hajičová: The Past and Present of Computational Linguistics at Charles University; Jan Hajič and Barbora Hladká: Probabilistic and Rule-Based Tagging of an Inflective Language – A Comparison

Instructions for authors (valid since 2012)

Authors of technical reports are supposed to send an email to Martin Popel containing:

  • the technical report itself in an A4-formatted PDF file,
  • the title of the report,
  • the list of authors.

 

There are no formatting requirements (besides page size being A4). A typical UFAL technical report contains several tens of pages in a single-column style.

A new number (TR-year-ord) will be assigned to each report. A standard front-cover page, title page, and several back-matter pages will be added to the PDF file before the report is published on this site.

By default, the reports are published only electronically since 2011.

Since 2012, the deadline for sending reports is December 1. Technical reports delivered later will be published in the next year.