Credits

For both the list of authors and credits we include also those who participated, in the given role, on any of the projects that resulted in the previous versions of the PDT, PDTSC, PCEDT and Faust corpora.

Authors: Jan Hajič, Eduard Bejček, Alevtina Bémová, Eva Buráňová, Eva Fučíková, Eva Hajičová, Jiří Havelka, Jaroslava Hlaváčová, Petr Homola, Pavel Ircing, Jiří Kárník, Václava Kettnerová, Natalia Klyueva, Veronika Kolářová, Lucie Kučová, Markéta Lopatková, David Mareček, Marie Mikulová, Jiří Mírovský, Anna Nedoluzhko, Michal Novák, Petr Pajas, Jarmila Panevová, Nino Peterek, Lucie Poláková, Martin Popel, Jan Popelka, Jan Romportl, Magdaléna Rysová, Jiří Semecký, Petr Sgall, Johanka Spoustová, Milan Straka, Pavel Straňák, Pavlína Synková, Magda Ševčíková, Jana Šindlerová, Jan Štěpánek, Barbora Štěpánková, Josef Toman, Zdeňka Urešová, Barbora Vidová Hladká, Daniel Zeman, Šárka Zikánová, Zdeněk Žabokrtský

Credits: We would like to thank all the people who participated on the project:

Project Management, Linguistic Supervision

Jan Hajič

  • PDT-C project proposal and management throughout the project; supervision

Eva Hajičová, Jarmila Panevová, Petr Sgall

  • linguistic supervision throughout the project, FGD co-authors

 

PDT (written text dataset)

Morphological Annotation

Coordinator: Marie Mikulová; in the first phase: Barbora Vidová Hladká
Technical support: Milan Straka, Jan Štěpánek; in the first phase: Pavel Květoň, Petr Pajas, Pavel Pecina, Jan Štěpánek, Daniel Zeman, Zdeněk Žabokrtský, Karel Skoupý
Annotators: Markéta Dzuziková, Lukáš Jiřička, Petr Kujal, Jan Marek Šík, Lenka Šíková, Jitka Šípková, Zuzana Vorlíková; in the first phase: Martin Buben, Jiří Hana, Hana Hanová, Emil Jeřábek, Lenka Kebortová, Kristýna Kupková, Pavel Květoň, Jiří Mírovský, Andrea Pfimpfrová
Annotation guidelines: Daniel Zeman, Jan Hajič, Marie Mikulová, Jiří Hana, Hana Hanová, Jaroslova Hlaváčová, Barbora Vidová Hladká, Emil Jeřábek, Barbora Štěpánková

Surface Syntax Annotation

Coordinator: Jan Hajič
Technical support: Eva Buráňová, Jakub Dotlačil, Jan Hajič, Jiří Havelka, Michal Křen, Petr Pajas, Jan Štěpánek, Daniel Zeman, Zdeněk Žabokrtský
Annotators: Alevtina Bémová, Eva Buráňová, Jiří Kárník, Petr Pajas, Jan Štěpánek, Zdeňka Urešová
Annotation guidelines: Alevtina Bémová, Eva Buráňová, Jan Hajič, Jiří Kárník, Petr Pajas, Jarmila Panevová, Jan Štěpánek, Zdeňka Urešová

Deep Syntax Annotation

Coordinator: Jan Hajič
Technical support: Eva Buráňová, Jakub Dotlačil, Jan Hajič, Jiří Havelka, Michal Křen, Petr Pajas, Jan Štěpánek, Daniel Zeman, Zdeněk Žabokrtský
Annotators: Alevtina Bémová, Eva Buráňová, Jakub Dotlačil, Marie Mikulová, Magda Ševčíková, Kateřina Součková, Jana Šindlerová (Vejvodová), Zdeňka Urešová
Annotations guidelines: Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Jiří Havelka, Veronika Kolářová, Lucie Kučová, Markéta Lopatková, Petr Pajas, Jarmila Panevová, Magda Ševčíková, Petr Sgall, Jan Štěpánek, Zdeňka Urešová, Kateřina Veselá, Zdeněk Žabokrtský
Post-annotation quality control and checking: Václava Kettnerová, Ondřej Bojar, Jan Hajič, Markéta Lopatková, Petr Pajas, Jana Šindlerová, Jan Štěpánek, Zdeňka Urešová, Šárka Zikánová, Zdeněk Žabokrtský

Coreference Annotation

Coordinators: Zdeněk Žabokrtský, Eva Hajičová, Anna Nedoluzhko
Technical support: Zdeněk Žabokrtský, Petr Pajas, Jiří Mírovský
Annotators: Kateřina Černá, Lucie Kučová, Jana Šindlerová, Anna Nedoluzhko, Radek Ocelák, Jiří Pergler
Annotation guidelines: Eva Hajičová, Veronika Kolářová, Lucie Kučová, Anna Nedoluzhko

Topic-Focus Articulation

Coordinator: Jiří Havelka
Technical support: Jiří Havelka
Annotators: Eva Buráňová, Anna Dostálová, Barbora Štěpánková, Kateřina Veselá, Šárka Zikánová
Annotation guidelines: Eva Hajičová, Kateřina Veselá

Grammatemes

Coordinators: Zdeněk Žabokrtský, Magda Ševčíková
Technical support: Alena Böhmová, Oliver Čulo, Jiří Havelka, Petr Pajas, Jan Štěpánek, Daniel Zeman, Zdeněk Žabokrtský, Jiří Mírovský
Annotators: Kateřina Marková, Kamila Pacovská, Magda Ševčíková, Lenka Smejkalová
Annotation guidelines: Magda Ševčíková, Jarmila Panevová

Discourse

Coordinators: Eva Hajičová, Šárka Zikánová, Lucie Poláková, Pavlína Synková, Zuzanna Bedřichová, Magdaléna Rysová
Technical support: Jiří Mírovský
Annotators: Pavlína Synková, Jana Zdeňková, Magdaléna Rysová, Veronika Scheller, Helena Filipová, Lucie Poláková, Šárka Zikánová
Annotation guidelines: Lucie Poláková, Pavlína Synková, Šárka Zikánová, Zuzanna Bedřichová, Jiří Mírovský, Magdaléna Rysová, Jana Zdeňková, Veronika Pavlíková, Eva Hajičová

Bridging Relations

Coordinators: Eva Hajičová, Anna Nedoluzhko
Technical support: Jiří Mírovský
Annotators: Anna Nedoluzhko, Radek Ocelák, Jiří Pergler
Annotation guidelines: Anna Nedoluzhko

Genre Specification

Coordinator: Lucie Poláková
Technical support: Jiří Mírovský
Annotators: Pavlína Synková, Veronika Scheller, Lucie Poláková, Magdaléna Rysová, Jan Václ, Barbora Vidová Hladká, Gabriela Vodičková, Šárka Zikánová, Jiří Mírovský
Annotation guidelines: Lucie Poláková

Multiword Expressions

Coordinators: Eduard Bejček, Pavel Straňák
Technical support: Eduard Bejček, Pavel Straňák
Annotators: Pavel Šidák, Pavlína Vimmrová, Eva Šťastná
Annotation guidelines: Pavel Straňák


PCEDT-cz (translated text dataset)

Translation

Coordinators: Marie Mikulová, Jan Štěpánek, Vladislav Kuboň
Translation and revisions: Dagmar Brejlová, Blanka Cajthamlová, Čapková, Drahomíra Doležalová, Eva Dubová,  Jana Grollová, Pavel Gulaši, Jiří Gut, Jan HajičJan Hajič jr., Jakub Hajič,  Jiří Havelka, Josef Hlaváč, Tomáš Chudý, Jolana Janoušková, Lenka Kadlčáková, Zdeněk Kirschner, Zuzana Krulichová, Pavel Květoň, Veronika Machová, David Obdržálek, Roman Pašek, Michaela Prchlíková, Veronika Senjuková, Lucie Škrdlová, Eva Štěpánková, Ivana Štěpánková, Stáňa Švecová, Jana Tesková, Mirka Urešová, Vorlíček, Romana Workman-Víšková, Filip Zavoral
Guidelines: Marie Mikulová

Morphological Annotation

Coordinator: Marie Mikulová
Technical support: Milan Straka, Jan Štěpánek
Annotators: Markéta Dudziková, Lukáš Jiřička, Petr Kujal, Jan Marek Šík, Lenka Šíková, Jitka Šípková, Zuzana Vorlíková
Annotations guidelines: Daniel Zeman, Jan Hajič, Marie Mikulová, Jiří Hana, Hana Hanová, Jaroslova Hlaváčová, Barbora Vidová Hladká, Emil Jeřábek, Barbora Štěpánková

Deep Syntax Annotation

Coordinators: Marie Mikulová, Jan Hajič
Technical support: Jan Štěpánek, Petr Pajas, Jan Popelka, Zdeněk Žabokrtský
Annotators: Zuzanna Bedřichová, Kristýna Čermáková, Jitka Faktorová, Ivana Klímová, Martina Koppová, Alena Kropíková, Michala Lvová, Aneta Pečenková, Lenka Šíková, Katka Voleková, Olga Zitová
Annotations guidelines: Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Veronika Kolářová, Markéta Lopatková, Jarmila Panevová, Petr Sgall, Magda Ševčíková, Zdeňka Urešová, Zdeněk Žabokrtský
Additional annotations guidelines for PCEDT: Marie Mikulová

Coreference Annotation

Coordinator: Marie Mikulová
Technical support: Jiří Mírovský, Jan Kolář, Michal Novák
Annotators: Eliška Černá, Veronika Čurdová, Eliška Davidová, Vojtěch Diatka, Ivan Kafka, Radka Mačugová, Hana Vildová, Klára Zindulková, Zdeněk Zůcha
Annotations guidelines: Anna Nedoluzhko


PDTSC (spoken text dataset)

Recordings

Coordinators: Nino Peterek, Pavel Ircing
Recorders: Anna Havlová, Pavel Češka

We are also grateful to many other people from the former Malach project team who contributed the first part of the data.

Audio Transcription

Coordinators: Nino Peterek, Pavel Ircing
Annotators: Pavlína Křečková, Matyáš Kopp, Lýdie Šarinová, Jan Ureš, Lucie Fleisnerová, Tomáš Lindauer, Radka Vajajová, Štěpánka Vajajová

Speech Reconstruction

Coordinators: Marie Mikulová, Jan Hajič
Technical support: Petr Pajas, Ondřej Triebenekl
Annotators: Ondřej Triebenekl, Petra Mičková, Helena Glücksmannová, Ludmila Kaplanová, Michaela Luňáčková, Jana Grollová, Anna Kapsová, Petra Schnaubertová, Hana Štěpánková, Jan Ureš
Annotation guidelines: Marie Mikulová

Morphological Annotation

Coordinator: Marie Mikulová
Technical support: Milan Straka, Jan Štěpánek
Annotators: Markéta Dzudziková, Lukáš Jiřička, Petr Kujal,, Jan Marek Šík, Lenka Šíková, Jitka Šípková, Zuzana Vorlíková
Annotation guidelines: Daniel Zeman, Jan Hajič, Marie Mikulová, Jiří Hana, Hana Hanová, Jaroslova Hlaváčová, Barbora Vidová Hladká, Emil Jeřábek, Barbora Štěpánková

Deep Syntax Annotation

Coordinators: Marie Mikulová, Jan Hajič
Technical support: Jan Štěpánek
Annotators: Olga Zitová, Ivana Klímová, Martina Koppová, Jitka Faktorová, Alena Kropíková, Kateřina Voleková, Michala Lvová
Annotation guidelines: Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Veronika Kolářová, Markéta Lopatková, Jarmila Panevová, Petr Sgall, Magda Ševčíková, Zdeňka Urešová, Zdeněk Žabokrtský
Additional annotations guidelines for PDTSC: Marie Mikulová

Coreference Annotation

Coordinator: Marie Mikulová
Technical support: Jiří Mírovský, Jan Kolář
Annotators: Marie Mikulová, Veronika Kolářová, Hana Kalábová, Markéta Ceháková, Vojtěch Janda, Anna Stuchlá, Lenka Šíková, Anna Nedoluzhko
Annotation guidelines: Anna Nedoluzhko


PDT-Faust (user-generated text dataset)

Project Supervision, Data Acquisition

Coordinators: Jan Hajič, David Mareček

Translation

Coordinator: Jan Hajič
Translators: Jan Hajič jr., Jakub Hajič, Eva Štěpánková, Miroslava Urešová

Morphological Annotation

Coordinator: Marie Mikulová
Technical support: Milan Straka, Jan Štěpánek
Annotators: Markéta Dzudziková, Lukáš Jiřička, Petr Kujal, Jan Marek Šík, Lenka Šíková, Jitka Šípková, Zuzana Vorlíková
Annotation guidelines: Daniel Zeman, Jan Hajič, Marie Mikulová, Jiří Hana, Hana Hanová, Jaroslova Hlaváčová, Barbora Vidová Hladká, Emil Jeřábek, Barbora Štěpánková

Deep Syntax Annotation

Coordinators: Marie Mikulová, Jan Hajič
Technical support: Jan Štěpánek
Annotators: Olga Zitová, Ivana Klímová
Annotation guidelines: Marie Mikulová, Alevtina Bémová, Jan Hajič, Eva Hajičová, Veronika Kolářová, Markéta Lopatková, Jarmila Panevová, Petr Sgall, Magda Ševčíková, Zdeňka Urešová, Zdeněk Žabokrtský
Additional annotations guidelines for PDT-Faust: Marie Mikulová


PDT-Vallex

Coordinators: Jan Hajič, Zdeňka Urešová
Technical support: Petr Pajas, Eduard Bejček, Eva Fučíková
Annotators: Alevtina Bémová, Veronika Kolářová, Markéta Lopatková, Marie Mikulová, Zdeňka Urešová
Guidelines: Zdeňka Urešová, Jarmila Panevová

MorfFlex CZ

Coordinators: Jan Hajič, Jaroslava Hlaváčová
Technical support: Jan Hajič, Jaroslava Hlaváčová, Milan Straka
Annotators: Jan Hajič, Jaroslava Hlaváčová, Milena Hnátková, Marie Mikulová, Barbora Štěpánková
Guidelines: Daniel Zeman, Jan Hajič, Marie Mikulová, Jiří Hana, Hana Hanová, Jaroslova Hlaváčová, Barbora Vidová Hladká, Emil Jeřábek, Barbora Štěpánková


Annotation Tools

TrEd: Petr Pajas, Jan Štěpánek, Jiří Mírovský, Petr Fabian, Matyáš Kopp
MEd: Petr Pajas, David Mareček
Transcriber: http://trans.sourceforge.net/en/presentation.php

Automatic Annotation, Pre-annotation

Segmentation and tokenization of Czech texts: Milan Straka, Jan Hajič, Michal Křen
Morphological analyzer of Czech: Milan Straka, Jan Hajič, Jaroslava Hlaváčová
Czech tagger: Milan Straka, Jan Hajič
A-layer parser for Czech: Jason Baldridge, Ryan McDonald (MST parser)
T-layer parser for annotation of Czech: Václav Klimeš
Clause segmentation: Zdeněk Žabokrtský, Jan Popelka, Markéta Lopatková, Petr Homola, Lucie Hrabalová, Natalia Klyueva
ASR Transcript: Grůber Martin, Legát Milan, Ircing Pavel, Romportl Jan, Psutka Josef

Others

Prague Markup Language (PML): Petr Pajas, Jan Štěpánek
Treex: Zdeněk Žabokrtský, Martin Popel, David Mareček, Ondřej Bojar, Václav Klimeš, Tomáš Kraut, Václav Novák, Jan Ptáček, Rudolf Rosa, Daniel Zeman
MRP: Daniel Zeman
PML Tree Query: Petr Pajas, Jan Štěpánek, Michal Sedlák, Matyáš Kopp

DVD-ROM, web design

Coordinator: Jiří Mírovský
Web: Jiří Mírovský, Marie Mikulová
Data packaging: Jiří Mírovský, Jan Štěpánek
Collection publication: Marie Mikulová, Silvie Cinková
Data validation: Jiří Mírovský, Jan Štěpánek, Milan Straka