Předmluva
Předkládaný Valenční slovník českých sloves (též VALLEX 4.0) poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů; tyto základní údaje jsou doplněny o některé další syntaktické a sémantické charakteristiky. VALLEX 4.0 zachycuje 4 659 českých sloves, která odpovídají 11 030 lexikálním jednotkám, tedy vždy „danému slovesu v daném významu“ (což odpovídá 6 829 lexikálním jednotkám, sdruží-li se vidové protějšky do lexémů).
VALLEX 4.0 je rozšířeným vydáním VALLEXu 3.0 a 3.5, navazuje tak na vydání slovníku z roku 2008 (VALLEX 2.0). Ačkoli se počtem zpracovaných sloves příliš neliší od verze 2.0, od verze 3.0 se zásadně proměnila koncepce slovníku – model slovníku je uzpůsoben tak, aby umožňoval teoreticky adekvátně a přitom ekonomicky popisovat změny ve valenční struktuře českých sloves. Slovník nyní sestává ze dvou komponent: slovníková (datová) komponenta obsahuje lexikální hesla popisující valenční chování jednotlivých lexémů sloves, zatímco gramatická komponenta (představující část celkové gramatiky jazyka) obsahuje gramatická pravidla popisující možné změny v jejich valenční struktuře. Ve slovníku jsou reflektovány gramaticky podmíněné změny spojené s diatezemi, reciprocitou a reflexivitou. Slovník tak zachycuje nejen základové povrchověsyntaktické realizace lexikálních jednotek slovesných lexémů (tedy aktivní, syntakticky nereciproční a nereflexivní konstrukce), ale též struktury příznakové (pasivní, syntakticky reciproční a reflexivní konstrukce). Z lexikálně motivovaných změn jsou zde vyznačeny ty, které jsou spojeny se změnou lexikální jednotky téhož slovesného lexému (např. typ naložit vůz senem – naložit seno na vůz). Dále jsou k lexikálním jednotkám VALLEXu doplněny příklady z Českého národního korpusu a z Pražského závislostního korpusu. VALLEX 3.5 přidává anotaci zhruba 1 525 komplexních predikátů, tedy kombinací lexikální jednotky predikativního jména a jednotky kategoriálního slovesa.
VALLEX 4.0 tyto informace obohacuje o charakteristiku sloves vyjadřujících reflexivní a reciproční významy – jde jednak o slovesa, která tyto rysy obsahují ve svém lexikálním významu, jednak o slovesa vyjadřující reciprocitu nebo reflexivitu pomocí specifických syntaktických konstrukcí. VALLEX 4.0 takto charakterizuje 2 909 sloves ve 4 453 lexikálních jednotkách, která vyjadřují či mohou vyjadřovat reciproční vztahy (což odpovídá 2 744 lexikálním jednotkám, sdruží-li se vidové protějšky do lexémů), a 2 291 sloves ve 3 287 lexikálních jednotkách s možností vyjadřovat reflexivitu (jde o 2 039 lexikálních jednotek pro vidové protějšky sdružené do lexémů).
1 Poděkování
Za inspirativní poznámky, diskuse nad tématy souvisejícími s valencí sloves i lidskou podporu děkujeme především prof. Jarmile Panevové, autorce valenční teorie, ze které při popisu lexikálních hesel ve VALLEXu vycházíme. Naše díky náleží též ostatním kolegům, rodinám a přátelům. V neposlední řadě děkujeme recenzentům, doc. Martině Ivanové, dr. Elżbietě Kaczmarské a dr. Rolandu Wagnerovi, za kritické posouzení a zhodnocení průvodního textu, který byl publikován společně s verzí slovníku 3.0 a poté rozšířen o zásady popisu komplexních predikátů (VALLEX 3.5) a sloves vyjadřujících reciprocitu a reflexivitu (VALLEX 4.0).
VALLEX je vytvářen od roku 2001 v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. Podílel se na něm původní výzkumný tým ve složení Markéta Lopatková, Václava Kettnerová a Zdeněk Žabokrtský, doplněný o další spolupracovníky, Eduarda Bejčka a Annu Vernerovou. Děkujeme též našim spolupracovníkům, kteří se podíleli na přípravě starších verzí slovníku, a to především naší dlouholeté spolupracovnici Karolíně Skwarské, dále Kláře Hrstkové, Michaele Nové, Miroslavu Tichému, Petře Barančíkové a Martinu Rýparovi. Dále děkujeme autorům webového rozhraní Jiřímu Balharovi a Benediktu Straňákovi.
Při zpracovávání sloves ve slovníku VALLEX jsme využívali následující slovníky a korpusy českých textů:
BRIEF (Pala – Ševeček, 1997);
Slovník spisovné češtiny pro školu a veřejnost (Filipec et al., 2005, dále SSČ);
Slovník spisovného jazyka českého (Havránek et al., 1964, dále SSJČ);
Slovesa pro praxi (Svozilová et al., 1997);
Český národní korpus, řadu SYN (Křen et al., 2016, dále SYN), web;
Pražský závislostní korpus (Hajič et al., 2018, dále PDT), web.
Tato práce využívá jazykových zdrojů a nástrojů vyvinutých, uchovávaných a distribuovaných v rámci projektu MŠMT ČR Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy LINDAT/CLARIAH-CZ (LM2018101).
Práce na slovníku a jeho vydání byly podpořeny projektem GAČR Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině, GA P406-12-0557. Doprovodný text VALLEXu, verze 3.0, byl publikován jako součást knihy (Lopatková et al., 2016) vydané nakladatelstvím Karolinum.
Zpracování a anotace komplexních predikátů s kategoriálním slovesem (VALLEX 3.5) byla provedena v rámci projektu GAČR Kombinování slov: Syntaktické vlastnosti českých víceslovných výrazů s tzv. lehkými slovesy, GA 15-09979S.
Slovesa vyjadřující či umožňující vyjadřovat reciproční a reflexivní významy (VALLEX 4.0) byla zpracována v rámci projektu GAČR Mezi reciprocitou a reflexivitou: syntaktická a lexikografická analýza českých recipročních konstrukcí, GA 18-03984S.
2 Zpřístupnění slovníku
VALLEX je budován jako odpověď na potřebu rozsáhlého a kvalitního veřejně dostupného slovníku, který by obsahoval syntaktické a sémantické charakteristiky českých sloves a byl přitom široce uplatnitelný v aplikacích pro zpracování přirozeného jazyka. Při navrhování koncepce slovníku byl proto kladen důraz na všestranné využití jak pro lidského uživatele, tak pro automatické zpracování češtiny.
VALLEX je proto k dispozici ve třech formátech:
VALLEX 3.0 byl publikován jako tradiční tištěný slovník obsahující – mimo klasické slovníkové části – též teoretický úvod představující základní koncepční postupy uplatněné při budování slovníku, dále podrobný popis hesla; součástí publikace je též gramatická komponenta sestávající z bohatě exemplifikovaných formálních pravidel pro odvozování příznakových slovesných konstrukcí (Lopatková et al., 2016; stránky nakladatele: Karolinum).
Jednotlivé verze VALLEXu jsou dostupné jako webové slovníky umožňující rychlé a pohodlné vyhledávání podle řady předdefinovaných kritérií.
VALLEX 3.0 i VALLEX 4.0 je distribuován prostřednictvím repozitáře LINDAT/CLARIAH-CZ ve formě strojově čitelného souboru (XML a JSON formát), který umožňuje komplexní dotazy nad slovníkovými hesly i využití slovníku v nástrojích pro automatické zpracování češtiny.
3 Citování slovníku
Slovník VALLEX je veřejně dostupný slovník pod licencí Creative Commons 4.0 (CC BY-NC-SA). Jeho nekomerční využití je podmíněno přiměřenou citací alespoň jedné z následujících publikací (případně dalších relevantních publikací uvedených na webové stránce projektu):
-
Lopatková et al. (2016)
Lopatková, M. – Kettnerová, V. – Bejček, E. – Vernerová, A. – Žabokrtský, Z. (2016): Valenční slovník českých sloves VALLEX. Nakladatelství Karolinum, Praha, 698 pp. (webové stránky nakladatele)@book{2016-vallex-book, title = {Valen\v{c}n\'{\i} slovn\'{\i}k \v{c}esk\'{y}ch sloves {VALLEX}}, author = {Mark\'{e}ta Lopatkov\'{a} and V\'{a}clava Kettnerov\'{a} and Eduard Bej\v{c}ek and Anna Vernerov\'{a} and Zden\v{e}k \v{Z}abokrtsk\'{y}}, year = {2016}, publisher = {Karolinum}, address = {Praha}, isbn = {978-80-246-3542-2}, }
-
Lopatková et al. (2020)
Lopatková, M. – Kettnerová, V. – Vernerová, A. – Bejček, E. – Žabokrtský, Z. (2020): VALLEX 4.0. LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University. http://hdl.handle.net/11234/1-3524@misc{2020-vallex4.0-data, title = {VALLEX 4.0}, author = {Mark\'{e}ta Lopatkov\'{a} and V\'{a}clava Kettnerov\'{a} and Anna Vernerov\'{a} and Eduard Bej\v{c}ek and Zden\v{e}k \v{Z}abokrtsk\'{y}}, year = {2020}, publisher = {LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University}, address = {Praha}, url = {http://hdl.handle.net/11234/1-3524}, copyright = {Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)}, }
-
Kettnerová, V. – Lopatková, M. (2020)
Kettnerová, V. – Lopatková, M. (2020): Ke způsobům vyjádření vzájemnosti v češtině. Slovo a slovesnost. 81 (4), s. 243-268. (pdf)@article{sas-recipr-20, title = {Ke zp\r{u}sob\r{u}m vyj\'{a}d\v{r}en\'{\i} vz\'{a}jemnosti v \v{c}e\v{s}tin\v{e}}, author = {V\'{a}clava Kettnerov\'{a} and Mark\'{e}ta Lopatkov\'{a}}, journal = {Slovo a slovesnost}, year = {2020}, volume = {81}, number = {4}, pages = {243--268}, issn = {0037-7031}, }
-
Kettnerová, V. – Lopatková, M. (2018)
Kettnerová, V. – Lopatková, M. (2018): Lexicographic Potential of the Syntactic Properties of Verbs: The Case of Reciprocity in Czech. XVIII EURALEX International Congress, Lexicography in Global Contexts, Ljubljana University Press, Faculty of Arts, Ljubljana, Slovenia, ISBN 978-961-06-0096-1, pp. 685-698, 2018.@inproceedings{synt-pbml-18, title = {{Lexicographic Potential of the Syntactic Properties of Verbs: The Case of Reciprocity in Czech}}, author = {V\'{a}clava Kettnerov\'{a} and Mark\'{e}ta Lopatkov\'{a}}, year = {2018}, booktitle={XVIII EURALEX International Congress, Lexicography in Global Contexts}, publisher = {Ljubljana University Press, Faculty of Arts}, address = {Ljubljana}, pages={685--698}, isbn = {978-961-06-0096-1}, }
- Kettnerová et al. (2018)
Kettnerová, V. – Lopatková, M. – Bejček, E. – Barančíková, P. (2018): Enriching VALLEX with Light Verbs: From Theory to Data and Back Again. The Prague Bulletin of Mathematical Linguistics. 111, s. 29-56. (pdf)@article{lvc-pbml-18, journal = {The Prague Bulletin of Mathematical Linguistics}, title = {{Enriching VALLEX with Light Verbs: From Theory to Data and Back Again}}, author = {V\'{a}clava Kettnerov\'{a} and Mark\'{e}ta Lopatkov\'{a} and Eduard Bej\v{c}ek and Petra Baran\v{c}\'{i}kov\'{a}}, year = {2018}, volume = {111}, pages = {29--56}, issn = {0032-6585}, }
- Kettnerová et al. (2012)
Kettnerová, V. – Lopatková, M. – Bejček, E. (2012): The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon. In Proceedings of the 15th EURALEX International Congress. Department of Linguistics and Scandinavian Studies, University of Oslo, Oslo, Norway, pp. 434-443. (pdf)@inproceedings{12-EURALEX-sep, booktitle = {Proceedings of the 15th {EURALEX} International Congress}, editor = {Ruth Fjeld and Julie Torjusen}, title = {The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon}, author = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}} and Eduard Bej{\v{c}}ek}, year = {2012}, publisher = {Department of Linguistics and Scandinavian Studies, University of Oslo}, address = {Oslo}, pages = {434--443}, }
-
Lopatková et al. (2021)
Lopatková, M. – Kettnerová, V. – Vernerová, A. – Bejček, E. – Žabokrtský, Z. (2021): Valenční slovník českých sloves VALLEX. ÚFAL Technical report TR-2021-68. ÚFAL, Praha, ISSN 1214-5521, 184 pp. (pdf)@book{2021-vallex-techreport, title = {Valen\v{c}n\'{\i} slovn\'{\i}k \v{c}esk\'{y}ch sloves {VALLEX}}, subtitle = {ÚFAL Technical report TR-2021-68}, author = {Mark\'{e}ta Lopatkov\'{a} and V\'{a}clava Kettnerov\'{a} and Anna Vernerov\'{a} and Eduard Bej\v{c}ek and Zden\v{e}k \v{Z}abokrtsk\'{y}}, year = {2021}, publisher = {ÚFAL}, address = {Praha}, issn = {1214-5521}, }
4 Odborné publikace vztahující se k VALLEXu
Postupné budování VALLEXu je popsáno v řadě odborných publikacích, jejich seznam lze nalézt na webové stránce projektu.
Seznam literatury
- Filipec, J. et al. (ed.) (2005)
Slovník spisovné češtiny pro školu a veřejnost. Praha, Academia. (Co-editors: Daneš, F. – Machač, J. – Mejstřík, V.) - Hajič et al. (2018)
Prague Dependency Treebank 3.5. Prague, Czech republic, Univerzita Karlova, MFF, ÚFAL. (web) - Havránek, B. et al. (ed.) (1964)
Slovník spisovného jazyka českého. Praha, Academia. (Co-editors: Bělič, J. – Helcl, M. – Jedlička, A. et al.) - Křen, M. et al. (2016)
Český národní korpus. Praha, Ústav Českého národního korpusu FF UK. (web) - Lopatková, M. et al. (2020)
VALLEX 4.0. LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University. (data ke stažení; CC BY-NC-SA 4.0) - Lopatková, M. et al. (2016)
Valenční slovník českých sloves VALLEX. Praha, Nakladatelství Karolinum. - Pala, K. – Ševeček, P. (1997)
Valence českých sloves. In Sborník prací Filozofické fakulty brněnské univerzity, 46 / Řada jazykovědná, s. 41--54, Brno, Masarykova Univerzita Brno. - Svozilová, N. – Prouzová, H. – Jirsová, A. (1997)
Slovesa pro praxi. Valenční slovník nejčastějších českých sloves. Praha, Academia.
Obsah
- Předmluva
- 1 Poděkování
- 2 Zpřístupnění slovníku
- 3 Citování slovníku
- 4 Odborné publikace vztahující se k VALLEXu
- Seznam literatury