Předmluva
Předkládaný Valenční slovník českých sloves (též VALLEX 4.5) poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů; tyto údaje jsou doplněny o další syntaktické a sémantické charakteristiky. VALLEX 4.5 zachycuje 4664 českých sloves, která odpovídají 11083 lexikálním jednotkám, tedy vždy „danému slovesu v daném významu“, sdruženým do 2772 lexémů (což odpovídá 6859 lexikálním jednotkám, sdruží-li se vidové protějšky do lexémů).
VALLEX 4.5 je rozšířeným vydáním VALLEXu 4.0, navazuje tak na vydání slovníku z roku 2008 (VALLEX 2.0) a 2016 (VALLEX 3.0). Ačkoli se počtem zpracovaných sloves příliš neliší od verze 2.0, od verze 3.0 se zásadně proměnila koncepce slovníku – model slovníku je uzpůsoben tak, aby umožňoval teoreticky adekvátně a přitom ekonomicky popisovat změny ve valenční struktuře českých sloves. Slovník nyní sestává ze dvou komponent: slovníková (datová) komponenta obsahuje lexikální hesla popisující valenční chování jednotlivých sloves, zatímco gramatická komponenta (představující část celkové gramatiky jazyka) obsahuje gramatická pravidla popisující možné změny v jejich valenční struktuře. Ve slovníku jsou reflektovány gramaticky podmíněné změny spojené s diatezemi, reciprocitou a reflexivitou. Slovník tak zachycuje nejen základové povrchověsyntaktické realizace lexikálních jednotek sloves (tedy aktivní, syntakticky nereciproční a nereflexivní konstrukce), ale též struktury příznakové (pasivní, syntakticky reciproční a reflexivní). Z lexikálně motivovaných změn jsou zde vyznačeny ty, které jsou spojeny se změnou lexikální jednotky téhož slovesa (např. typ naložit vůz senem – naložit seno na vůz). Dále jsou k lexikálním jednotkám doplněny příklady z Českého národního korpusu a z Pražského závislostního korpusu. VALLEX 3.5 přidává anotaci 1524 komplexních predikátů, tedy kombinací lexikální jednotky predikativního jména a jednotky kategoriálního slovesa.
VALLEX 4.0 nově zpracovává slovesa vyjadřující reflexivní a reciproční významy – jde jednak o slovesa, která tyto rysy obsahují ve svém lexikálním významu (nyní jde o 443 inherentně recipročních sloves v 337 lexikálních jednotkách), jednak o slovesa vyjadřující reciprocitu nebo reflexivitu pomocí specifických syntaktických konstrukcí (2751 lexikálních jednotek umožňujících vytvářet reciproční konstrukce a 2049 lexikálních jednotek umožňujících vytvářet reflexivní konstrukce). VALLEX 4.5 pak tyto informace rozšiřuje o charakteristiku reflexivních sloves, tedy sloves se slovotvorným morfémem se/si v lemmatu. Tato slovesa charakterizuje na základě syntakticko-sémantického vztahu k jejich nereflexivním protějškům. VALLEX 4.5 takto charakterizuje 1525 reflexivních sloves v 2501 lexikálních jednotkách (sdruží-li se vidové protějšky do lexémů, pak jde o 1545 lexikálních jednotek).
1 Poděkování
Za inspirativní poznámky, diskuse nad tématy souvisejícími s valencí sloves i lidskou podporu děkujeme především prof. Jarmile Panevové, autorce valenční teorie, ze které při popisu lexikálních hesel ve VALLEXu vycházíme. Naše díky náleží též ostatním kolegům, rodinám a přátelům. V neposlední řadě děkujeme recenzentům, doc. Martině Ivanové, dr. Elżbietě Kaczmarské a dr. Rolandu Wagnerovi, za kritické posouzení a zhodnocení průvodního textu, který byl publikován společně s verzí slovníku 3.0 a poté rozšířen o zásady popisu komplexních predikátů (VALLEX 3.5), sloves vyjadřujících reciprocitu a reflexivitu (VALLEX 4.0) a reflexivních sloves (VALLEX 4.5).
VALLEX je vytvářen od roku 2001 v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. Podílel se na něm původní výzkumný tým ve složení Markéta Lopatková, Václava Kettnerová a Zdeněk Žabokrtský, doplněný o další spolupracovníky, Eduarda Bejčka, Annu Vernerovou a Jiřího Mírovského. Děkujeme též našim spolupracovníkům, kteří se podíleli na přípravě starších verzí slovníku, a to především naší dlouholeté spolupracovnici Karolíně Skwarské, dále Kláře Hrstkové, Michaele Nové, Miroslavu Tichému, Petře Barančíkové a Martinu Rýparovi. Dále děkujeme autorům webového rozhraní Jiřímu Balharovi a Benediktu Straňákovi.
Při zpracovávání sloves ve slovníku VALLEX jsme využívali následující slovníky a korpusy českých textů:
BRIEF (Pala – Ševeček, 1997);
Slovník spisovné češtiny pro školu a veřejnost (Filipec et al., 2005, dále SSČ);
Slovník spisovného jazyka českého (Havránek et al., 1964, dále SSJČ);
Slovesa pro praxi (Svozilová et al., 1997);
Český národní korpus, řadu SYN (Křen et al., 2016, dále SYN);1
Pražský závislostní korpus (Bejček et al., 2018, dále PDT).2
1.1 Grantová podpora
Slovník VALLEX využívá jazykových zdrojů a nástrojů vyvinutých, uchovávaných a distribuovaných v rámci projektu MŠMT ČR Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy LINDAT/CLARIAH-CZ (LM2018101).3
Práce na tomto projektu byla částečně podpořena MŠMT ČR, projektem č. LM2018101 LINDAT/CLARIAH-CZ.
Práce na slovníku a jeho vydání byly též podpořeny projektem GA ČR Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině, GA P406-12-0557.4 Doprovodný text VALLEXu, verze 3.0, byl publikován jako součást knihy (Lopatková et al., 2016b) vydané nakladatelstvím Karolinum.5
Zpracování a anotace komplexních predikátů s kategoriálním slovesem (VALLEX 3.5) byla provedena v rámci projektu GAČR Kombinování slov: Syntaktické vlastnosti českých víceslovných výrazů s tzv. lehkými slovesy, GA 15-09979S.6
Slovesa vyjadřující či umožňující vyjadřovat reciproční a reflexivní významy (VALLEX 4.0) byla zpracována v rámci projektu GAČR Mezi reciprocitou a reflexivitou: syntaktická a lexikografická analýza českých recipročních konstrukcí, GA 18-03984S.7
2 Zpřístupnění slovníku
VALLEX je budován jako odpověď na potřebu rozsáhlého a kvalitního veřejně dostupného slovníku, který by obsahoval syntaktické a sémantické charakteristiky českých sloves a byl přitom široce uplatnitelný v aplikacích pro zpracování přirozeného jazyka. Při navrhování koncepce slovníku byl proto kladen důraz na všestranné využití jak pro lidského uživatele, tak pro automatické zpracování češtiny.
VALLEX je proto k dispozici ve třech formátech:
VALLEX 3.0 byl publikován jako tradiční tištěný slovník obsahující – mimo klasické slovníkové části – též teoretický úvod představující základní koncepční postupy uplatněné při budování slovníku, dále podrobný popis hesla; součástí publikace je též gramatická komponenta sestávající z bohatě exemplifikovaných formálních pravidel pro odvozování příznakových slovesných konstrukcí (Lopatková et al., 2016b).8
Jednotlivé verze VALLEXu jsou dostupné jako webové slovníky umožňující rychlé a pohodlné vyhledávání podle řady předdefinovaných kritérií.9
VALLEX 3.0, VALLEX 4.0 a VALLEX 4.5 je distribuován prostřednictvím repozitáře LINDAT/CLARIAH-CZ ve formě strojově čitelného souboru (XML a JSON formát), který umožňuje komplexní dotazy nad slovníkovými hesly i využití slovníku v nástrojích pro automatické zpracování češtiny.10
3 Citování slovníku
Slovník VALLEX je veřejně dostupný slovník pod licencí Creative Commons 4.0 (CC BY-NC-SA).11 Jeho nekomerční využití je podmíněno přiměřenou citací alespoň jedné z následujících publikací (případně dalších relevantních publikací uvedených na webové stránce projektu):12
(Lopatková et al., 2016b)
Lopatková, M. – Kettnerová, V. – Bejček, E. – Vernerová, A. – Žabokrtský, Z. (2016): Valenční slovník českých sloves VALLEX. Praha, Karolinum.13@book{2016-vallex-book, author = {Mark{\'{e}}ta Lopatkov{\'{a}} and V{\'{a}}clava Kettnerov{\'{a}} and Eduard Bej{\v{c}}ek and Anna Vernerov{\'{a}} and Zden{\v{e}}k {\v{Z}}abokrtsk{\'{y}}}, title = {Valen{\v{c}}n{\'{i}} slovn{\'{i}}k {\v{c}}esk{\'{y}}ch sloves {VALLEX}}, year = {2016}, publisher = {Karolinum}, address = {Praha}, pages = {698}, isbn = {978-80-246-3542-2}, }
(Kettnerová – Lopatková, 2019)
Kettnerová, V. – Lopatková, M. (2019): Reflexives in Czech from a Dependency Perspective. In Gerdes, K. – Kahane, S. (eds.), Proceedings of the Fifth International Conference on Dependency Linguistics (Depling, Syntaxfest 2019), pp. 14-25, Paris, France, Association for Computational Linguistics.14@inproceedings{2019-depling-reflex, author = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}}}, title = {{Reflexives in Czech from a Dependency Perspective}}, booktitle = {{Proceedings of the Fifth International Conference on Dependency Linguistics (Depling, Syntaxfest 2019)}}, editor = {Kim Gerdes and Sylvain Kahane}, year = {2019}, publisher = {Association for Computational Linguistics}, address = {Paris, France}, pages = {14--25}, isbn = {978-1-950737-63-5}, }
(Kettnerová et al., 2021)
Kettnerová, V. – Lopatková, M. – Vernerová, A. (2021): Reflexives in the VALLEX Lexicon: Syntactic Reflexivity and Reciprocity. The Prague Bulletin of Mathematical Linguistics. 117, pp. 27-60.15@article{2021-PBML-refl-recipr, author = {V{'{a}}clava Kettnerov{'{a}} and Mark{'{e}}ta Lopatkov{'{a}} and Anna Vernerov{'{a}}}, title = {{Reflexives in the VALLEX Lexicon: Syntactic Reflexivity and Reciprocity}}, journal = {The Prague Bulletin of Mathematical Linguistics}, year = {2021}, number = {117}, pages = {27--60}, issn = {0032-6585}, }
(Kettnerová et al., 2022)
Kettnerová, V. – Lopatková, M. – Vernerová, A. (2022): Reflexives as Part of Verb Lexemes in the VALLEX Lexicon. The Prague Bulletin of Mathematical Linguistics. 119, pp. 37-66.16@article{2022-PBML-refl-recipr, author = {V{'{a}}clava Kettnerov{'{a}} and Mark{'{e}}ta Lopatkov{'{a}} and Anna Vernerov{'{a}}}, title = {{Reflexives as Part of Verb Lexemes in the VALLEX Lexicon}}, journal = {The Prague Bulletin of Mathematical Linguistics}, year = {2022}, number = {119}, pages = {37--66}, issn = {0032-6585}, }
(Kettnerová et al., 2018)
Kettnerová, V. – Lopatková, M. – Bejček, E. – Barančíková, P. (2018): Enriching VALLEX with Light Verbs: From Theory to Data and Back Again. The Prague Bulletin of Mathematical Linguistics. 111, pp. 29-56.17@article{2018-pbml-lvc, author = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}} and Eduard Bej{\v{c}}ek and Petra Baran{\v{c}}{\'{\i}}kov{\'{a}}}, title = {{Enriching {VALLEX} with Light Verbs: From Theory to Data and Back Again}}, journal = {The Prague Bulletin of Mathematical Linguistics}, year = {2018}, number = {111}, pages = {29--56}, issn = {0032-6585} }
(Kettnerová et al., 2012)
Kettnerová, V. – Lopatková, M. – Bejček, E. (2012): The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon. In Fjeld, R. V. - Torjusen, J. M. (eds.), Proceedings of the 15th EURALEX International Congress, pp. 434-443, Oslo, Norway, Department of Linguistics and Scandinavian Studies, University of Oslo.18@inproceedings{2012-EURALEX, author = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}} and Eduard Bej{\v{c}}ek}, title = {The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon}, booktitle = {Proceedings of the 15th {EURALEX} International Congress}, editor = {Ruth V. Fjeld and Julie M. Torjusen}, year = {2012}, publisher = {Department of Linguistics and Scandinavian Studies, University of Oslo}, address = {Oslo, Norway}, pages = {434--443}, }
(Lopatková et al., 2022)
Lopatková, M. – Kettnerová, V. – Mírovský, J. – Vernerová, A. – Bejček, E. – Žabokrtský, Z. (2022): VALLEX 4.5. LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University, Prague.19@misc{vallex-4-5-data, author = {Mark{\'{e}}ta Lopatkov{\'{a}} and V{\'{a}}clava Kettnerov{\'{a}} and Ji{\v{r}}{\'{i}} M{\'{i}}rovsk{\'{y}} and Anna Vernerov{\'{a}} and Eduard Bej{\v{c}}ek and Zden{\v{e}}k {\v{Z}}abokrtsk{\'{y}}}, title = {{VALLEX} 4.5}, year = {2022}, publisher = {{LINDAT}/{CLARIAH}-{CZ} Digital Library at the Institute of Formal and Applied Linguistics ({\'{U}}{FAL}), Faculty of Mathematics and Physics, Charles University}, address = {Prague}, url = {http://hdl.handle.net/11234/1-4756}, }
4 Odborné publikace vztahující se k VALLEXu
Postupné budování VALLEXu je popsáno v řadě odborných publikací, jejich seznam lze nalézt na webové stránce projektu.20
Poznámky
- ^[1] http://korpus.cz
- ^[2] http://ufal.mff.cuni.cz/pdt3.5/
- ^[3] http://lindat.mff.cuni.cz/cs/
- ^[4] http://ufal.mff.cuni.cz/grants/delving-deeper
- ^[5] http://karolinum.cz/knihy/lopatkova-valencni-slovnik-ceskych-sloves-vallex-17418
- ^[6] http://ufal.mff.cuni.cz/node/1124
- ^[7] http://ufal.mff.cuni.cz/grants/vallex
- ^[8] http://karolinum.cz/knihy/lopatkova-valencni-slovnik-ceskych-sloves-vallex-17418
- ^[9] http://ufal.mff.cuni.cz/vallex/
- ^[10] http://hdl.handle.net/11234/1-4756
- ^[11] http://creativecommons.org/licenses/by-nc-sa/4.0/
- ^[12] http://ufal.mff.cuni.cz/vallex/publications
- ^[13] http://karolinum.cz/knihy/lopatkova-valencni-slovnik-ceskych-sloves-vallex-17418
- ^[14] https://aclanthology.org/W19-7704
- ^[15] https://ufal.mff.cuni.cz/pbml/117/art-kettnerova-lopatkova-vernerova.pdf
- ^[16] https://ufal.mff.cuni.cz/pbml/119/art-kettnerova-lopatkova-vernerova.pdf
- ^[17] https://ufal.mff.cuni.cz/pbml/111/art-kettnerova-et-al.pdf
- ^[18] https://euralex.org/publications/the-syntax-semantics-interface-of-czech-verbs-in-the-valency-lexicon/
- ^[19] http://hdl.handle.net/11234/1-4756
- ^[20] http://ufal.mff.cuni.cz/vallex/publications
Seznam literatury
- Bejček et al. (2018)
Bejček, E. et al. (2018): Prague Dependency Treebank 3.5. Prague, Czech republic, Univerzita Karlova v Praze, MFF, ÚFAL. (Dostupné z http://ufal.mff.cuni.cz/pdt3.5.) - Filipec et al. (2005)
Filipec, J. et al. (ed.) (2005): Slovník spisovné češtiny pro školu a veřejnost. Praha, Academia. (Co-editors: Daneš, F. – Machač, J. – Mejstřík, V.) - Havránek et al. (1964)
Havránek, B. et al. (ed.) (1964): Slovník spisovného jazyka českého. Praha, Academia. (Co-editors: Bělič, J. – Helcl, M. – Jedlička, A. et al.) - Kettnerová et al. (2018)
Kettnerová, V. et al. (2018): Enriching VALLEX with Light Verbs: From Theory to Data and Back Again. The Prague Bulletin of Mathematical Linguistics. 111, s. 29–56. - Kettnerová – Lopatková (2019)
Kettnerová, V. – Lopatková, M. (2019): Reflexives in Czech from a Dependency Perspective. Proceedings of the Fifth International Conference on Dependency Linguistics (Depling, Syntaxfest 2019), s. 14–26. - Kettnerová et al. (2012)
Kettnerová, V. – Lopatková, M. – Bejček, E. (2012): The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon. In Fjeld, R. V. – Torjusen, J. M. (ed.) Proceedings of the XV EURALEX International Congress, s. 434–443, Oslo, Norway, Department of Linguistics and Scandinavian Studies, University of Oslo. - Kettnerová et al. (2021)
Kettnerová, V. – Lopatková, M. – Vernerová, A. (2021): Reflexives in the VALLEX Lexicon: Syntactic Reflexivity and Reciprocity. The Prague Bulletin of Mathematical Linguistics. 117, s. 27–60. - Kettnerová et al. (2022)
Kettnerová, V. – Lopatková, M. – Vernerová, A. (2022): Reflexives as Part of Verb Lexemes in the VALLEX Lexicon. The Prague Bulletin of Mathematical Linguistics. 119, s. 37–66. - Křen et al. (2016)
Křen, M. et al. (2016): Český národní korpus. Praha, Ústav Českého národního korpusu FF UK. (Dostupné z http://www.korpus.cz.) - Lopatková et al. (2016b)
Lopatková, M. et al. (2016b): Valenční slovník českých sloves VALLEX. Praha, Nakladatelství Karolinum. - Lopatková et al. (2022)
Lopatková, M. et al. (2022): VALLEX 4.5. LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University. (Dostupné z: http://hdl.handle.net/11234/1-4756.) - Pala – Ševeček (1997)
Pala, K. – Ševeček, P. (1997): Valence českých sloves. In Sborník prací Filozofické fakulty brněnské univerzity, 46 / Řada jazykovědná, s. 41–54, Brno, Masarykova Univerzita Brno. - Svozilová et al. (1997)
Svozilová, N. – Prouzová, H. – Jirsová, A. (1997): Slovesa pro praxi. Valenční slovník nejčastějších českých sloves. Praha, Academia.
Obsah
- Předmluva
- 1 Poděkování
- 1.1 Grantová podpora
- 2 Zpřístupnění slovníku
- 3 Citování slovníku
- 4 Odborné publikace vztahující se k VALLEXu
- Seznam literatury