vallex 4.0

Předmluva

Předkládaný Valenční slovník českých sloves (též VALLEX 4.0) poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů; tyto základní údaje jsou doplněny o některé další syntaktické a sémantické charakteristiky. VALLEX 4.0 zachycuje 4 659 českých sloves, která odpovídají 11 030 lexikálním jednotkám, tedy vždy „danému slovesu v daném významu“ (což odpovídá 6 829 lexikálním jednotkám, sdruží-li se vidové protějšky do lexémů).

VALLEX 4.0 je rozšířeným vydáním VALLEXu 3.0 a 3.5, navazuje tak na vydání slovníku z roku 2008 (VALLEX 2.0). Ačkoli se počtem zpracovaných sloves příliš neliší od verze 2.0, od verze 3.0 se zásadně proměnila koncepce slovníku – model slovníku je uzpůsoben tak, aby umožňoval teoreticky adekvátně a přitom ekonomicky popisovat změny ve valenční struktuře českých sloves. Slovník nyní sestává ze dvou komponent: slovníková (datová) komponenta obsahuje lexikální hesla popisující valenční chování jednotlivých lexémů sloves, zatímco gramatická komponenta (představující část celkové gramatiky jazyka) obsahuje gramatická pravidla popisující možné změny v jejich valenční struktuře. Ve slovníku jsou reflektovány gramaticky podmíněné změny spojené s diatezemi, reciprocitou a reflexivitou. Slovník tak zachycuje nejen základové povrchověsyntaktické realizace lexikálních jednotek slovesných lexémů (tedy aktivní, syntakticky nereciproční a nereflexivní konstrukce), ale též struktury příznakové (pasivní, syntakticky reciproční a reflexivní konstrukce). Z lexikálně motivovaných změn jsou zde vyznačeny ty, které jsou spojeny se změnou lexikální jednotky téhož slovesného lexému (např. typ naložit vůz senem – naložit seno na vůz). Dále jsou k lexikálním jednotkám VALLEXu doplněny příklady z Českého národního korpusu a z Pražského závislostního korpusu. VALLEX 3.5 přidává anotaci zhruba 1 525 komplexních predikátů, tedy kombinací lexikální jednotky predikativního jména a jednotky kategoriálního slovesa.

VALLEX 4.0 tyto informace obohacuje o charakteristiku sloves vyjadřujících reflexivní a reciproční významy – jde jednak o slovesa, která tyto rysy obsahují ve svém lexikálním významu, jednak o slovesa vyjadřující reciprocitu nebo reflexivitu pomocí specifických syntaktických konstrukcí. VALLEX 4.0 takto charakterizuje 2 909 sloves ve 4 453 lexikálních jednotkách, která vyjadřují či mohou vyjadřovat reciproční vztahy (což odpovídá 2 744 lexikálním jednotkám, sdruží-li se vidové protějšky do lexémů), a 2 291 sloves ve 3 287 lexikálních jednotkách s možností vyjadřovat reflexivitu (jde o 2 039 lexikálních jednotek pro vidové protějšky sdružené do lexémů).

1  Poděkování

Za inspirativní poznámky, diskuse nad tématy souvisejícími s valencí sloves i lidskou podporu děkujeme především prof. Jarmile Panevové, autorce valenční teorie, ze které při popisu lexikálních hesel ve VALLEXu vycházíme. Naše díky náleží též ostatním kolegům, rodinám a přátelům. V neposlední řadě děkujeme recenzentům, doc. Martině Ivanové, dr. Elżbietě Kaczmarské a dr. Rolandu Wagnerovi, za kritické posouzení a zhodnocení průvodního textu, který byl publikován společně s verzí slovníku 3.0 a poté rozšířen o zásady popisu komplexních predikátů (VALLEX 3.5) a sloves vyjadřujících reciprocitu a reflexivitu (VALLEX 4.0).

VALLEX je vytvářen od roku 2001 v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. Podílel se na něm původní výzkumný tým ve složení Markéta Lopatková, Václava Kettnerová a Zdeněk Žabokrtský, doplněný o další spolupracovníky, Eduarda Bejčka a Annu Vernerovou. Děkujeme též našim spolupracovníkům, kteří se podíleli na přípravě starších verzí slovníku, a to především naší dlouholeté spolupracovnici Karolíně Skwarské, dále Kláře Hrstkové, Michaele Nové, Miroslavu Tichému, Petře Barančíkové a Martinu Rýparovi. Dále děkujeme autorům webového rozhraní Jiřímu Balharovi a Benediktu Straňákovi.

Při zpracovávání sloves ve slovníku VALLEX jsme využívali následující slovníky a korpusy českých textů:

Tato práce využívá jazykových zdrojů a nástrojů vyvinutých, uchovávaných a distribuovaných v rámci projektu MŠMT ČR Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy LINDAT/CLARIAH-CZ (LM2018101).

Práce na slovníku a jeho vydání byly podpořeny projektem GAČR Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině, GA P406-12-0557. Doprovodný text VALLEXu, verze 3.0, byl publikován jako součást knihy (Lopatková et al., 2016) vydané nakladatelstvím Karolinum.

Zpracování a anotace komplexních predikátů s kategoriálním slovesem (VALLEX 3.5) byla provedena v rámci projektu GAČR Kombinování slov: Syntaktické vlastnosti českých víceslovných výrazů s tzv. lehkými slovesy, GA 15-09979S.

Slovesa vyjadřující či umožňující vyjadřovat reciproční a reflexivní významy (VALLEX 4.0) byla zpracována v rámci projektu GAČR Mezi reciprocitou a reflexivitou: syntaktická a lexikografická analýza českých recipročních konstrukcí, GA 18-03984S.

2  Zpřístupnění slovníku

VALLEX je budován jako odpověď na potřebu rozsáhlého a kvalitního veřejně dostupného slovníku, který by obsahoval syntaktické a sémantické charakteristiky českých sloves a byl přitom široce uplatnitelný v aplikacích pro zpracování přirozeného jazyka. Při navrhování koncepce slovníku byl proto kladen důraz na všestranné využití jak pro lidského uživatele, tak pro automatické zpracování češtiny.

VALLEX je proto k dispozici ve třech formátech:

  • VALLEX 3.0 byl publikován jako tradiční tištěný slovník obsahující – mimo klasické slovníkové části – též teoretický úvod představující základní koncepční postupy uplatněné při budování slovníku, dále podrobný popis hesla; součástí publikace je též gramatická komponenta sestávající z bohatě exemplifikovaných formálních pravidel pro odvozování příznakových slovesných konstrukcí (Lopatková et al., 2016; stránky nakladatele: Karolinum).

  • Jednotlivé verze VALLEXu jsou dostupné jako webové slovníky umožňující rychlé a pohodlné vyhledávání podle řady předdefinovaných kritérií.

  • VALLEX 3.0 i VALLEX 4.0 je distribuován prostřednictvím repozitáře LINDAT/CLARIAH-CZ ve formě strojově čitelného souboru (XML a JSON formát), který umožňuje komplexní dotazy nad slovníkovými hesly i využití slovníku v nástrojích pro automatické zpracování češtiny.

3  Citování slovníku

Slovník VALLEX je veřejně dostupný slovník pod licencí Creative Commons 4.0 (CC BY-NC-SA). Jeho nekomerční využití je podmíněno přiměřenou citací alespoň jedné z následujících publikací (případně dalších relevantních publikací uvedených na webové stránce projektu):

  • Lopatková et al. (2016)
    Lopatková, M. – Kettnerová, V. – Bejček, E. – Vernerová, A. – Žabokrtský, Z. (2016): Valenční slovník českých sloves VALLEX. Nakladatelství Karolinum, Praha, 698 pp. (webové stránky nakladatele)
    @book{2016-vallex-book,
      title = {Valen\v{c}n\'{\i} slovn\'{\i}k \v{c}esk\'{y}ch sloves {VALLEX}},
      author = {Mark\'{e}ta Lopatkov\'{a} and V\'{a}clava Kettnerov\'{a}
                and Eduard Bej\v{c}ek and Anna Vernerov\'{a}
                and Zden\v{e}k \v{Z}abokrtsk\'{y}},
      year = {2016},
      publisher = {Karolinum},
      address = {Praha},
      isbn = {978-80-246-3542-2},
    }
  • Lopatková et al. (2020)
    Lopatková, M. – Kettnerová, V. – Vernerová, A. – Bejček, E. – Žabokrtský, Z. (2020): VALLEX 4.0. LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University. http://hdl.handle.net/11234/1-3524
    @misc{2020-vallex4.0-data,
      title = {VALLEX 4.0},
      author = {Mark\'{e}ta Lopatkov\'{a} and V\'{a}clava Kettnerov\'{a}
                and Anna Vernerov\'{a} and Eduard Bej\v{c}ek
                and Zden\v{e}k \v{Z}abokrtsk\'{y}},
      year = {2020},
      publisher = {LINDAT/CLARIAH-CZ Digital Library at the Institute of 
                   Formal and Applied Linguistics (ÚFAL), 
                   Faculty of Mathematics and Physics, Charles University},
      address = {Praha},
      url = {http://hdl.handle.net/11234/1-3524},
      copyright = {Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)},
    }
  • Kettnerová, V. – Lopatková, M. (2020)
    Kettnerová, V. – Lopatková, M. (2020): Ke způsobům vyjádření vzájemnosti v češtině. Slovo a slovesnost. 81 (4), s. 243-268. (pdf)
    @article{sas-recipr-20,
      title = {Ke zp\r{u}sob\r{u}m vyj\'{a}d\v{r}en\'{\i} vz\'{a}jemnosti v \v{c}e\v{s}tin\v{e}},
      author = {V\'{a}clava Kettnerov\'{a} and Mark\'{e}ta Lopatkov\'{a}},
      journal = {Slovo a slovesnost},
      year = {2020},
      volume = {81},
      number = {4},
      pages = {243--268},
      issn = {0037-7031},
    }
  • Kettnerová, V. – Lopatková, M. (2018)
    Kettnerová, V. – Lopatková, M. (2018): Lexicographic Potential of the Syntactic Properties of Verbs: The Case of Reciprocity in Czech. XVIII EURALEX International Congress, Lexicography in Global Contexts, Ljubljana University Press, Faculty of Arts, Ljubljana, Slovenia, ISBN 978-961-06-0096-1, pp. 685-698, 2018.
    @inproceedings{synt-pbml-18,
      title = {{Lexicographic Potential of the Syntactic Properties of Verbs: The Case of Reciprocity in Czech}},
      author = {V\'{a}clava Kettnerov\'{a} and Mark\'{e}ta Lopatkov\'{a}},
      year = {2018},
      booktitle={XVIII EURALEX International Congress, Lexicography in Global Contexts},
      publisher = {Ljubljana University Press, Faculty of Arts},
      address = {Ljubljana},
      pages={685--698},
      isbn = {978-961-06-0096-1},
    }
  • Kettnerová et al. (2018)
    Kettnerová, V. – Lopatková, M. – Bejček, E. – Barančíková, P. (2018): Enriching VALLEX with Light Verbs: From Theory to Data and Back Again. The Prague Bulletin of Mathematical Linguistics. 111, s. 29-56. (pdf)
    @article{lvc-pbml-18,
      journal = {The Prague Bulletin of Mathematical Linguistics},
      title = {{Enriching VALLEX with Light Verbs: From Theory to Data and Back Again}},
      author = {V\'{a}clava Kettnerov\'{a} and Mark\'{e}ta Lopatkov\'{a} 
                and Eduard Bej\v{c}ek and Petra Baran\v{c}\'{i}kov\'{a}},
      year = {2018},
      volume = {111},
      pages = {29--56},
      issn = {0032-6585},
    }
  • Kettnerová et al. (2012)
    Kettnerová, V. – Lopatková, M. – Bejček, E. (2012): The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon. In Proceedings of the 15th EURALEX International Congress. Department of Linguistics and Scandinavian Studies, University of Oslo, Oslo, Norway, pp. 434-443. (pdf)
    @inproceedings{12-EURALEX-sep,
      booktitle = {Proceedings of the 15th {EURALEX} International Congress},
      editor = {Ruth Fjeld and Julie Torjusen},
      title = {The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon},
      author = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}}
      and Eduard Bej{\v{c}}ek},
      year = {2012},
      publisher = {Department of Linguistics and Scandinavian Studies, University of Oslo},
      address = {Oslo},
      pages = {434--443},
    }
  • Lopatková et al. (2021)
    Lopatková, M. – Kettnerová, V. – Vernerová, A. – Bejček, E. – Žabokrtský, Z. (2021): Valenční slovník českých sloves VALLEX. ÚFAL Technical report TR-2021-68. ÚFAL, Praha, ISSN 1214-5521, 184 pp. (pdf)
    @book{2021-vallex-techreport,
      title = {Valen\v{c}n\'{\i} slovn\'{\i}k \v{c}esk\'{y}ch sloves {VALLEX}},
      subtitle = {ÚFAL Technical report TR-2021-68},
      author = {Mark\'{e}ta Lopatkov\'{a} and V\'{a}clava Kettnerov\'{a}
                and Anna Vernerov\'{a} and Eduard Bej\v{c}ek
                and Zden\v{e}k \v{Z}abokrtsk\'{y}},
      year = {2021},
      publisher = {ÚFAL},
      address = {Praha},
      issn = {1214-5521},
    }

4  Odborné publikace vztahující se k VALLEXu

Postupné budování VALLEXu je popsáno v řadě odborných publikacích, jejich seznam lze nalézt na webové stránce projektu.


Seznam literatury


Obsah