vallex 4.5

hide chapters
>

Předmluva

Předkládaný Valenční slovník českých sloves (též VALLEX 4.5) poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů; tyto údaje jsou doplněny o  další syntaktické a sémantické charakteristiky. VALLEX 4.5 zachycuje 4664 českých sloves, která odpovídají 11083 lexikálním jednotkám, tedy vždy „danému slovesu v daném významu“, sdruženým do 2772 lexémů (což odpovídá 6859 lexikálním jednotkám, sdruží-li se vidové protějšky do lexémů).

VALLEX 4.5 je rozšířeným vydáním VALLEXu 4.0, navazuje tak na vydání slovníku z roku 2008 (VALLEX 2.0) a 2016 (VALLEX 3.0). Ačkoli se počtem zpracovaných sloves příliš neliší od verze 2.0, od verze 3.0 se zásadně proměnila koncepce slovníku – model slovníku je uzpůsoben tak, aby umožňoval teoreticky adekvátně a přitom ekonomicky popisovat změny ve valenční struktuře českých sloves. Slovník nyní sestává ze dvou komponent: slovníková (datová) komponenta obsahuje lexikální hesla popisující valenční chování jednotlivých sloves, zatímco gramatická komponenta (představující část celkové gramatiky jazyka) obsahuje gramatická pravidla popisující možné změny v jejich valenční struktuře. Ve slovníku jsou reflektovány gramaticky podmíněné změny spojené s diatezemi, reciprocitou a reflexivitou. Slovník tak zachycuje nejen základové povrchověsyntaktické realizace lexikálních jednotek sloves (tedy aktivní, syntakticky nereciproční a nereflexivní konstrukce), ale též struktury příznakové (pasivní, syntakticky reciproční a reflexivní). Z lexikálně motivovaných změn jsou zde vyznačeny ty, které jsou spojeny se změnou lexikální jednotky téhož slovesa (např. typ naložit vůz senem – naložit seno na vůz). Dále jsou k lexikálním jednotkám doplněny příklady z Českého národního korpusu a z Pražského závislostního korpusu. VALLEX 3.5 přidává anotaci 1524 komplexních predikátů, tedy kombinací lexikální jednotky predikativního jména a jednotky kategoriálního slovesa.

VALLEX 4.0 nově zpracovává slovesa vyjadřující reflexivní a reciproční významy – jde jednak o slovesa, která tyto rysy obsahují ve svém lexikálním významu (nyní jde o 443 inherentně recipročních sloves v 337 lexikálních jednotkách), jednak o slovesa vyjadřující reciprocitu nebo reflexivitu pomocí specifických syntaktických konstrukcí (2751 lexikálních jednotek umožňujících vytvářet reciproční konstrukce a 2049 lexikálních jednotek umožňujících vytvářet reflexivní konstrukce). VALLEX 4.5 pak tyto informace rozšiřuje o charakteristiku reflexivních sloves, tedy sloves se slovotvorným morfémem se/si v lemmatu. Tato slovesa charakterizuje na základě syntakticko-sémantického vztahu k jejich nereflexivním protějškům. VALLEX 4.5 takto charakterizuje 1525 reflexivních sloves v 2501 lexikálních jednotkách (sdruží-li se vidové protějšky do lexémů, pak jde o 1545 lexikálních jednotek).

1  Poděkování

Za inspirativní poznámky, diskuse nad tématy souvisejícími s valencí sloves i lidskou podporu děkujeme především prof. Jarmile Panevové, autorce valenční teorie, ze které při popisu lexikálních hesel ve VALLEXu vycházíme. Naše díky náleží též ostatním kolegům, rodinám a přátelům. V neposlední řadě děkujeme recenzentům, doc. Martině Ivanové, dr. Elżbietě Kaczmarské a dr. Rolandu Wagnerovi, za kritické posouzení a zhodnocení průvodního textu, který byl publikován společně s verzí slovníku 3.0 a poté rozšířen o zásady popisu komplexních predikátů (VALLEX 3.5), sloves vyjadřujících reciprocitu a reflexivitu (VALLEX 4.0) a reflexivních sloves (VALLEX 4.5).

VALLEX je vytvářen od roku 2001 v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. Podílel se na něm původní výzkumný tým ve složení Markéta Lopatková, Václava Kettnerová a Zdeněk Žabokrtský, doplněný o další spolupracovníky, Eduarda Bejčka, Annu Vernerovou a Jiřího Mírovského. Děkujeme též našim spolupracovníkům, kteří se podíleli na přípravě starších verzí slovníku, a to především naší dlouholeté spolupracovnici Karolíně Skwarské, dále Kláře Hrstkové, Michaele Nové, Miroslavu Tichému, Petře Barančíkové a Martinu Rýparovi. Dále děkujeme autorům webového rozhraní Jiřímu Balharovi a Benediktu Straňákovi.

Při zpracovávání sloves ve slovníku VALLEX jsme využívali následující slovníky a korpusy českých textů:

1.1  Grantová podpora

Slovník VALLEX využívá jazykových zdrojů a nástrojů vyvinutých, uchovávaných a distribuovaných v rámci projektu MŠMT ČR Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy LINDAT/CLARIAH-CZ (LM2018101).3

Práce na tomto projektu byla částečně podpořena MŠMT ČR, projektem č. LM2018101 LINDAT/CLARIAH-CZ.

Práce na slovníku a jeho vydání byly též podpořeny projektem GA ČR Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině, GA P406-12-0557.4 Doprovodný text VALLEXu, verze 3.0, byl publikován jako součást knihy (Lopatková et al., 2016b) vydané nakladatelstvím Karolinum.5

Zpracování a anotace komplexních predikátů s kategoriálním slovesem (VALLEX 3.5) byla provedena v rámci projektu GAČR Kombinování slov: Syntaktické vlastnosti českých víceslovných výrazů s tzv. lehkými slovesy, GA 15-09979S.6

Slovesa vyjadřující či umožňující vyjadřovat reciproční a reflexivní významy (VALLEX 4.0) byla zpracována v rámci projektu GAČR Mezi reciprocitou a reflexivitou: syntaktická a lexikografická analýza českých recipročních konstrukcí, GA 18-03984S.7

2  Zpřístupnění slovníku

VALLEX je budován jako odpověď na potřebu rozsáhlého a kvalitního veřejně dostupného slovníku, který by obsahoval syntaktické a sémantické charakteristiky českých sloves a byl přitom široce uplatnitelný v aplikacích pro zpracování přirozeného jazyka. Při navrhování koncepce slovníku byl proto kladen důraz na všestranné využití jak pro lidského uživatele, tak pro automatické zpracování češtiny.

VALLEX je proto k dispozici ve třech formátech:

  • VALLEX 3.0 byl publikován jako tradiční tištěný slovník obsahující – mimo klasické slovníkové části – též teoretický úvod představující základní koncepční postupy uplatněné při budování slovníku, dále podrobný popis hesla; součástí publikace je též gramatická komponenta sestávající z bohatě exemplifikovaných formálních pravidel pro odvozování příznakových slovesných konstrukcí (Lopatková et al., 2016b).8

  • Jednotlivé verze VALLEXu jsou dostupné jako webové slovníky umožňující rychlé a pohodlné vyhledávání podle řady předdefinovaných kritérií.9

  • VALLEX 3.0, VALLEX 4.0 a VALLEX 4.5 je distribuován prostřednictvím repozitáře LINDAT/CLARIAH-CZ ve formě strojově čitelného souboru (XML a JSON formát), který umožňuje komplexní dotazy nad slovníkovými hesly i využití slovníku v nástrojích pro automatické zpracování češtiny.10

3  Citování slovníku

Slovník VALLEX je veřejně dostupný slovník pod licencí Creative Commons 4.0 (CC BY-NC-SA).11 Jeho nekomerční využití je podmíněno přiměřenou citací alespoň jedné z následujících publikací (případně dalších relevantních publikací uvedených na webové stránce projektu):12

  • (Lopatková et al., 2016b)
    Lopatková, M. – Kettnerová, V. – Bejček, E. – Vernerová, A. – Žabokrtský, Z. (2016): Valenční slovník českých sloves VALLEX. Praha, Karolinum.13

    @book{2016-vallex-book,
        author  = {Mark{\'{e}}ta Lopatkov{\'{a}} and V{\'{a}}clava Kettnerov{\'{a}}
                  and Eduard Bej{\v{c}}ek and Anna Vernerov{\'{a}} and Zden{\v{e}}k
                  {\v{Z}}abokrtsk{\'{y}}},
        title   = {Valen{\v{c}}n{\'{i}} slovn{\'{i}}k {\v{c}}esk{\'{y}}ch sloves 
                  {VALLEX}},
        year      = {2016},
        publisher = {Karolinum},
        address   = {Praha},
        pages     = {698},
        isbn      = {978-80-246-3542-2},
    }
    

  • (Kettnerová – Lopatková, 2019)
    Kettnerová, V. – Lopatková, M. (2019): Reflexives in Czech from a Dependency Perspective. In Gerdes, K. – Kahane, S. (eds.), Proceedings of the Fifth International Conference on Dependency Linguistics (Depling, Syntaxfest 2019), pp. 14-25, Paris, France, Association for Computational Linguistics.14

    @inproceedings{2019-depling-reflex,
        author       = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta 
                       Lopatkov{\'{a}}},
        title        = {{Reflexives in Czech from a Dependency Perspective}},
        booktitle    = {{Proceedings of the Fifth International Conference on 
                       Dependency Linguistics (Depling, Syntaxfest 2019)}},
        editor       = {Kim Gerdes and Sylvain Kahane},
        year         = {2019},
        publisher    = {Association for Computational Linguistics},
        address      = {Paris, France},
        pages        = {14--25},
        isbn         = {978-1-950737-63-5},
    }
    

  • (Kettnerová et al., 2021)
    Kettnerová, V. – Lopatková, M. – Vernerová, A. (2021): Reflexives in the VALLEX Lexicon: Syntactic Reflexivity and Reciprocity. The Prague Bulletin of Mathematical Linguistics. 117, pp. 27-60.15

    @article{2021-PBML-refl-recipr,
        author    = {V{'{a}}clava Kettnerov{'{a}} and Mark{'{e}}ta Lopatkov{'{a}} 
                    and Anna Vernerov{'{a}}},
        title     = {{Reflexives in the VALLEX Lexicon: Syntactic Reflexivity and 
                    Reciprocity}},
        journal   = {The Prague Bulletin of Mathematical Linguistics},
        year      = {2021},
        number    = {117},
        pages     = {27--60},
        issn      = {0032-6585},
    }
    

  • (Kettnerová et al., 2022)
    Kettnerová, V. – Lopatková, M. – Vernerová, A. (2022): Reflexives as Part of Verb Lexemes in the VALLEX Lexicon. The Prague Bulletin of Mathematical Linguistics. 119, pp. 37-66.16

    @article{2022-PBML-refl-recipr,
        author    = {V{'{a}}clava Kettnerov{'{a}} and Mark{'{e}}ta Lopatkov{'{a}} 
                    and Anna Vernerov{'{a}}},
        title     = {{Reflexives as Part of Verb Lexemes in the VALLEX Lexicon}},
        journal   = {The Prague Bulletin of Mathematical Linguistics},
        year      = {2022},
        number    = {119},
        pages     = {37--66},
        issn      = {0032-6585},
    }
    
    

  • (Kettnerová et al., 2018)
    Kettnerová, V. – Lopatková, M. – Bejček, E. – Barančíková, P. (2018): Enriching VALLEX with Light Verbs: From Theory to Data and Back Again. The Prague Bulletin of Mathematical Linguistics. 111, pp. 29-56.17

    @article{2018-pbml-lvc,
        author    = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}} 
                    and Eduard Bej{\v{c}}ek and Petra Baran{\v{c}}{\'{\i}}kov{\'{a}}},
        title     = {{Enriching {VALLEX} with Light Verbs: From Theory to Data and 
                    Back Again}},
        journal   = {The Prague Bulletin of Mathematical Linguistics},
        year      = {2018},
        number    = {111},
        pages     = {29--56},
        issn      = {0032-6585}
    }
    

  • (Kettnerová et al., 2012)
    Kettnerová, V. – Lopatková, M. – Bejček, E. (2012): The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon. In Fjeld, R. V. - Torjusen, J. M. (eds.), Proceedings of the 15th EURALEX International Congress, pp. 434-443, Oslo, Norway, Department of Linguistics and Scandinavian Studies, University of Oslo.18

    @inproceedings{2012-EURALEX,
        author    = {V{\'{a}}clava Kettnerov{\'{a}} and Mark{\'{e}}ta Lopatkov{\'{a}} 
                    and Eduard Bej{\v{c}}ek},
        title     = {The Syntax-Semantics Interface of Czech Verbs in the Valency 
                    Lexicon},
        booktitle = {Proceedings of the 15th {EURALEX} International Congress},
        editor    = {Ruth V. Fjeld and Julie M. Torjusen}, 
        year = {2012},
        publisher = {Department of Linguistics and Scandinavian Studies, University 
                    of Oslo},
        address   = {Oslo, Norway},
        pages     = {434--443},
    }
    

  • (Lopatková et al., 2022)
    Lopatková, M. – Kettnerová, V. – Mírovský, J. – Vernerová, A. – Bejček, E. – Žabokrtský, Z. (2022): VALLEX 4.5. LINDAT/CLARIAH-CZ Digital Library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University, Prague.19

    @misc{vallex-4-5-data,
        author    = {Mark{\'{e}}ta Lopatkov{\'{a}} and V{\'{a}}clava Kettnerov{\'{a}} 
                    and Ji{\v{r}}{\'{i}} M{\'{i}}rovsk{\'{y}} and Anna Vernerov{\'{a}} 
                    and Eduard Bej{\v{c}}ek and Zden{\v{e}}k {\v{Z}}abokrtsk{\'{y}}},
        title     = {{VALLEX} 4.5},
        year      = {2022},
        publisher = {{LINDAT}/{CLARIAH}-{CZ} Digital Library at the Institute of 
                    Formal and Applied Linguistics ({\'{U}}{FAL}), Faculty of 
                    Mathematics and Physics, Charles University},
        address   = {Prague},
        url       = {http://hdl.handle.net/11234/1-4756},
    }
    

4  Odborné publikace vztahující se k VALLEXu

Postupné budování VALLEXu je popsáno v řadě odborných publikací, jejich seznam lze nalézt na webové stránce projektu.20


Poznámky


Seznam literatury


Obsah