vallex 3.0

Práce na slovníku a jeho vydání byly podpořeny projektem GAČR P406-12-0557.
Tento text byl publikován jako součást knihy (Lopatková et al., 2016) vydané nakladatelstvím Karolinum.

Valenční slovník českých sloves (též VALLEX 3.0) poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů; tyto základní údaje jsou doplněny o některé další syntaktické a sémantické charakteristiky. VALLEX 3.0 zachycuje 4 586 českých sloves, která odpovídají 10 821 lexikálním jednotkám, tedy „danému slovesu v daném významu“.

VALLEX 3.0 navazuje na vydání slovníku z roku 2008 (Lopatková et al., 2008). Ačkoli se kvantitativně příliš neliší od předchozí verze 2.0, zásadně se proměnila jeho koncepce. Model slovníku byl uzpůsoben tak, aby umožňoval teoreticky adekvátně a přitom ekonomicky popisovat změny ve valenční struktuře českých sloves. Slovník nyní sestává ze dvou komponent: slovníková (datová) komponenta obsahuje lexikální hesla popisující valenční chování jednotlivých lexémů sloves, zatímco gramatická komponenta (představující část celkové gramatiky jazyka) obsahuje gramatická pravidla popisující možné změny v jejich valenční struktuře. Ve slovníku jsou reflektovány gramaticky podmíněné změny spojené s diatezemi, reciprocitou a reflexivitou. Slovník tak zachycuje nejen nepříznakové povrchověsyntaktické realizace lexikálních jednotek slovesných lexémů (aktivní, nereciproční a nereflexivní konstrukce), ale též struktury příznakové (pasivní, reciproční nebo reflexivní konstrukce). Z lexikálně motivovaných změn jsou zde vyznačeny ty změny, které jsou spojeny se změnou lexikální jednotky téhož slovesného lexému (např. typ naložit vůz senem – naložit seno na vůz). Dále jsou k lexikálním jednotkám VALLEXu doplněny příklady z Českého národního korpusu a z Pražského závislostního korpusu, slovník je též propojen se slovníkem PDT-Vallex.

Poděkování

Za inspirativní poznámky, diskuse nad tématy souvisejícími s valencí sloves i lidskou podporu děkujeme především prof. Jarmile Panevové, autorce valenční teorie, ze které při popisu lexikálních hesel ve VALLEXu vycházíme. Naše díky náleží též dlouholeté spolupracovnici Karolíně Skwarské, stejně jako ostatním kolegům, rodinám a přátelům.

VALLEX je vytvářen od roku 2001 v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. Podílel se na něm výzkumný tým ve složení Markéta Lopatková, Václava Kettnerová a Zdeněk Žabokrtský, doplněný o další spolupracovníky, Eduarda Bejčka a Annu Vernerovou. Děkujeme též našim spolupracovníkům, kteří se podíleli na přípravě starších verzí slovníku, a to Karolíně Skwarské, Kláře Hrstkové, Michaele Nové a Miroslavu Tichému. Dále děkujeme autorům nového webového rozhraní Jiřímu Balharovi a Benediktu Straňákovi.

Práce na slovníku VALLEX 3.0 a jeho vydání byly podpořeny projektem GAČR Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině, GA P406-12-0557. Doprovodný text byl publikován jako součást knihy (Lopatková et al., 2016) vydané nakladatelstvím Karolinum.

Při zpracovávání sloves ve slovníku VALLEX jsme využívali následující slovníky a korpusy českých textů:

Slovník dále využívá jazykových zdrojů zpracovaných a distribuovaných v rámci projektu MŠMT ČR LINDAT/CLARIN LM2015071.

Zpřístupnění slovníku

VALLEX je budován jako odpověď na potřebu rozsáhlého a kvalitního veřejně dostupného slovníku, který by obsahoval syntaktické a sémantické charakteristiky českých sloves a byl přitom široce uplatnitelný v aplikacích pro zpracování přirozeného jazyka. Při navrhování koncepce slovníku byl proto kladen důraz na všestranné využití jak pro lidského uživatele, tak pro automatické zpracování češtiny.

VALLEX je proto zveřejněn ve třech formátech:

Citování slovníku

Slovník VALLEX je veřejně dostupný slovník pod licencí Creative Commons 4.0 (CC BY-NC-SA). Jeho nekomerční využití je podmíněno přiměřenou citací alespoň jedné z následujících publikací (případně dalších relevantních publikací, viz odkaz níže):

Spolu s výše uvedenými je možné citovat také samotné data VALLEXu 3.0 přístupná na LINDATu:

Odborné publikace vztahující se k VALLEXu

Postupné budování VALLEXu je popsáno v řadě odborných publikacích, jejich seznam lze nalézt na webové stránce projektu.


Seznam literatury