vallex 3.5

Předkládaný Valenční slovník českých sloves (též VALLEX 3.5) poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů; tyto základní údaje jsou doplněny o některé další syntaktické a sémantické charakteristiky. VALLEX 3.5 zachycuje 4 615 českých sloves, která odpovídají 10 902 lexikálním jednotkám, tedy vždy „danému slovesu v daném významu“.

VALLEX 3.5 je rozšířeným vydáním VALLEXu 3.0, oba tak navazují na vydání slovníku z roku 2008 (Lopatková et al., 2008). Ačkoli se kvantitativně příliš neliší od předchozí verze 2.0, zásadně se proměnila koncepce slovníku -- model slovníku byl uzpůsoben tak, aby umožňoval teoreticky adekvátně a přitom ekonomicky popisovat změny ve valenční struktuře českých sloves. Slovník nyní sestává ze dvou komponent: slovníková (datová) komponenta obsahuje lexikální hesla popisující valenční chování jednotlivých lexémů sloves, zatímco gramatická komponenta (představující část celkové gramatiky jazyka) obsahuje gramatická pravidla popisující možné změny v jejich valenční struktuře. Ve slovníku jsou reflektovány gramaticky podmíněné změny spojené s diatezemi, reciprocitou a reflexivitou. Slovník tak zachycuje nejen nepříznakové povrchověsyntaktické realizace lexikálních jednotek slovesných lexémů (aktivní, nereciproční a nereflexivní konstrukce), ale též struktury příznakové (pasivní, reciproční a reflexivní konstrukce). Z lexikálně motivovaných změn jsou zde vyznačeny ty, které jsou spojeny se změnou lexikální jednotky téhož slovesného lexému (např. typ naložit vůz senem – naložit seno na vůz). Dále jsou k lexikálním jednotkám VALLEXu doplněny příklady z Českého národního korpusu a z Pražského závislostního korpusu, slovník je též propojen se slovníkem PDT-Vallex. VALLEX 3.5 navíc přidává anotaci 1 500 komplexních predikátů, tedy kombinací lexikální jednotky predikativního jména a jednotky kategoriálního slovesa.

Poděkování

Za inspirativní poznámky, diskuse nad tématy souvisejícími s valencí sloves i lidskou podporu děkujeme především prof. Jarmile Panevové, autorce valenční teorie, ze které při popisu lexikálních hesel ve VALLEXu vycházíme. Naše díky náleží též ostatním kolegům, rodinám a přátelům. V neposlední řadě děkujeme recenzentům, doc. Martině Ivanové, dr. Elżbietě Kaczmarské a dr. Rolandu Wagnerovi, za kritické posouzení a zhodnocení textu.

VALLEX je vytvářen od roku 2001 v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. Podílel se na něm původní výzkumný tým ve složení Markéta Lopatková, Václava Kettnerová a Zdeněk Žabokrtský, doplněný o další spolupracovníky, Eduarda Bejčka, Annu Vernerovou a Petru Barančíkovou. Děkujeme též našim spolupracovníkům, kteří se podíleli na přípravě starších verzí slovníku, a to především naší dlouholeté spolupracovnici Karolíně Skwarské, dále Kláře Hrstkové, Michaele Nové a Miroslavu Tichému. Dále děkujeme autorům nového webového rozhraní Jiřímu Balharovi a Benediktu Straňákovi.

Při zpracovávání sloves ve slovníku VALLEX jsme využívali následující slovníky a korpusy českých textů:

Tato práce využívá jazykových zdrojů zpracovaných a distribuovaných v rámci projektu MŠMT ČR LINDAT/CLARIN LM2015071.

Práce na slovníku a jeho vydání byly podpořeny projektem GAČR Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině, GA P406-12-0557. Doprovodný text VALLEXu, verze 3.0, byl publikován jako součást knihy (Lopatková et al., 2016) vydané nakladatelstvím Karolinum.

Zpracování a anotace komplexních predikátů s kategoriálním slovesem byla provedena v rámci projektu GAČR Kombinování slov: Syntaktické vlastnosti českých víceslovných výrazů s tzv. lehkými slovesy, GA 15-09979S.

Zpřístupnění slovníku

VALLEX je budován jako odpověď na potřebu rozsáhlého a kvalitního veřejně dostupného slovníku, který by obsahoval syntaktické a sémantické charakteristiky českých sloves a byl přitom široce uplatnitelný v aplikacích pro zpracování přirozeného jazyka. Při navrhování koncepce slovníku byl proto kladen důraz na všestranné využití jak pro lidského uživatele, tak pro automatické zpracování češtiny.

VALLEX je proto zveřejněn ve třech formátech:

Citování slovníku

Slovník VALLEX je veřejně dostupný slovník pod licencí Creative Commons 4.0 (CC BY-NC-SA). Jeho nekomerční využití je podmíněno přiměřenou citací alespoň jedné z následujících publikací (případně dalších relevantních publikací, viz odkaz níže):

Odborné publikace vztahující se k VALLEXu

Postupné budování VALLEXu je popsáno v řadě odborných publikacích, jejich seznam lze nalézt na webové stránce projektu.


Seznam literatury