Monday, November 19, 2018 - 13:30
Room: 

Lexikální databáze víceslovných jednotek v češtině

Milena Hnátková, Tomáš Jelínek, Marie Kopřivová, Vladimír Petkevič, Alexandr Rosen, Hana Skoumalová, Pavel Vondřička (FF UK)

Výklad se zaměří na:

(a) komplexní typologii víceslovných jednotek v češtině (VLJ)
(b) lexikální databázi obsahující VLJ charakterizované na základě této typologie

Typologie a databáze jsou motivovány těmito faktory:

(i) Typologie/klasifikace VLJ představuje podstatnou součást lingvistického modelu jazyka, neboť zachycují různé zvláštnosti a idiosynkrasie jazyka (zde češtiny) oproti standardním gramatickým a sémantickým pravidlům a strukturám. Typologie VLJ má též význam teoretický, neboť VLJ jsou zajímavé jazykové útvary na pomezí slovníku a gramatiky.

(ii) VLJ, formálně přesně popsané v lexikální databázi, přispějí ke zlepšení výsledků počítačového zpracování přirozeného jazyka, konkrétně morfologického značkování, parsingu, značkování lexikálních významů, případně i anotace sémantické. Zlepšení se přitom netýkají jen VLJ samých, ale i jejich kontextu ve větě.

(iii) VLJ zachycené v lexikální databázi bude možné značkovat a rozpoznávat v korpusech češtiny, a to nejen v jejich standardní, kanonické podobě, ale i v podobě jejich fragmentů a variant, zvláště na rovině morfologické, syntaktické a lexikální. Chceme tak zachytit kreativitu uživatelů jazyka, jež se odráží v různých druzích modifikacích standardních VLJ.

Lexikální databáze se dá mimoto použít v lexikografii, při výuce češtiny jako cizího jazyka apod.