Šumava 11.-18.1.2003
předběžný návrh programu
Po |
7:30- 8:30 snídaně |
|
|
16:30-17:30
web Ota |
18:00 večeře |
20:00
"podivné jazyky" Ota |
|||||||
Út |
7:30-
8:30 snídaně |
16:00-17:30 vyhledávání Holub |
18:00 večeře |
20: promítání
Dan |
|||||||||
St |
7:30-8:30
snídaně |
16:00-16:30 Magda |
16:30-17:00
Lucie |
17:00-17:30 Veronika |
18:00 večeře |
20:00 "jak
psát anglicky" EH, JH |
|||||||
Čt |
7:30-8:30
snídaně |
9:00-10:00
PDT JH |
10:00-10:30 valence
Markéta |
|
11:00-12:00 AR-TGR Alena, Vašek |
12:30
oběd |
15:00-16:30
AČ EH |
|
17:00-17:45 arabština Ota |
18:00
večeře |
20:00 PARTY |
||
Pá |
7:30-8:30
snídaně |
9:00-10:00
Charniak |
|
10:30-11:30 Heidi
Fox |
12:30
oběd |
15:00
- … hledání
v PDT (diskuse) EH |
18:00 večeře |
hraní |
|||||
Otakar Smrž et al. – Večer
podivných jazyků
a) arabština - od slunečních a mesíčních souhlásek ke kaligrafii
- odvozování a minimální nepravidelnost (vnitřní) flexe
- etymologické hříčky
b) čínština v příspěvku Dana Zemana
c) korejština - hláskové písmo v okolním moři čínských znaků
- zdvořilostní stupně mluvy
- budoucí participium a stromy s větvemi jen zprava doleva
d) baltské jazyky Petra Homoly (?)
e) všechny jazyky Kirila Ribarova (?)
f) ...
Martin Holub: Konceptově
orientované vyhledávání informaci a sémantické modely textu
V první části přednášky budou uvedeny
principy a předpoklady konceptově orientovaného přístupu k vyhledávání
informací v textech. Definujeme zobecněný vektorový model, který umožňuje
redukovat dimenzi vektoru za účelem efektivního vyhledávání pomocí abstraktních
znaků. Dál se budeme zabývat redukcí dimenze vektoru, přičemž uvedeme několik
různých publikovaných přístupů a vlastní návrh hierarchického modelu založeného
na opakované projekci vektoru do prostoru nižší dimenze.
Výzkumný
projekt 'Sémantické modely textu', do něhož jsou zapojeni diplomanti a
doktorandi UFALu, integruje využití automatických procedur pro analýzu morfologie
a syntaxe češtiny, detekci signifikantních kolokací, lexikální disambiguaci,
konstrukci sémanticky orientovaného slovníku, segmentaci textu na tematicky
koherentní pasáže, shlukování podobných dokumentů a indexaci dokumentů za
základě abstraktních konceptů. Projekt je zaměřen na plně automatickou
konstrukci modelů, které umožní testovat sémantický obsah dokumentu. Cílem
projektu je empirická evaluace zmíněných postupů a jejich kombinací.
Dan Zeman (promítání)
Tchaj-wan
týden v Tchaj-pej (konference, hlavní město)
potom okružní putování kolem ostrova (tři dny Dan+Alena+Klára, další dva a půl týdne bez Aleny): Je-liou, Ťiou-fen, Nan-fang-ao, Tchaj-lu-ke, Lü-tao, Kchen-ting, Kuan-šan, Tchaj-nan, Lu-ku, Lu-kang, Š'-tchou-šan, ..., Ams-ter-dam.
Magda Razímová – Německé tektogramatické stromy (???)
Po stručném uvedení do problematiky koreference (koreference gramatická vs. textová, její zachycování v PDT, ale i v jiných korpusech) přineseme současný pohled na dosud nejasné jevy a na možnosti jejich řešení (odkazování k hypertématu, k více antecedentům, ale také k postcedentům, problematika vztažných vedlejších vět aj.).
Veronika Řezníčková - Lemata doplněných uzlů v závislosti
na typu koreferenčního vztahu (ve vz.s.)
Doplňování elidovaných obligatorních doplnění ve valenčních rámcích sloves, deverbativních substantiv a adjektiv ve vzorovém souboru úzce souvisí s problematikou koreference: lema doplněného uzlu by mělo reflektovat nejen typ dané elipsy, ale i koreferenční vztah daného uzlu k jeho případnému antecedentu (referentu). Dosavadní seznam možných lemat, pokrývající všechny jasné a zřetelné případy, rozšiřujeme o lema pro zachycení přechodného, vágního referenčního vztahu (Unsp(ecified)), velmi častého právě v reálných textech z korpusu.
Eva Hajičová, Jan Hajič - Jak psát anglicky (ale i česky)
Jan Hajič - Prague Dependency Treebank
Markéta Lopatková et al. – Valency in PDT and Valency
Lecxicon
Alena Böhmová, Václav Hohetschlager – Semi-automatic
tectogrammatical tagging
The tectogrammatical tree structure as a representation of a
sentence in FGD. The automatic procedure preprocessing analytical tree
structures (ATS) towards tectogrammatical tree structures (TGTS). The manual
annotation. A valency dictionary and its incorporation into the process of TGTS
annotation.
Eva Hajičová – Topic-Focus Articulation
Otakar Smrž – Prague Arabic Treebanking
Vyhledávání v PDT - diskuse (Eva Hajičová)
Eugen Charniak - Parsing Czech, Parsing English
Heidi Fox - Using English Parses For French-English
Alignment