Šumava 11.-18.1.2003

 

předběžný návrh programu

 

Po

 

7:30-   8:30 snídaně

 

 

16:30-17:30

web         

Ota

18:00  večeře

20:00 "podivné jazyky" Ota

Út

7:30- 8:30 snídaně

16:00-17:30      

vyhledávání

Holub

18:00  večeře

20: 

promítání Dan

St

7:30-8:30 snídaně

16:00-16:30  Magda

16:30-17:00 Lucie

17:00-17:30  Veronika   

18:00    večeře

20:00

"jak psát   anglicky"  EH, JH

    Čt

7:30-8:30 snídaně

9:00-10:00 PDT JH

10:00-10:30  valence  Markéta

 

11:00-12:00    AR-TGR Alena, Vašek 

 

12:30 oběd

 

15:00-16:30

  

EH

 

17:00-17:45    arabština  Ota

18:00 večeře

20:00              PARTY

7:30-8:30 snídaně

9:00-10:00 Charniak

 

10:30-11:30

Heidi Fox

 

12:30 oběd

15:00 - …

hledání v PDT  (diskuse)

EH 

18:00   večeře

hraní

 

 

ANOTACE (pracovní názvy)

 

Otakar Smrž – Publikační databáze CKL/UFAL

 

Otakar Smrž et al. – Večer podivných jazyků

a) arabština     - od slunečních a mesíčních souhlásek ke kaligrafii

- odvozování a minimální nepravidelnost (vnitřní) flexe

- etymologické hříčky

b) čínština v příspěvku Dana Zemana

c) korejština    - hláskové písmo v okolním moři čínských znaků

- zdvořilostní stupně mluvy

- budoucí participium a stromy s větvemi jen zprava doleva

d) baltské jazyky Petra Homoly (?)

e) všechny jazyky Kirila Ribarova (?)

f) ...

 

Martin Holub: Konceptově orientované vyhledávání informaci a sémantické modely textu

V první části přednášky budou uvedeny principy a předpoklady konceptově orientovaného přístupu k vyhledávání informací v textech. Definujeme zobecněný vektorový model, který umožňuje redukovat dimenzi vektoru za účelem efektivního vyhledávání pomocí abstraktních znaků. Dál se budeme zabývat redukcí dimenze vektoru, přičemž uvedeme několik různých publikovaných přístupů a vlastní návrh hierarchického modelu založeného na opakované projekci vektoru do prostoru nižší dimenze.
Výzkumný projekt 'Sémantické modely textu', do něhož jsou zapojeni diplomanti a doktorandi UFALu, integruje využití automatických procedur pro analýzu morfologie a syntaxe češtiny, detekci signifikantních kolokací, lexikální disambiguaci, konstrukci sémanticky orientovaného slovníku, segmentaci textu na tematicky koherentní pasáže, shlukování podobných dokumentů a indexaci dokumentů za základě abstraktních konceptů. Projekt je zaměřen na plně automatickou konstrukci modelů, které umožní testovat sémantický obsah dokumentu. Cílem projektu je empirická evaluace zmíněných postupů a jejich kombinací.

 

Dan Zeman (promítání)

Tchaj-wan

týden v Tchaj-pej (konference, hlavní město)

potom okružní putování kolem ostrova (tři dny Dan+Alena+Klára, další dva a půl týdne bez Aleny): Je-liou, Ťiou-fen, Nan-fang-ao, Tchaj-lu-ke, Lü-tao, Kchen-ting, Kuan-šan, Tchaj-nan, Lu-ku, Lu-kang, Š'-tchou-šan, ..., Ams-ter-dam.

 

Magda Razímová – Německé tektogramatické stromy (???)

 

Lucie Kučová - Zachycování koreference v PDT a problémy s tím spojené

Po stručném uvedení do problematiky koreference (koreference gramatická vs. textová, její zachycování v PDT, ale i v jiných korpusech) přineseme současný pohled na dosud nejasné jevy a na možnosti jejich řešení (odkazování k hypertématu, k více antecedentům, ale také k postcedentům, problematika vztažných vedlejších vět aj.).

 

Veronika Řezníčková - Lemata doplněných uzlů v závislosti na typu koreferenčního vztahu (ve vz.s.)

Doplňování elidovaných obligatorních doplnění ve valenčních rámcích sloves, deverbativních substantiv a adjektiv ve vzorovém souboru úzce souvisí s problematikou koreference: lema doplněného uzlu by mělo reflektovat nejen typ dané elipsy, ale i koreferenční vztah daného uzlu k jeho případnému antecedentu (referentu). Dosavadní seznam možných lemat, pokrývající všechny jasné a zřetelné případy, rozšiřujeme o lema pro zachycení přechodného, vágního referenčního vztahu (Unsp(ecified)), velmi častého právě v reálných textech z korpusu.

 

Eva Hajičová, Jan Hajič - Jak psát anglicky (ale i česky)

 

Jan Hajič - Prague Dependency Treebank

 

Markéta Lopatková et al. – Valency in PDT and Valency Lecxicon

 

Alena Böhmová, Václav Hohetschlager – Semi-automatic tectogrammatical tagging

The tectogrammatical tree structure as a representation of a sentence in FGD. The automatic procedure preprocessing analytical tree structures (ATS) towards tectogrammatical tree structures (TGTS). The manual annotation. A valency dictionary and its incorporation into the process of TGTS annotation.

 

Eva Hajičová – Topic-Focus Articulation

 

Otakar Smrž – Prague Arabic Treebanking

 

Vyhledávání v PDT - diskuse (Eva Hajičová)

 

Eugen Charniak - Parsing Czech, Parsing English

 

Heidi Fox - Using English Parses For French-English Alignment