Životopis Daniela Zemana
Osobní a rodinné údaje
Narozen: 21. prosince 1971, Praha
Ženatý od: 16. dubna 1999, Praha
Národnost: česká
Občanství: Česko
Umístění
ÚFAL MFF UK (Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta, Univerzita Karlova), Malostranské náměstí 25, Praha, CZ-11800
UMIACS UMD (Institute for Advanced Computer Studies, University of Maryland), 3161 A. V. Williams Building, College Park, MD 20742, USA
Vzdělání
- 2005, Univerzita Karlova (Charles University), Praha
- Získán titul RNDr. (doktor přírodních věd).
- 13.1.2005: Univerzita Karlova, Praha
- Obhájena doktorská disertační práce a získán titul Ph.D. v oboru matematická lingvistika
- 1999, květen - červenec: University of Pennsylvania, Philadelphia
(Pennsylvania, USA)
- Vědecký pobyt na IRCS (Institute
for Research in Cognitive Science).
Na pozvání profesora
Aravinda Joshiho
jsem společně s Anoopem
Sarkarem
pracoval na automatické extrakci valenčních rámců z Pražského
závislostního korpusu.
- 1998, červenec - srpen: Johns Hopkins University, Baltimore (Maryland,
USA)
- Účast na letním projektu Core
NLP Technology Applicable to Multiple Languages
v Center for Language and Speech Processing (Středisko
zpracování jazyka a řeči). Ústředním tématem projektu byly metody syntaktické
analýzy češtiny na počítači.
- 1997 až 2005: Univerzita Karlova, Praha
- Doktorandské studium matematické lingvistiky na Matematicko-fyzikální
fakultě. Téma doktorské disertační práce: Parsing with a Statistical Dependency Model. Vědecké zájmy: automatická syntaktická analýza přirozeného jazyka.
- 1990 až 1997: Univerzita Karlova, Praha
- Magisterské studium informatiky
na Matematicko-fyzikální fakultě. Řádné studium
ukončeno pátým ročníkem 2.10.1995. Diplomová práce a státní zkouška
v oboru matematická lingvistika; zkouška složena v červnu 1997 se známkou
výborně. Získán titul "magistr" (mgr.).
- 1986 až 1990: Akademické gymnázium, Praha
- Denní studium se zaměřením na programování. V roce 1990 ukončeno maturitou
z matematiky, programování, češtiny a němčiny (4× výborně).
- 1978 až 1986: Základní škola, Praha
- 1. a 2. třída: ZDŠ, Praha 8, Novoborská ulice;
3. až 8. třída: ZŠ, Praha 2, ulice Lidových milicí (dnes Legerova)
Pedagogické zkušenosti
- 2001-2002: Programování, cvičení pro 1. ročník informatiky
na Matematicko-fyzikální fakultě Univerzity Karlovy
- 2000-2005: Počítače a přirozený jazyk, seminář na Fakultě
jaderné a fyzikálně-inženýrské ČVUT
- 1999-2005: Počítačové zpracování
češtiny (od zimy 2003/2004 Počítačové zpracování přirozeného jazyka), přednáška a seminář na Matematicko-fyzikální fakultě
Univerzity Karlovy
Profesionální údaje
- 2006: University of Maryland, College Park.
- Příjemce Fulbright-Masarykova stipendia (leden až červenec), post-doc (červenec až prosinec). Projekt s Philipem Resnikem na University of Maryland, Institute for Advanced Computer Studies (UMIACS), Computational Linguistics & Information Processing.
- od 2000: Univerzita Karlova, Praha.
- Vědecký pracovník, Centrum komputační lingvistiky, od 2004 Ústav formální a aplikované lingvistiky.
Obor: syntaktická analýza češtiny pomocí statistických metod.
- 1995 až 1999: Olt s.r.o., Praha
- Po ukončení řádného studia na MFF UK jsem zahájil samostatnou výdělečnou
činnost jako autor počítačových programů. Od 25.9.1995 do 31.3.1999 jsem
spolupracoval s pražskou
softwarovou firmou Olt s.r.o. na programu pro oceňování nemovitostí,
ke kterému jsem vyvíjel vestavěný textový editor. (Vývoj
v C++ pro Windows NT)
- 1994: SSaG s.r.o., Praha
- Od 1.4.1994 do 30.11.1994 jsem pracoval při studiu jako programátor.
Ocenění
Publikace, přednášky, citace
Tuto část moc neudržuju, pořádný seznam publikací najdete zde.
- Daniel Zeman, Zdeněk Žabokrtský:
Improving Parsing Accuracy by Combining Diverse Dependency Parsers.
In: Proceedings of the International Workshop on Parsing Technologies (IWPT 2005).
Simon Fraser University, Vancouver, British Columbia, 2005.
(HTML (297 KB),
RTF (489 KB),
PDF (143 KB))
Citováno v:
- Václav Klimeš: Analytical and Tectogrammatical Analysis of a Natural Language (Ph.D. thesis).
Univerzita Karlova, Praha, 2006.
- Jiří Hana, Daniel Zeman:
Manual for Morphological Annotation, Revision for the Prague Dependency Treebank 2.0.
ÚFAL Technical Report No. 2005-27, 42 pages.
Univerzita Karlova, Praha, 2005.
(HTML (210 KB),
XML Docbook (205 KB),
PDF (492 KB))
Citováno v:
- Barbora Vidová Hladká, Ondřej Bojar, Jan Hajič, Jiří Hana, Jaroslava Hlaváčová, Jiří Mírovský, Jan Votrubec:
Průvodce Českým akademickým korpusem 1.0. Univerzita Karlova, Praha, 2006.
- Daniel Zeman:
Neprojektivity v Pražském závislostním korpusu (PDT).
CKL/ÚFAL Technical Report No. 2004-22, 35 pages.
Univerzita Karlova, Praha, 2004.
(HTML (442 KB),
RTF (721 KB),
PDF (302 KB))
- Daniel Zeman:
Parsing with a Statistical Dependency Model (PhD thesis).
Univerzita Karlova, Praha, 2004.
(available here)
Citováno v:
- Václav Klimeš: Analytical and Tectogrammatical Analysis of a Natural Language (Ph.D. thesis).
Univerzita Karlova, Praha, 2006.
- Keith Hall, Václav Novák: Corrective Modeling for Non-Projective Dependency Parsing. In: Proceedings of the Ninth International Workshop on Parsing Technologies (IWPT-05), pp. 42-52. The Association for Computational Linguistics, Vancouver, British Columbia, 2005.
- Eva Hajičová, Jiří Havelka, Petr Sgall, Kateřina Veselá, Daniel Zeman:
Issues of Projectivity in the Prague Dependency Treebank.
In: Prague Bulletin of Mathematical Linguistics, volume 81, pages 5-22. ISSN 0032-6585.
Univerzita Karlova, Praha, 2004.
(PDF (190 KB))
Citováno v:
- Keith Hall, Václav Novák: Corrective Modeling for Non-Projective Dependency Parsing. In: Proceedings of the Ninth International Workshop on Parsing Technologies (IWPT-05), pp. 42-52. The Association for Computational Linguistics, Vancouver, British Columbia, 2005.
- 2002, říjen:
Daniel Zeman:
How to Decrease Performance of a Statistical Parser.
In: Prague Bulletin of Mathematical Linguistics, volume 78, pages 53-62.
Univerzita Karlova, Praha, 2002.
(HTML (190 KB),
RTF (301 KB),
PostScript (1 MB))
- 2002, srpen, Coling:
Daniel Zeman:
Can Subcategorization Help a Statistical Dependency Parser?
In: Proceedings of the 19th International Conference on
Computational Linguistics
(Coling 2002).
Zhongyang Yanjiuyuan (Academia Sinica), Taibei, Tchaj-wan, 2002.
(HTML,
RTF,
PostScript)
Citováno v:
- Ondřej Bojar: Automatizovaná extrakce lexikálně
syntaktických údajů z korpusu (diplomová
práce). Univerzita Karlova, Praha, 2002.
- Péter Dienes: Statistical parsing with non-local
dependencies (PhD Dissertation). Saarbrücken Dissertations
in Computational Linguistics and Language Technology,
vol. 20. Universität des Saarlandes, Saarbrücken, 2005.
- 2001, 19. října: referát na konferenci
International Workshop on Parsing Technologies (IWPT) 2001, Beijing.
Název: How Much Will a RE-based Preprocessor Help a Statistical Parser?
Citováno v:
- Václav Klimeš: Analytical and Tectogrammatical Analysis of a Natural Language (Ph.D. thesis).
Univerzita Karlova, Praha, 2006.
- Ondřej Bojar: Automatizovaná extrakce lexikálně syntaktických údajů z korpusu (master thesis).
Univerzita Karlova, Praha, 2002.
- 2001: Parsing with Regular Expressions: A Minute to Learn, a Lifetime to Master.
In: Prague Bulletin of Mathematical Linguistics, volume 75, pages 29-37. Univerzita Karlova, Praha 2001.
Citováno v:
- Ondřej Bojar: Automatizovaná extrakce lexikálně syntaktických údajů z korpusu (diplomová práce). Univerzita Karlova, Praha, 2002.
- 2000, 1. srpna: referát na konferenci
Coling 2000, Saarbrücken. Název:
Automatic Extraction of Subcategorization Frames for Czech
(spoluautor: Anoop Sarkar; upravená verze referátu z Atén).
Citováno v:
- Anna Korhonen: Using Semantically Motivated Estimates to Help Subcategorization Acquisition. In: Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. Hong Kong, China, 2000.
- Anna Korhonen, Genevieve Gorrell, Diana McCarthy: Statistical Filtering and Subcategorization Frame Acquisition. In: Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. Hong Kong, China, 2000.
- Katia-Lîda Kermanidou, Manolis Maragoudakîs, Nikos Fakôtakîs, Geôrgios Kokkinakîs: Influence of Conditional Independence Assumption on Verb Subcategorization Detection. In: Václav Matoušek et al. (eds.): "Proceedings of TSD 2001" , Springer LNAI 2166, pp. 62-69. Železná Ruda, Czechia, 2001.
- Anna Korhonen: Subcategorization Acquisition (PhD thesis). Cambridge University, Cambridge, England, 2002.
- 2000, 31. května: referát na konferenci
LREC 2000, Athîna.
Název:
Learning Verb Subcategorization from Corpora: Counting Frame
Subsets (spoluautor: Anoop Sarkar).
- 1999, 29. července: referát na IRCS, Philadelphia. Název:
Learning Verb Subcategorization from Corpora.
- 1998, říjen: referát na semináři ÚFAL, Praha. Název: Co přinesl
seminář o počítačovém zpracování přirozeného jazyka na Johns Hopkins
University, Baltimore?
- 1998, září: prezentace formou posteru na konferenci
"Text, Speech and Dialogue",
Brno. Název: Parsing Czech with Statistics.
- 1998: Core Natural Language Processing Technology Applicable to Multiple
Languages. The Workshop 98 Final Report.
At: http://www.clsp.jhu.edu/ws98/projects/nlp/report/.
Spoluautoři: Jan Hajič, Eric Brill, Michael Collins, Barbora Hladká, Douglas
Jones, Cynthia Kuo, Lance Ramshaw, Oren Schwartz, Christoph Tillmann, Daniel
Zeman.
Center for Language and Speech Processing, Johns Hopkins University, Baltimore
(Maryland, USA).
Citováno v:
- Michael Collins: Head-Driven Statistical Models for Natural Language
Parsing (PhD Dissertation). University of Pennsylvania, Philadelphia,
1999.
- Barbora Hladká: Czech Language Tagging (PhD Dissertation).
Univerzita Karlova, Praha, 2000.
- Tomáš Holan: Nástroje pro vývoj závislostních analyzátorů přirozených jazyků s volným slovosledem (disertační práce).
Univerzita Karlova, Praha, 2001.
- Vladislav Kuboň: Problems of Robust Parsing of Czech (PhD Dissertation).
Univerzita Karlova, Praha, 2001.
- 1998, srpen: závěrečná prezentace výsledků letního projektu, Johns Hopkins
University, Baltimore (Maryland, USA). Název: A Parser Based on a
Statistical Model.
- 1998: A Statistical Approach to Parsing of Czech. In: Prague
Bulletin of Mathematical Linguistics, volume 69, pp. 29-37. Univerzita Karlova,
Praha.
Citováno v:
- Barbora Hladká: Czech Language Tagging (PhD Dissertation).
Univerzita Karlova, Praha, 2000.
- Péter Dienes: Statistical parsing with non-local
dependencies (PhD Dissertation). Saarbrücken Dissertations
in Computational Linguistics and Language Technology,
vol. 20. Universität des Saarlandes, Saarbrücken, 2005.
- 1998, červen: referát na konferenci "Week of Doctoral Students", Praha.
Název: Parsing Natural Languages: Statistical Methods.
- 1998, duben: referát na semináři ÚFAL, Praha. Název: Syntaktická
analýza češtiny: statistický přístup.
- 1997: Pravděpodobnostní model významových zápisů vět (diplomová
práce). Matematicko-fyzikální fakulta, Univerzita Karlova, Praha.
Citováno v:
- Markéta Straňáková: Homonymie předložkových skupin v češtině a možnost jejich automatického zpracování (disertační práce). Univerzita Karlova, Praha, 2001.
- Ondřej Bojar: Automatizovaná extrakce lexikálně syntaktických údajů z korpusu (diplomová práce). Univerzita Karlova, Praha, 2002.
Recenze
- Recenzent příspěvků na
COLING-ACL 2006 (sekce Syntaktická analýza),
Macquarie University, Sydney, Austrálie.
- Recenzent příspěvků na
COLING 2002 (sekce Syntaktická analýza),
Academia Sinica, Taibei, Taiwan.
- Recenzent příspěvků na
ACL 2002,
University of Pennsylvania, Philadelphia, Pennsylvania.
- Recenzent příspěvků na
ACL 1999,
University of Maryland, College Park, Maryland.
- Recenzent příspěvků na
EACL 1999,
Universitetet i Bergen, Bergen, Norsko.
Jazyky
- Němčina: dostatečná úroveň pro komunikaci. Učební kurzy již na základní
škole, studium na gymnáziu pak ukončeno maturitní zkouškou (výborně; 1990).
- Angličtina: dostatečná úroveň pro komunikaci. Státní jazyková škola (3
roky) a MFF UK, tam složena zkouška (výborně; 1993).
- Ruština: dostatečná úroveň pro komunikaci. 8 let na základní škole a na
gymnáziu.
- Španělština: skromné základy.
Programování
- Programovací jazyky:
- Perl, C++, Visual Basic
- Operační systémy:
- Windows, Linux
Zájmy
Cestování, vysokohorská turistika, vodní slalom; jazyky, počítače.
Reference
Doc. Jan Hajič
Ústav formální a aplikované lingvistiky
Matematicko-fyzikální fakulta
Univerzita Karlova
Malostranské náměstí 25
CZ-11800 Praha
Czechia
tel. +420-221-914-257
hajic -at- ufal -dot- mff -dot- cuni -dot- cz
Prof. Frederick Jelinek
Center for Language and Speech Processing
Johns Hopkins University
Barton Hall
3400 North Charles Street
Baltimore, MD 21218
USA
tel. +1-410-516-7730
jelinek -at- jhu -dot- edu
Prof. Philip Resnik
Institute for Advanced Computer Studies
University of Maryland
3143 A. V. Williams Building
College Park, MD 20742
USA
tel. +1-301-405-6760
resnik -at- umiacs -dot- umd -dot- edu