Matěj Korvas
Main Research Interests
semantic parsing
Projects
Vystadial
Vystadial je můj primární projekt. Vede ho Filip Jurčíček a pracujeme na něm s Lukášem Žilkou, Ondrou Duškem, Ondrou Plátkem a Davidem Markem. Za cíl si klademe vytvořit dialogový systém, tj. program, na který budete moci mluvit a on vám bude odpovídat.
Moje práce na projektu spočívá ve vývoji metod pro porozumění mluvené řeči. Zabývám se tedy zejména převodem z domény promluv do domény významů, resp. dialogových aktů. Také mám na starosti rozpoznání řeči.
ČLO – Česká lingvistická olympiáda
ČLO je momentálně ten z mých projektů, který má asi největší dopad. I když jsme ČLO založili teprve loni (2012), uvádím ji proto dříve než Pralinku. ČLO je lingvistická soutěž pro středoškoláky, podobně jako ostatní olympiády. Letos sestává ze školního kola (úlohy se zadají přímo na domácí škole každého účastníka) a kola národního (pár desítek nejúspěšnějších řešitelů školního kola sezveme do Prahy, kde dostanou další sadu úloh k řešení). Nejúspěšnější čtveřice řešitelů nakonec poputuje na IOL (Mezinárodní lingvistickou olympiádu) do Manchesteru.
Pralinka
Pralinka je již zavedený korespondenční seminář. Několikrát (4–5krát) do roka vydáme sešítek s lingvistickými úložkami, naši řešitelé z řad středoškoláků si nad nimi sednou a pošlou nám řešení některých z nich. My jim potom řešení opravíme a pošleme zpátky spolu s autorským řešením a zadáním nových úložek.
Takto se snažíme popularizovat lingvistiku mezi mládeží, abychom potom byli lingvisticky konkurenceschopní v mezinárodním měřítku. Viz výše odkaz na IOL.
Curriculum Vitae
Stručně o mně
Před rokem jsem dokončil studium v programu Erasmus Mundus v oboru Jazykové a komunikační technologie (EM LCT), v rámci nějž jsem se studijně podíval do Saarbrückenu a Melbourne. Nyní pracuji na dialogových systémech na Ústavu formální a aplikované lingvistiky (ÚFAL) v Praze.
Jsem jedním ze zakládajících organizátorů lingvistického korespondenčního semináře Pralinka a nedlouho i České lingvistické olympiády (ČLO).
Kromě odborných aktivit také pěstuji všelijaké koníčky: chození po horách, skálolezení, cestování obecně a taky lyžování, jezdění na jednokolce a šifrovačky. Občas taky hraju na klarinet.
Studium
Své magisterské studium (o něm více nahoře v úvodu) jsem nedávno zakončil touto diplomovou prací, pojmenovanou Extracting Characteristics of Human-produced Video Descriptions. Předtím jsem vystudoval bakalářský obor Informatika na MFF, zakončený touto bakalářskou prací, nazvanou Empirické meze vybraných modelů strojového překladu.
Teaching
List of classesNMIN102 Programování 2
Selected Bibliography
- Free English and Czech telephone speech corpus shared under the CC-BY-SA 3.0 license. In: Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014), pp. 4423-4427, European Language Resources Association, Reykjavík, Iceland, ISBN 978-2-9517408-8-4 (url, obd, bibtex)
- Correspondence Seminar: Bringing Linguistics to High Schools. In: Proceedings of the Fourth Workshop on Teaching NLP and CL, pp. 46-50, Association for Computational Linguistics, Stroudsburg, PA, USA, ISBN 978-1-937284-69-5 (pdf, obd, bibtex)
- Comparison of Bayesian Discriminative and Generative Models for Dialogue State Tracking. In: SIGDIAL '13: 14th Annual Meeting of the Special Interest Group on Discourse and Dialogue , pp. 452-457, The Association for Computational Linguistics, Stroudsburg, PA, USA, ISBN 978-1-937284-95-4 (url, obd, bibtex)