Zkušební okruhy pro program P4I3 Matematická lingvistika
Exam topics for program P4I3A Computational Linguistics
Zkouška se skládá ze dvou částí. V první části uchazeč představí výsledky své dosavadní rešeršní a výzkumné práce v návaznosti na téma zadané doktorské disertační práce. Ve druhé části jsou kladeny otázky ze tří okruhů. Okruh 1 je povinný. Ze zbývajících osmi okruhů uchazeč volí dva (všechny kombinace jsou možné).
The exam composes of two parts. In the first part, students summarize state of the art and present main outcomes of their own research related to the topics of their theses. In the second part, each student is examined on three exam topics. Topic 1 is obligatory, and then the student chooses two out of the remaining eight topics (any combination is possible).
Note 1: All students are supposed to possess (at least) basic knowledge of the items in the obligatory topic.
Note 2: Passing the particular courses listed below the exam topics is not required before the state exam (unless stated in the individual study plan). Students can gain knowledge of the items in any other way (from other literature, on-line courses, research papers etc.).
Note 3: Students can study only those parts (chapters, sections) of the recommended literature that are relevant for the listed items, not necessarily the whole books. Or, again, they can gain equivalent knowledge in other ways.
Povinný okruh • Obligatory exam topic
Okruh 1 - Společný základ • Exam topic 1 - Common basics
-
Otázky:
- Typy úloh a aplikací v počítačovém zpracování přirozeného jazyka • Basic tasks and applications of Natural Language Processing [tagging, parsing, WSD, MWE, NER/NED, SRL, IR/IE, MT, generování, ASR, TTS]
- Základy pravděpodobnosti, jazykové modelování • Basic notions in probability, language modeling
- Základní pojmy řízeného a neřízeného strojového učení • Basic notions in supervised and unsupervised machine learning
- Výpočetní model neuronových sítí • Computational model of artificial neural networks [graph structure, activation functions, output functions]
- Základy teorie grafů • Basic notions in graph theory
- Automaty a gramatiky, Chomského hierarchie • Automata, formal grammars, Chomsky hierarchy
- Popis jazykového systému jako souboru rovin • Levels of language description
- Základní pojmy lexikologie • Basic notions in lexicology [multiword expressions, proper names and related phenomena (named entities); the relation between lexicology and lexicography]
- Základní pojmy jazykové typologie • Basic notions in language typology
- Korpusy, klasifikační kritéria • Language corpora, basic types [psané vs. mluvené; synchronní vs. diachronní; korpusy reprezentativní, vyvážené; jednojazyčné, paralelní, srovnatelné (comparable); žákovské (learner corpora)]
- Principy lingvistické anotace • Linguistic annotation principles [konstrukce anotačního schématu, volba dat, volba podkladové teorie, řízení anotačního procesu]
- Morfologická anotace • Morphological annotation [lemmata, morfologické kategorie, sady značek]
- Syntaktická anotace (složkové a závislostní korpusy) • Syntactic annotation (constituency and dependency treebanks) [příklady treebanků: Penn Treebank, Pražský závislostní korpus]
- Paralelní korpusy • Parallel corpora [zdroje paralelních textů, typy a metody zarovnání]
- Specializované korpusy • Specialized corpora [pojmenované entity, sentiment, koreference, dialogové korpusy]
- Lexikální zdroje (slovníky, ontologie ad.) • Lexical resources (dictionaries, ontologies etc.)[pro flektivní i derivační morfologii, valenční slovníky, ontologie a wordnety; počítačová lexikografie]
- Zásady využívání dat při vyhodnocování experimentů, užití základních evaluačních měr, měření mezianotátorské shody • Basic principles of using data for experiment evaluation, basic evaluation measures, inter-annotator agreement [Cohenova kappa]
- Vyhledávání v jazykových datech • Search in language data [příklady dotazovacích jazyků a nástrojů]
- Základní doporučená literatura:
- Manning C. D., Schuetze, H.: Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, 1999.
- Lüdeling, A., Kytö, M.: Corpus Linguistics: an International Handbook, Volume 1. W. de Gruyter, 2008
- Ide, N., Pustejovsky, J. (eds.): Handbook of Linguistic Annotation. Springer, 2017.
- Pokrývající předměty:
- NPFL124 Zpracování přirozeného jazyka
- NPFL067 Statistical Methods in Natural Language Processing I
- NPFL070 Language Data Resources
- NPFL054 Úvod do strojového učení
Volitelné okruhy pro komputační zaměření • Optional exam topics for computational specialization
Okruh 2 - Základní statistické metody a strojové učení ve zpracování přirozeného jazyka • Exam topic 2 - Basic statistical and machine learning approaches to Natural Language Processing
-
Otázky:
- Pravděpodobnostní přístup ke zpracování jazyka • Probabilistic Natural Language Processing
- Jazykové modely, vyhlazování • Language models, smoothing
- Model šumového kanálu • Noisy channel model
- Metody řízeného učení (lineární regrese, logistická regrese, rozhodovací stromy, perceptron, metoda podpůrných vektorů, K nejbližších sousedů ad.) • Supervised machine learning (linear regression, logistic regression, decision trees, perceptron, Support Vector Machines, K nearest neighbors etc.)
- Kernelové metody • Kernel methods
- Metody neřízeného učení (shluková analýza, EM ad.) • Unsupervised machine learning (clustering, Expectation-Maximization)
- Skryté Markovovy modely (algoritmy Baum–Welch, Forward–Backward, Viterbi) • Hidden Markov Models (Baum–Welch, Forward–Backward, and Viterbi algorithms)
- Algoritmy pro statistický tagging • Algorithms for statistical tagging
- Algoritmy pro složkový a závislostní statistický parsing • Algorithms for constituency and dependency statistical parsing
- Statistický strojový překlad • Statistical machine translation
- Základy neuronových sítí pro využití v počítačovém zpracování jazyka • Basic notions of neural networks in Natural Language Processing
- Testy signifikance • Significance tests
- Základní doporučená literatura:
- Manning C. D., Schuetze, H.: Foundations of Statistical Natural Language Processing. MIT Press, Cambridge, 1999.
- Jurafsky, D. and J. H. Martin: Speech and Language Processing. Prentice-Hall, 2nd edition. 2009.
- Bishop, C.: Pattern Recognition and Machine Learning. Springer, 2007.
- Pokrývající předměty:
- NPFL067 Statistical Methods in Natural Language Processing I
- NPFL068 Statistical Methods in Natural Language Processing II
Okruh 3 - Pokročilé strojové učení • Exam topic 3 - Advanced Machine Learning
-
Otázky:
- Trénování neuronových sítí • Training ANNs [backpropagation, MLE principle and derivation of NLL and MSE losses, SGD, momentum, Nesterov momentum, algorithms with adaptive learning rates – AdaGrad, RMSProp, Adam]
- Regularizace neuronových sítí • Regularization methods for ANNs [L2, Dropout, Batch Normalization, Layer Normalization]
- Konvoluční sítě • Convolutional networks [convolution operation with stride, pooling, ResNet]
- Rekurentní sítě • Recurrent networks [sequence classification, bidirectional, sequence generation, encoder-decoder, LSTM, GRU]
- Distribuované reprezentace a embeddingy slov • Distributed representations and word embeddings [underlying principle, overcoming curse of dimensionality, word2vec, character-level embeddings (using RNNs, CNNs or character n-grams)]
- Architektury pro zpracování přirozeného jazyka • Architectures for natural language processing [sequence labeling, span labeling, CTC loss, Transformer architecture]
- Generativní modelování textu a obrázků • Generative modeling of text and images [VAE, GAN, AAE]
- Zpětnovazební učení • Reinforcement learning [basic settings (multi-arm bandits, Markov decision process), action-value-based methods (Monte Carlo, temporal-difference methods like Q learning and SARSA), policy gradient methods (REINFORCE, REINFORCE with baseline, actor-critic), Monte Carlo tree search (AlphaZero-style)]
- Optimalizace diskrétních latentních proměnných • Discrete latent variable optimization [REINFORCE, straight-through Gumbel-Softmax estimator, Neural architecture search]
- Bayesovská inference • Bayesian inference [Dirichlet process, Pitman-Yor process]
- Metody typu Markov Chain Monte Carlo • Markov Chain Monte Carlo methods [Gibbs sampling, Metropolis-Hastings sampling]
- Základní doporučená literatura:
- Ian Goodfellow and Yoshua Bengio and Aaron Courville: Deep Learning. MIT Press, 2016.
- Richard, S. Sutton and Andrew G. Barto: Reinforcement Learning: An Introduction (Second Edition). MIT Press, Cambridge, MA, 2018.
- Murphy, K.: Machine Learning: a Probabilistic Perspective. MIT Press, 2012.
- Rozšiřující literatura:
- Goldberg, Y.: Neural Network Methods for Natural Language Processing. Morgan & Claypool Publishers, 2017
- Gábor Melis, Chris Dyer, Phil Blunsom: On the State of the Art of Evaluation in Neural Language Models. https://arxiv.org/abs/1707.05589
- Alireza Makhzani et al.: Adversarial Autoencoders. https://arxiv.org/abs/1511.05644
- Dani Yogatama et al.: Learning to Compose Words into Sentences with Reinforcement Learning. https://arxiv.org/abs/1611.09100
- Barret Zoph, Quoc V. Le: Neural Architecture Search with Reinforcement Learning. https://arxiv.org/abs/1611.01578
- David Silver et al.: A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play. https://doi.org/10.1126/science.aar6404
- Pokrývající předměty:
- NPFL114 Deep Learning
- NPFL122 Deep Reinforcement Learning
- NPFL097 Selected Problems in Machine Learning
Okruh 4 - Strojový překlad • Exam topic 4 - Machine Translation
-
Otázky:
- Úloha strojového překladu (obtížnost MT, prostor správných a nesprávných překladů, víceznačnost a vágnost, mezivětné vztahy) • The task of machine translation (MT complexity, space of correct and incorrect translations, ambiguity and vagueness, document-level aspects)
- Vyhodnocování překladu (ruční, automatické; proti referenci, bez reference) • MT evaluation (manual, automatic; reference-based, reference-free)
- Data pro strojový překlad (zarovnání dokumentů, vět, slov a jiných jednotek, modely IBM) • Data for machine translation (alignment of documents, sentences, words and other translation units)
- Klasický statistický strojový překlad (frázový překlad a další metody používající překladové jednotky) • Classical statistical MT (phrase-based MT and other methods relying on translation units) [PBMT, Hiero, Syntax-based MT]
- Heuristické přístupy (transfer-based MT, hybridní překlad) • Heuristic approaches (transfer-based MT, hybrid methods)
- Neuronový strojový překlad (architektury, vztah diskrétní a spojité reprezentace výrazů přirozeného jazyka) • Neural MT (architectures, relation between discrete and continuous representation of natural language expressions)
- Pokročilé metody (multi-task, multi-lingual MT, ad.) • Advanced methods (multi-task, multi-lingual MT, etc.) [tj. to, co zrovna bude aktuální, např. reinforcement pro NMT]
- Formální popis jazyka pro překlad (morfologie a syntax v překladu) • Formal description of natural languages for MT (morphology and syntax in MT) [obecně, ale i specificky, jak je zapojováno do SMT a v NMT]
- Počítačem podporovaný překlad (CAT, TM, inkrementální překlad) • Computer-assisted translation (technologies, TM, incremental translation)
- Základní doporučená literatura:
- Philipp Koehn: Statistical Machine Translation. Cambridge University Press New York, 2010
- Philip Williams, Rico Sennrich, Matt Post, Philipp Koehn: Syntax-based Statistical Machine Translation. Morgan & Claypool Publishers, 2016.
- Goldberg, Y.: Neural Network Methods for Natural Language Processing. Morgan & Claypool Publishers, 2017
- Rozšiřující literatura:
- Ondřej Bojar: Čeština a strojový překlad. ÚFAL, 2012.
- Pokrývající předměty:
- NPFL087 Statistical Machine Translation
- NPFL116 Compendium of Neural Machine Translation
Okruh 5 - Vyhledávání informací • Exam topic 5 - Information Retrieval
-
Otázky:
- Booleovský model • Boolean model
- Invertovaný index, komprese indexu • Inverted index, index compression
- Tolerantní vyhledávání • Tolerant retrieval
- Oprava pravopisných chyb • Spelling correction
- Vektorový model • Vector space model
- Evaluace a benchmarky • Evaluation and benchmarks
- Metody zpětné vazby, rozšiřování dotazů • Relevance feedback, query expansion
- Pravděpodobnostní modely • Probabilistic models
- Jazykové modely • Language models
- Klasifikace dokumentů • Document classification
- Learning to rank • Learning to rank
- Shlukování dokumentů • Document clustering
- Latentní sémantické indexování • Latent Semantic Indexing
- Základní doporučená literatura:
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze: Introduction to Information Retrieval. Cambridge University Press, 2008.
- Charu Aggarwal, Chengxiang Zhai: Mining Text Data. Springer, 2012
- David A. Grossman, Ophir Frieder: Information Retrieval, Algorithms and Heuristics. Springer, 2004.
- Pokrývající předměty:
- NPFL103 Information Retrieval
Okruh 6 - Zpracování mluvené řeči a dialogové systémy • Exam topic 6 - Speech Processing and Dialogue Systems
-
Otázky:
- Modelování akustiky fonému • Phonetic acoustic modelling
- Implementace Baum-Welch a Viterbi algoritmu pro rozpoznáváni řeči • Baum-Welch and Viterbi algorithms for speech recognition
- Adaptační techniky • Adaptation techniques[Speaker/language domain adaptation]
- Metody syntézy řeči • Text-to-speech synthesis
- Dialogové systémy • Dialogue Systems [types of dialogue systems: open/closed domain, task-oriented/non-task-oriented, their applications (phone systems, smartphone assistants,...), turn-taking, chatbots, ELIZA, AIML, information retrieval based bots (Cleverbot), sequence-to-sequence]
- Základní komponenty dialogového systému • Basic dialogue system components [ASR, NLU, state tracking, dialogue management, NLG, TTS; dialog acts; knowledge graphs; Visual dialogue and multimodal systems]
- Stav dialogu, řízení dialogu • Dialogue State, dialogue management [Bayesian dialogue state/belief state representation, handcrafted dialogue management, POMDP dialogue policy representation, reinforcement learning for policy optimization, user simulation]
- Porozumění mluvené řeči • Language understanding [Dialogue act classification from speech inputs (n-best)]
- Generování promluvy • Response generation [Natural language generation in dialogue: template and rule-based approaches, content/sentence planning and surface realization, data-driven NLG: overgenerate and rank, neural-network-based NLG]
- Neuronové dialogové systémy • Neural dialogue systems [End-to-end neural architectures]
- Hodnocení kvality dialogových systémů • Dialogue system evaluation [Crowdsourcing, task completion rate, user satisfaction, dialogue efficiency (time, turns), dialogue quality (errors, overlaps)]
- Základní doporučená literatura:
- Jurafsky, D. and J. H. Martin: Speech and Language Processing. Prentice-Hall, 2nd edition. 2009.
- Yu, D., Deng, L.: Automatic Speech Recognition: A Deep Learning Approach. Signals and Communication Technology, Springer London, 2014.
- Gao, J., Galley, M., Li, L.: Neural Approaches to Conversational AI. Foundations and Trends in Information Retrieval, Vol. 13, No. 2-3, pp 127-298. 2019.
- Rozšiřující literatura:
- Jelinek, F.: Statistical Methods for Speech Recognition. MIT Press, 1997.
- Huang, X., Acero, A., Hon, H.: Spoken Language Processing. Prentice-Hall, 2001.
- Lemon, O., Pietquin, O.: Data-Driven Methods for Adaptive Spoken Dialogue Systems: Computational Learning for Conversational Interfaces. Springer, Springer New York, 2012.
- Pieraccini, R., Suendermann, D.: Data-Driven Methods in Industrial Spoken Dialog Systems. In Data-Driven Methods for Adaptive Spoken Dialogue Systems (pp. 151-171). Springer New York, 2012.
- Psutka, J., Müller, L., Matoušek, J., Radová, V.: Mluvíme s počítačem česky. Academia, 2006.
- Pokrývající předměty:
- NPFL038 Základy rozpoznávání a generování mluvené řeči
- NPFL079 Algorithms in Speech Recognition
- NPFL099 Statistické dialogové systémy
- NPFL123 Dialogové systémy
Volitelné okruhy pro lingvistické zaměření • Optional exam topics for linguistic specialization
Okruh 7 - Formální popis jazykového systému • Exam topic 7 - Language System Formal Description
-
Otázky:
- Základy fonetiky a fonologie • Basic notions in phonetics and phonology
- Morfologická stavba jazyka • Morphological structure of languages [morfologie flektivní, derivace z pohledu morfologie]
- Základní slovotvorné postupy • Basic word-formation processes [derivace, kompozice, kombinované postupy]
- Syntaktická stavba jazyka: reprezentace větné stavby, povrchová a hloubková stavba věty, role valence, aktuální členění věty • Syntactic structure and its representation, surface-syntactic and deep-syntactic structure of sentence, role of valency, information structure [pojem závislosti vs. bezprostředních složek]
- Jazykový význam, asymetrie formy a významu; jazykový význam a kognitivní obsah • Language meaning, form-meaning asymmetry, language meaning vs. cognitive content [synonymie, homonymie, polysémie; vágnost a víceznačnost]
- Výstavba textu: mezivětné významové vztahy (discourse relations), koreference a asociační anafora • Text structure: interclausal relations, coreference and bridging anaphora
- Základní pojmy stylistiky; přehled stylů a žánrů, využití jazykových prostředků pro ztvárnění stylu textu • Basic notions in stylistics; basic styles and genres, language means in stylistics [stylové rozvrstvení slovní zásoby, morfologické a syntaktické prostředky ad.]
- Základní pojmy sémantiky a pragmatiky • Basic notions in semantics and pragmatics [vymezení znaku, sémiotický trojúhelník, jazykové funkce dle Jakobsona; fungování jazyka v komunikaci, lokuce - ilokuce - perlokuce]
- Základní doporučená literatura:
- Booij, G.: Morphology. An International Handbook on Inflection and Word-Formation. Volume 1, de Gruyter, 2000.
- Ágel, V. et al. (eds.): Dependency and Valency. An international Handbook of Contemporary Research. Volume 1. de Gruyter, 2003.
- Cruse, D. A.: Meaning in language: an introduction to semantics and pragmatics. Oxford: Oxford University Press, 2011.
- Rozšiřující literatura:
- Cruse, D. A.: Lexical semantics. Cambridge: Cambridge University Press, 1986.
- Fromkin, V., Rodman, R., Hyams, N.: An Introduction to Language. International Student Edition. Boston: Wadsworth, 2006.
- Luelsdorff, P. A. (ed.): The Prague School of Structural and Functional Linguistics. Amsterdam/Philadelphia, 1994.
- Pokrývající předměty:
- NPFL100 Variabilita jazyků v čase a prostoru
- NPFL006 Úvod do formální lingvistiky
- NPFL075 Pražský závislostní korpus
- NPFL063 Úvod do obecné lingvistiky
Okruh 8 - Lingvistické formalismy (základní charakteristiky) • Exam topic 8 - Linguistic formalisms (basic characteristics)
-
Otázky:
- Lingvistické formalismy a jejich účel • Linguistic formalisms and their purpose
- Funkční generativní popis • Functional Generative Description [soustava rovin, závislostní syntax, teorie valence, aktuální členění]
- Generativní gramatika, Government & Binding, minimalismus • Generative grammar, Government & Binding, Minimalism [hlavní rysy jazykového popisu vycházejícího z Chomského gramatické koncepce, bezprostřední složky, X-bar teorie, teorie theta]
- Vztah gramatiky a slovníku (gramatické vs. lexikální jevy vs. jevy pomezní) • Grammar and lexicon (grammatical vs. lexical phenomena, boundary issues)
- Srovnání přístupů orientovaných lexikalisticky vs. gramaticky • Comparison of lexicalist and grammatically oriented approaches [Funkční generativní popis, generativní gramatika, Model smysl – text, Case Grammar, Frame Semantics, konstrukční gramatiky, Lexical Functional Grammar, Systemic Functional Linguistics, (Lexicalized) Tree Adjoining Grammar, kategoriální gramatiky ad.]
- Porovnání lingvistických formalismů z hlediska reprezentace syntaktické struktury • Comparison of syntactic representation across linguistic formalisms [Funkční generativní popis, generativní gramatika, Model smysl – text, Case Grammar, konstrukční gramatiky, Lexical Functional Grammar, Systemic Functional Linguistics, (Lexicalized) Tree Adjoining Grammar, Head-driven Phrase Structure Grammar ad.]
- Zachycení slovesa jako syntaktického centra věty v různých formalismech • Verb as the core element of the sentence in different formalisms [Funkční generativní popis, generativní gramatika, Model smysl – text, Case Grammar, Frame Semantics, konstrukční gramatiky, Lexical Functional Grammar ad.]
- Sémantická reprezentace v různých jazykových modelech • Semantic representation in different linguistic approaches [Funkční generativní popis, Model smysl – text, Frame Semantics, konstrukční gramatiky, Lexical Functional Grammar, Lexical Conceptual Structure ad.]
- Základní doporučená literatura:
- Allan, K. (ed.): The Oxford Handbook of the History of Linguistics. Oxford Univesity Press. 2013
- Ágel, V. et al. (eds.): Dependency and Valency. An international Handbook of Contemporary Research. Volume 1. de Gruyter, 2003.
- Rozšiřující literatura:
- Sgall, P., Hajičová, E., Panevová, J.: The Meaning of the Sentence in its Semantic and Pragmatic Aspects. Academia, Praha – D. Reidel, Dordrecht 1986
- Abeillé, A., Rambow, O. (eds.): Tree Adjoining Grammar: An Overview. Tree Adjoining Grammars. Formalisms, Linguistic Analysis and Processing. The University of Chicago Press, 2000.
- Fillmore, Ch. J.: The Case for Case. In Bach and Harms (eds.): Universals in Linguistic Theory. New York 1968, pp. 1–88.
- Hajičová, E. – Panevová, J. – Sgall, P.: Úvod do teoretické a počítačové lingvistiky. I. svazek – Teoretická lingvistika. Praha 2002.
- Chomsky, N.: Lectures on Government and Binding. Dordrecht 1981.
- Chomsky, N.: The Minimalist Program. Cambridge, Mass. 1995.
- Hilpert, M.: Construction Grammar and its Application to English. Edinburgh University Press 2014.
- Fried, M., J-O. Östman (ed.): Construction Grammar in a Cross-language Perspective. John Benjamins Publishing Company, 2004
- Sells, P.: Lectures on Contemporary Syntactic Theories. CSLI. 1985
- Pokrývající předměty:
- NPFL083 Lingvistická teorie a gramatické formalismy
- NPFL006 Úvod do formální lingvistiky
Okruh 9 - Variabilita jazyků a základy jazykové typologie • Exam topic 9 - Variability of languages and basic notions of language typology
-
Otázky:
- Variabilita jazyků a možnosti jejich klasifikace (genetická, areálová, strukturně-lingvistická) • Variability of languages and possible classifications (genetic, areal, typological)
- Genetická klasifikace jazyků, jazykové rodiny • Genetic classification of languages, language families [glottochronologie]
- Areálová klasifikace jazyků, jazykové svazy • Areal classification of languages, Sprachbunds
- Inventáře hlásek, distinktivní rysy a suprasegmentální jevy z kontrastivního pohledu; mezinárodní fonetická abeceda; tvoření slabik • Phoneme inventories, distinctive features and suprasegmental phenomena from a contrastive perspective; International Phonetic Alphabet; syllable formation [kvalita a kvantita hlásek hlásek, přízvuk, intonace a tóny]
- Mluvená vs. psaná forma jazyka; typy písma • Spoken vs. written language; types of writing systems [piktografické, ideografické, logografické, slabikové, alfabetické]
- Morfologická stavba jazyků (jazykový typ flektivní, aglutinační, izolační a polysyntetický); typologie gramatických významů (pád, číslo, čas, aspekt, modalita aj.) • Morphological structure of languages (inflectional, agglutinative, isolating and polysynthetic types) [Hranice mezi morfémem, slovem a větou] [Sémantické pády, souvislost významů a gramatické realizace v jazycích]
- Slovní druhy a jejich porovnatelnost přes hranice jazyků • Parts of speech and their comparability across languages [Pojetí slovního druhu. Prostředky vyjádření větných vztahů: morfologie vs. funkční slova vs. slovosled. Head-marking vs. argument-marking jazyky. Nominativ/akuzativ vs. absolutiv/ergativ]
- Slovosled v kontrastivním pohledu; volný a pevný slovosled; dominantní slovosled; korelace slovosledných vzorců • Word order from a contrastive perspective; free and fixed word order; dominant word order; correlations of word-order patterns [Distribuce dominantního slovosledu v jazycích. Slovosled v rámci jmenné skupiny.] .
- Slovotvorné procesy napříč jazyky • Word-formation processes across languages [tvoření slov pomocí vázaných a volných morfémů]
- Harmonizace anotačních schémat • Harmonization of annotation schemes [Interset, Universal Dependencies]
- Základní doporučená literatura:
- Haspelmath, M. et al. (eds.): Language typology and language universals. De Gruyter, 2001.
- Comrie, B.: Language universals and linguistic typology. University of Chicago press, 1989.
- Rozšiřující literatura:
- Velupillai, V.: An Introduction to Linguistic Typology. John Benjamins Publishing Company. 2012
- Körtvélyessy, L.: Language Typology. Preliminaries and Principles. Rzeszów: WUR. 2017.
- Pokrývající předměty:
- NPFL100 Variability of languages in time and space
- NPFL120 Multilingual Natural Language Processing