V zimním semestru 2017-2018 se vyučuje na FJFI každé pondělí od 9:30 v učebně T-210 (2. patro v Trojanově ulici).
Upozornění: Data v následující tabulce jsou předběžná. Není zaručeno, že daná látka opravdu vyjde na daný den. Prezentace se v průběhu semestru mohou měnit, zejména pokud jde o dosud neodpřednášenou látku. Výuka odpadá 1. ledna (státní svátek) a pravděpodobně ještě někdy v prosinci (budu na konferenci, upřesním později).
Název části | PowerPoint | Úkol | Datum | |
Úvod, přehled aplikací počítačové lingvistiky | PowerPoint | 2.10.2017 | ||
Lingvistická terminologie, roviny zpracování přirozeného jazyka | PowerPoint | 9.10.2017 | ||
Vyhodnocování úspěšnosti | PowerPoint | 9.–16.10.2017 | ||
Slovníky a morfologické značky | PowerPoint | Úkol | 16.10.2017 | |
Značkování (zjednoznačnění výsledků morfologické analýzy) | PowerPoint | Úkol (viz prezentaci) | 30.10.2017 | |
Dvojúrovňová morfologie, morfonologie | PowerPoint | Úkol | 30.10.–13.11.2017 | |
Morfologie a bezkontextové gramatiky | PowerPoint | 27.11.2017 | ||
Morfologie a unifikační gramatiky | PowerPoint | 27.11.2017 | ||
Funkční morfologie | PowerPoint | 20.11.2017 | ||
Kontrola pravopisu | PowerPoint | 20.11.2017 | ||
Syntaxe: složková analýza věty | PowerPoint | 4.–11.12.2017 | ||
Syntaxe: závislostní analýza věty | PowerPoint | Úkol | 11.–18.12.2017 | |
Inside-outside algoritmus (Joshua Goodman) | zatím nezařazeno | |||
Ontologie (Wordnet) | zatím nezařazeno |
Kromě prezentací z přednášek jsou k dispozici tyto další materiály:
V průběhu semestru budou zadány nejméně dva domácí úkoly a zápočet bude udělen na základě bodů získaných za řešení těchto úkolů. Součástí hodnocení je i včasnost odevzdání, nicméně i za úkol odevzdaný pozdě je možné získat nenulový počet bodů. Prosím zkontrolujte tuto stránku týden po odeslání řešení a ozvěte se mi, jestliže zde o vašem řešení není zmínka. E-mailová komunikace není vždy spolehlivá a může se stát, že vaše řešení skončí ve složce se spamy.
Různě těžké úkoly mohou mít různou bodovou dotaci a ve výjimečných případech, kdy nějaké řešení rozsahem nebo kvalitou výrazně přesahuje požadavky, je možné získat i vyšší počet bodů, než bylo očekávané maximum pro danou úlohu. Pro orientaci, hodnota jedné středně těžké úlohy je 14 bodů. Minimum potřebné k získání zápočtu je 20 bodů.
DÚ1 byl zadán 23.10.2017 (viz zde), termín odevzdání je 13.11.2017, bodová dotace 14 bodů.
DÚ2 byl zadán 30.10.2017 (viz poslední snímek prezentace o značkování), termín odevzdání je 27.11.2017, bodová dotace 8 bodů.
DÚ3 byl zadán 13.11.2017 (viz zde), termín odevzdání je 18.12.2017, bodová dotace ~14 bodů (může být i překročena).
DÚ4 (viz zde), bodová dotace 14 bodů.
Zkr. jméno | DÚ1 | DÚ2 | Celkem | ||
---|---|---|---|---|---|
Odevzdáno | Body | Odevzdáno | Body | ||
Následují odkazy na oficiálně vyvěšené anotace předmětů na stránkách fakulty.
Předpoklady
AnotaceZákladní metody a algoritmy používané pro předzpracování a zpracování textu z hlediska počítačového zpracování přirozeného jazyka obecně a češtiny speciálně; kromě češtiny bude zvýšená pozornost věnována ještě angličtině. Důraz bude kladen zejména na nižší úrovně zpracování, se všeobecným úvodem do komplexních metod zpracování. Základy jazyka Perl (pro zpracování textu). Osnova
|
Prerequisities
AnnotationBasic methods and algorithms used for text processing and preprocessing from the point of view of natural language processing in general and Czech processing in particular; besides Czech, the second language of interest is English. The focus is on lower levels of processing but an introduction is given to the complex methods. Fundaments of the Perl language (for text processing). Syllabus
|