Anotace

Seminář nabízí odpověď na otázku „co s tím budeš dělat“, seznamuje studenty se současnými trendy v aplikované lingvistice (včetně praktických ukázek). Náplň semináře nevyžaduje vstupní znalosti z oboru informatiky.

 

Sylabus

1. Lingvistické aplikace – úvod do problematiky

- modelování přirozeného jazyka včera, dnes (a zítra)

- základní přístupy, nástroje, data

- textová analytika

- přehledová kategorizace aplikací

 

2. Speech Recognition – rozpoznávání mluvené řeči:

 • dialogové systémy: speaker dependent / speaker independent
  • ELIZA a příbuzné, talking heads, avatars
  • ukázka: Senior Companion – česky hovořící humanoid Petra
  • telematics (navigace etc.)
 • realtime voice writing (court writing etc.) a syntéza řeči (text-to-speech)
  • ukázka: počítač pro nevidomé (př. Eureka)
 • spoken language archives
  • objasnění principu a návštěva Centra vizuální historie MALACH

(http://ufal.mff.cuni.cz/cvhm/about-us.html)

 

3. Language Recognition – rozpoznávání jazyka:

 • jazykové korektory (editační vzdálenost atd.)
 • n-gramové modely a jejich využití:
  • rozpoznávání konkrétních jazyků
  • rozpoznávání spamu
 • strojový překlad
  • word-based, phrase-based
  • statistický, pravidlový, hybridní přístup
  • korpusy, treebanky + searching tools
  • ukázka: srovnání překladačů

 

4. Information Retrieval – získávání informací:

 • internetové vyhledávače
 • sentiment analysis
  • ukázka: automatická extrakce subjektivní informace v češtině: nástroje, rozhraní
 • analýza diskurzu
 • automatická sumarizace
 • rozpoznávání pojmenovaných entit
 • question-answering

 

5. Forenzní lingvistika a stylometrie:

-          detekce kyberšikany a trollingu

-          automatická administrace internetových diskusí

-          apod.

 

+ případně neurolingvistické a psycholingvistické aplikace, metody forenzní lingvistiky, aplikace v rámci second language acquisition etc.

 

Cíl předmětu

Cílem kurzu je obeznámení studentů s možnostmi využití lingvistických znalostí v praxi.