Anotace

Seminář nabízí odpověď na otázku „co s tím budeš dělat“, seznamuje studenty se současnými trendy v aplikované lingvistice (včetně praktických ukázek). Náplň semináře nevyžaduje vstupní znalosti z oboru informatiky.

 

Sylabus

1. Lingvistické aplikace – úvod do problematiky

- modelování přirozeného jazyka včera, dnes (a zítra)

- základní přístupy, nástroje, data

- textová analytika

- přehledová kategorizace aplikací

 

2. Speech Recognition – rozpoznávání mluvené řeči:

  • dialogové systémy: speaker dependent / speaker independent
    • ELIZA a příbuzné, talking heads, avatars
    • ukázka: Senior Companion – česky hovořící humanoid Petra
    • telematics (navigace etc.)
  • realtime voice writing (court writing etc.) a syntéza řeči (text-to-speech)
    • ukázka: počítač pro nevidomé (př. Eureka)
  • spoken language archives
    • objasnění principu a návštěva Centra vizuální historie MALACH

(http://ufal.mff.cuni.cz/cvhm/about-us.html)

 

3. Language Recognition – rozpoznávání jazyka:

  • jazykové korektory (editační vzdálenost atd.)
  • n-gramové modely a jejich využití:
    • rozpoznávání konkrétních jazyků
    • rozpoznávání spamu
  • strojový překlad
    • word-based, phrase-based
    • statistický, pravidlový, hybridní přístup
    • korpusy, treebanky + searching tools
    • ukázka: srovnání překladačů

 

4. Information Retrieval – získávání informací:

  • internetové vyhledávače
  • sentiment analysis
    • ukázka: automatická extrakce subjektivní informace v češtině: nástroje, rozhraní
  • analýza diskurzu
  • automatická sumarizace
  • rozpoznávání pojmenovaných entit
  • question-answering

 

5. Forenzní lingvistika a stylometrie:

-          detekce kyberšikany a trollingu

-          automatická administrace internetových diskusí

-          apod.

 

+ případně neurolingvistické a psycholingvistické aplikace, metody forenzní lingvistiky, aplikace v rámci second language acquisition etc.

 

Cíl předmětu

Cílem kurzu je obeznámení studentů s možnostmi využití lingvistických znalostí v praxi.