Automatické zpracování textových dat


NPFL098 / ATKL00345

Pavel Straňák

stranak@ufal.mff.cuni.cz

úterý 10.40–14.00
Malostranské nám. 25, SU1

21. 2. 2017

Motivace

Požadavky

Laboratoř SU1 na Malé Straně

Unix

Literatura

Struktura kurzu

  1. Zpracování textu jako nutný základ (nejen) komputační linvistiky
  2. Proč používat unixový shell; nejzákladnější příkazy
  3. další příkazy pro manipulaci s texty
  4. textové editory
  5. vyhledávání pomocí regulárních výrazů
  6. využití regulárních výrazů pro úpravy textu
  7. základní principy formulace a ověřování hypotéz, aplikace na data, přesnost, úplnost, vypovídací hodnota výsledků
  8. odstranění diakritiky, segmentace na věty, tokenizace
  9. pravidlové automatické určení slovních druhů

Zpracování textu

SSH, PuTTY

Shell

Shell II (bash)

Základní příkazy – soubory a adresáře

Shell III

Základní příkazy II – textové soubory a proměnné