Zpracování textových dat v lingvistice – ATKL00345

Program kursu

Na ukázkových textech většího rozsahu si ukážeme základní metody zpracování textu potřebné pro získání netriviálních informací a ověření hypotéz. Pravděpodobně použijeme texty děl Karla Čapka a různá další díla v jazycích dle zaměření frekventantů.

Presentace ze seminářů

  1. Seminář 1
  2. Seminář 2
  3. Seminář 3 (27. 10. 2010)
  4. Seminář 4 (3. 11. 2010)
  5. Semináře 5 a 6( 10. a 24. 11. 2010) byly věnovány opakování a procvičování. Další příklady.
  6. 7. a 8. hodina byly věnovány POS taggingu.
  7. Seminář 9 (5. ledna 1011) – základy HTML