SIS code: 
NPFL111, NPFL112
Semester: 
summer
Examination: 
zkouška, zápočet
Guarantor: 
Guarantor: 
Václav Cvrček

Teoretické základy statistického vyhodnocování jazykových dat v R a Seminář ze statistického vyhodnocování jazykových dat v R

@RLingStat, #RLingStat

Kurz se povinně skládá z přednášky (SIS kód NPFL111) a cvičení (SIS kód NPFL112) a je určen studentům filologických oborů, kteří si chtějí osvojit základy kvantitativních technik pro lingvistické a literární studie, aniž by měli zkušenosti s programováním nebo statistikou. Klademe důraz na představení, vysvětlení a procvičení konkrétních výzkumných úloh s použitím programovacího jazyka R a vybraných statistických konceptů. Studenti si odnesou portfolio vzorově vyřešených úloh, jejichž kódu porozumějí a přinejmenším budou ve vlastním výzkumu schopni svoje data přizpůsobit probíraným vzorům.   

V letním semestru 2016/2017 se výuka koná každý pátek 9:00-12:10 v laboratoři SU1 v tzv. rotundě v přízemí budovy MFF na Malostranském náměstí (vchod z jeho dolní části). Začínáme 24.2.2017.

Sylabus ve formě myšlenkové mapy jako obrázek si můžete stáhnout zde (pozor, ještě se průběžně upravuje). Pokud se vám při studiu osvědčují myšlenkové mapy, brzy si budete moct stáhnout zdrojový soubor zde a editovat si ho sami open-source programem FreeMind. Sylabus v lineární formě zveřejníme později.

Studijní předpoklady

Osobní motivace, základy práce s počítačem, dobrá pasívní znalost angličtiny.

Požadavky pro udělení atestací

  • aktivní účast na hodinách
  • vypracování několika drobných domácích úkolů
  • na závěr malá studie podle vlastního zájmu s využitím vzorových postupů a její osobní prezentace vyučujícím

Stáhněte si R na svůj počítač

Nejdřív R na http://cran.at.r-project.org a potom RStudio na http://www.rstudio.com. Pokud chcete ve výuce používat vlastní počítač, musíte si sami zařídit připojení přes eduroam a mít oba programy řádně nainstalované.

Dálkové připojení do laboratoře MFF (jen studenti s platným účtem)

Návod je zde.

Přístup k RStudiu na cloudu Jupyter (jen studenti s platným účtem)

https://jupyter.korpus.cz/r/auth-sign-in

Stáhněte si balíček a data

Online nástroje

Online konzole RFiddle (Sdílení v reálném čase. Velmi jednoduchá, nedají se nahrávat soubory, ale snadné sdílení)

https://regex101.com/ Online tvoření a kontrola regulárních výrazů, včetně nahrazování, přehledné nápovědy a ukládání. Pozor, pro zpracování české diakritiky je třeba zapnout parametr "u" (jako "unicode"). Bez něj něco funguje taky, ale není to spolehlivé.

 http://regexlib.com - online tvoření a kontrola regulárních výrazů