LS 2025/26 - cvičení Pravděpodobnost a statistika 1

Stránka v SISu: NMAI059

Stránka přednášky

Místnost: S6

Čas: Středa 12:20 a Středa 14:00

Kontakt: papacek@ufal.mff.cuni.cz

Skriptaverze 14.6.2025

Anonymní feedback: Formulář - Kdykoliv mi cokoliv budete chtít sdělit.

xkcd causality
Zdroj: xkcd 2370 (Randall Munroe)

Příklady ze cvičení

Proběhlá cvičení:

  • 1. cvičení (18. 2.)Zadání (pdf): Úvod do pravděpodobnosti.
  • 2. cvičení (25. 2.)Zadání (pdf): Podmíněná pravděpodobnost a Bayesova věta.
  • 3. cvičení (4. 3.)Zadání (pdf): Diskrétní náhodná veličina. (Malý test)
  • 4. cvičení (11. 3.)Zadání (pdf): Diskrétní náhodné veličiny, distribuce, střední hodnota, rozptyl. (1. VELKÝ TEST)
  • 5. cvičení (18. 3.)Zadání (pdf): Podmíněná střední hodnota a rozptyl, sdružená pravděpodobnost.
  • 6. cvičení (25. 3.)Zadání (pdf), malý test
  • 7. cvičení (1. 4.) – Zadání (pdf): Distribuční funkce, hustota.
▶ Zobrazit plán budoucích cvičení

Poznámka: Zadání k budoucím cvičením budou přidávána postupně.

  • 8. cvičení (8. 4.)Zadání (pdf) (2. VELKÝ TEST)
  • 9. cvičení (15. 4.)Zadání (pdf)
  • 10. cvičení (22. 4.)Zadání (pdf)
  • 11. cvičení (29. 4.)Zadání (pdf)
  • 12. cvičení (6. 5.)Zadání (pdf) (3. VELKÝ TEST)
  • 13. cvičení (13. 5.)Rektorský sportovní den – cvičení není – běžte cvičit!
  • 14. cvičení (20. 5.)Zadání (pdf): Řešení zkouškové písemky, dohánění restů.

Ukázka vzorových testů

Stránky pro jednotlivé paralelky

Každá paralelka (středa 12:20 i středa 14:00) má svou vlastní složku, kam občas nahraji materiály určené výhradně pro danou skupinu.

Podmínky zápočtu

K získání zápočtu je potřeba získat alespoň 66 % bodů z celkového součtu a odevzdat statistickou práci v dostatečné kvalitě.

Aktivita Počet bodů Poznámka
Velké testy (3x) 40 bodů / test Počítají se 2 nejlepší výsledky.
Domácí úkoly (~12x) 2–4 body / úkol Nutnost odevzdat alespoň polovinu úkolů.
Malé kvízy (3–5x) 3–4 body / kvíz Krátké testy na začátku cvičení.

Pokud bude na konci semestru někomu chybět k zápočtu jen několik málo bodů (bude mít alespoň 60 %), bude možné si je doplnit vyřešením dodatečných úkolů. V takovém případě je potřeba napsat email.

Komunikace

Pokud Vám přijde, že něčemu nerozumíte, nestíháte deadline, máte málo bodů nebo nejste schopni získat vysněnou známku, napište mi včas na výše uvedený email. Většina věcí se dá řešit, pokud se o nich ví dopředu. Prosím, v e-mailech používejte předmět začínající na "PAST1: ..." (např. PAST1: Dotaz na statistickou práci).

Písemné velké testy

Hlavním zdrojem bodů budou tři písemné testy v jednotlivých třetinách semestru. Každý bude zhruba odpovídat probrané látce v daném bloku.

  • Formát: Časový rozsah 45 minut.
  • Pravidla: Během testu není možné používat žádné pomůcky (tabulky, mobily, kalkulačky) ani odcházet z místnosti.
  • Hodnocení: Počítají se nejlepší 2 pokusy ze 3. Náhradní termíny jsou možné jen ve výjimečných, řádně doložených případech.
  • Termíny (předběžné): 11.3., 8.4., 6.5.
  • Vzorový test: 1. Velký test: Ukázka zadání a typových příkladů

Malé kvízy

Na začátku některých cvičení (mimo první týden a týdny, kdy se píší velké testy) se bude psát malý kvíz na pár minut.

  • Obsah: Základní pojmy, definice či znění vět z poslední přednášky.
  • Cíl: Podpořit průběžnou přípravu, což vám výrazně usnadní jak samotné cvičení, tak i přípravu na velké písemné testy.

Domácí úkoly (Pravidla)

  • Termíny: Deadliny budou mírné, přesto doporučuji řešit úlohy průběžně před testem na dané téma.
  • Podmínka zápočtu: Je nutné odevzdat alespoň 50 % úkolů (zaokrouhleno nahoru).
  • Odevzdávání: Primárně přes systém Postal Owl. Enrolment token obdržíte e-mailem po prvním cvičení.
  • Spolupráce: Diskuse s kolegy je vítána, ale řešení musíte sepsat sami a plně mu rozumět. Veškeré zdroje a spolupracovníky deklarujte.
  • AI a LLM: Používání běžných LLM (jako ChatGPT) k přímému řešení se nedoporučuje. Cílem je, abyste odevzdanému postupu sami rozuměli.
  • Časový odhad: Prosím o připsání čistého času stráveného nad úlohou (pomůže mi to ladit obtížnost).

Alternativa: Interaktivní systém GraspIt

Místo klasického odevzdání můžete využít interaktivní systém GraspIt (konverzace o úloze s chatbotem). GraspIt slouží jako okamžitý feedback.

Pozor: K plnému počtu bodů není potřeba souhlas chatbota z GraspIt, že máte úkol správně, stejně tak jako jeho souhlas není zárukou plného počtu bodů. Chatbot se může mýlit nebo něco přehlédnout.

Jak postupovat v GraspIt:

  1. Otevřete chat s úlohou a zvolte si přístup:
    • Mám řešení: Nahrajte ho (text, obrázek, PDF). Pokud chatbot najde chybu nebo nejasnost, v konverzaci ji opravte či doplňte.
    • Mám nápad: Napište první myšlenku nebo částečný postup. Chatbot vás zbytkem úlohy provede.
    • Nevím, jak začít: Požádejte o navedení. Chatbot vám dá první nápovědu.
  2. Ukončení práce: Jakmile jste s výsledkem spokojeni, napište do chatu "Hotovo". Je to signál pro mě, že můžu chat opravit a okomentovat.
  3. Více chatů: Pokud k jedné úloze otevřete více konverzací, ujistěte se, že "Hotovo" napíšete jen do té, kterou chcete hodnotit (ostatní ideálně smažte).
  4. Synchronizace s Owl: Do systému Postal Owl napište k danému úkolu krátkou poznámku, že máte hotovo v GraspIt.

Statistická práce

Cílem je použít techniku z přednášky (test hypotézy, intervalový odhad apod.) na reálná data. Pro inspiraci: práce z minulých let.

Struktura reportu:

  • Přehled: Co zkoumáte a jakými metodami.
  • Popis dat: Zdroj, způsob sběru, grafické znázornění.
  • Popis metod: Použité testy a zdůvodnění jejich vhodnosti.
  • Výsledky: Číselné výsledky se slovním komentářem.
  • Diskuze a závěr: Interpretace a možné nedostatky (málo dat, nesplněné předpoklady).

V průběhu semestru bude nutné zaslat téma ke schválení. Termín odevzdání je do konce června (možnost individuálního prodloužení po domluvě).

Docházka je nepovinná.

Simulace

1. Kasino: co je nejlepší strategie?

Nové kasino nabízí následující hru: vsadím x korun, s pravděpodobností 1/2 o ně přijdu, ale s pravděpodobností 1/2 vyhraju 2x navíc k mým vsazeným penězům. Začínám s K korunami a budu hrát n kol. V každém kole si můžu vybrat, jakou část svého aktuálního kapitálu vsadím. Chci maximalizovat střední hodnotu peněz na konci, zjistit pravděpodobnost bankrotu a rozmyslet si, jakou strategii bych opravdu chtěl použít.

Když v každém kole sázím podíl k svého aktuálního kapitálu, tak se moje peníze v jednom kroku násobí buď číslem \(1 + 2k\) (výhra), nebo \(1 - k\) (prohra). Proto po \(n\) kolech vychází

\[ \mathbb{E}[X_n] = X_0 \left(1 + \frac{k}{2}\right)^n \]

Střední hodnota roste exponenciálně. Nejvíce je pro k=1, tedy pokaždé vsadit vše. 

Medián se ale chová jinak. Typický průběh odpovídá zhruba tomu, že polovina hodů vyjde a polovina ne, takže medián je kolem

\[ X_0 \left((1 + 2k)(1 - k)\right)^{n/2} = X_0 \left(1 + k - 2k^2\right)^{n/2} \]

Pro \(k = 0.5\) z toho vyjde přesně \[ X_0 \] tedy medián zůstává přibližně na startovní hodnotě.

Pokud chceme maximalizovat medián, stačí maximalizovat výraz \(1 + k - 2k^2\). Ten má derivaci \(1 - 4k\), takže maximum nastává pro \[ k = \frac{1}{4}. \] Z pohledu mediánu je nejlepší strategie sázet v každém kole 25 % aktuálního kapitálu. To je pěkně vidět i v tabulce níže, kde má strategie 25 % nejvyšší konečný medián.

Tahle úloha je hezká tím, že se v ní dost rozchází „nejlepší průměr“ a „rozumná strategie pro normálního člověka“. V simulaci proto porovnávám několik pevných strategií, kdy v každém kole sázím stejný podíl aktuálního jmění, konkrétně 100 %, 75 %, 50 %, 33 %, 25 % a 10 %.

Konkrétní nastavení simulace bylo: 100 kol10 000 simulovaných hráčů, počáteční kapitál 1000 Kč. Za bankrot beru situaci, kdy se hráč dostane pod 1 korunu.

Strategie Průměr na konci Medián na konci Počet bankrotů
100 % 0.0 0.0 10,000
75 % 62.9B 0.0 9,689
50 % 29.4B 1.0k 3,244
33 % 4.2B 194.0k 114
25 % 240.0M 361.1k 3
10 % 129.5k 46.9k 0

Například průměr pro strategii vždy vsadím 75 % je nejvyšší a to i přes to že téměř 9,7 tisíc hráčů zbankrotovalo. Zbylých 300 však získali tolik že průměr vytáhli nahoru.