Hlavní obsah
Pravděpodobnost a kombinatorika
Kurz: Pravděpodobnost a kombinatorika > Kapitola 2
Lekce 9: Podmíněná pravděpodobnost- Výpočet podmíněné pravděpodobnosti (Bayesova věta)
- Podmíněná pravděpodobnost názorně
- Výpočet podmíněné pravděpodobnosti (Bayesova věta)
- Podmíněná pravděpodobnost a stromové diagramy: lékařské testy
- Výpočet podmíněné pravděpodobnosti (příklad)
- Jak ověřit, jestli jsou na sobě jevy nezávislé
- Závislé a nezávislé jevy
Podmíněná pravděpodobnost a stromové diagramy: lékařské testy
Firma má 10 000 zaměstnanců, 5 % z nich je nakažených. Testy mají falešnou pozitivitu 2 % (z těch, kteří nemají virus, u 2 % vyjde, že ho mají). Testy mají také falešnou negativitu 1 %. Budeme společně počítat, jaká je pravděpodobnost, že je zaměstnanec skutečně nakažen, pokud má pozitivní test. Rozebereme si i zajímavá čísla, která nám vyjdou. Stejný příklad vyřešíme ještě pomocí stromového diagramu.
Chceš se zapojit do diskuze?
Zatím žádné příspěvky.
Transkript
Podíváme se na podmíněnou pravděpodobnost
u lékařských testů, kde se využívá velice často. Jako vždy doporučuji video zastavit
a zkusit si úlohu vyřešit samostatně. My úlohu nejprve vyřešíme s konkrétními
čísly, vymyslíme si počet zaměstnanců a poté si ukážeme, jak to dopadne při výpočtu se samotnými procenty se
samotnými pravděpodobnostmi. Řekněme, že firma má 10 tisíc zaměstnanců,
aby se nám to dobře počítalo. To jsou oni. Tato celá množina všech zaměstnanců. Dále víme, že 5 procent z nich je
nakažených. Vyznačme si tedy úzký sloupec vpravo. Těchto pět procent zaměstnanců je
nakažených, no a pět procent z deseti tisíc, to je pět set zaměstnanců. To znamená, že zbývajících, většina, 95
procent neboli devět a půl tisíce zaměstnanců, jsou zdraví. U testů, které firma používá, jsou falešně
pozitivní dvě procenta, to znamená, že dvě procenta zdravých lidí, které otestujete
budou mít pozitivní test. Týká se to tedy této většinové části
zaměstnanců, vyznačme si to úzkým pruhem dole. Dvě procenta z nich budou mít
pozitivní test, konkrétně z devět a půl tisíce dvě procenta tedy krát nula celá
nula dva. To je 190 zaměstnanců. Zbytek těchto zdravých zaměstnanců bude
mít negativní test, což je devět a půl tisíce bez sto devadesáti, neboli devět tisíc
tři sta deset. Dále je u testů uvedeno, že jsou falešně
negativní v jednom procentu případů. To se týká nakažených zaměstnanců a znamená
to, že jednomu procentu z nich vyjde negativní test, vyznačíme si to malým
políčkem nahoře. Z těchto pěti set zaměstnanců se to týká
jednoho procenta, neboli pět set krát nula celá nula jedna, což je pět zaměstnanců. Ostatním nakaženým zaměstnancům vyjde test
správně pozitivní, to jsou tito, a je jich
pět set bez pěti, což je 495. Naším úkolem je vypočítat podmíněnou
pravděpodobnost, která se omezuje pouze na zaměstnance s pozitivním testem. To znamená, že nás zajímají jednak nakažení
pozitivní, ale také falešně pozitivní zdraví zaměstnanci. Omezíme se proto na tuto množinu
pozitivních a falešně pozitivních pacientů. Ostatní do výpočtu nevstupují.
A zajímá nás, jaké procento z nich je skutečně nakaženo. Jinými slovy počítáme podmíněnou
pravděpodobnost, že zaměstnanec je nakažen za podmínky, že mu vyšel pozitivní test. Pravděpodobnost vypočítáme zlomkem, kdy v čitateli
máme příznivé výsledky, což jsou paradoxně nakažení zaměstnanci. Těch je čtyři sta devadesát pět s
pozitivním testem. A ve jmenovateli budeme mít všechny zaměstnance s pozitivním
testem, což je 495 skutečně nakažených a 190 falešně pozitivních zdravých pacientů. Výpočtem zjistíme, že pravděpodobnost je
přibližně 72 procent. Možná vám tato pravděpodobnost připadá
nízká. Ona totiž také znamená, že s pozitivním
testem má zaměstnanec dvaceti osmi procentní šanci, že je zdravý, což je docela
hodně, a rozhodně je to daleko od dvou procent falešně pozitivních testů, které
jsou zadány. Zdánlivý rozpor je způsoben tím, že
přestože jsou testy takto spolehlivé, tak nakažených zaměstnanců je velice málo a
tyto dvě čísla je něco, co musíme dát do souvislosti. Pět procent nakažených, dvě
procenta falešně pozitivních, což jsou podobné hodnoty. A i proto nakažení pozitivní a zdraví
pozitivní nejsou tak rozdílní, nebo ten rozdíl není takový, jaký byste možná
čekali. Můžeme si to představit na extrémnějším
případu. Představte si, že bychom vytvářeli test na nějakou
velice vzácnou chorobu, kterou má jenom nula celá jedna procenta populace, tak
velice snadno můžeme vytvořit test, který má spolehlivost devadesát devět celých
devět procent. A to jednoduše tak, že všechny pacienty
prohlásí za negativní a máme jistotu, že se splete nejvýš u nula celá jednoho procenta
skutečně nakažených. Nyní si ale pojďme výpočet ukázat ještě
jednou na stromovém diagramu bez vymýšlení počtu zaměstnanců, se skutečnými procenty a
zadanými pravděpodobnostmi. Na začátku máme sto procent všech
zaměstnanců. Víme, že pět procent z nich je nakažených. A také víme, že zbývajících 95 procent je
zdravých. Dále víme, že test je falešně negativní v
jednom procentu případů, tedy z těchto pěti procentech je falešně negativní jedno
procento. Musíme tedy pronásobit pět procent krát
jedno procento a dostáváme nula celá nula pět procent. Odsud se vzalo našich pět zaměstnanců.
A zbývající jsou správně pozitivně testování, to znamená pět procent
krát 99 procent, zbytek z jednoho procenta, což je 4 celá 95 procenta nakažených
pozitivních pacientů. Pojďme se podívat do druhé větve se
zdravými pacienty, tam máme falešně pozitivní dvě procenta testů. To znamená, že musíme opět pronásobit 95
procent zdravých zaměstnanců krát dvě procenta falešně pozitivních
testů. Tím dostáváme jedna celá devět procenta
zaměstnanců, kteří jsou zdraví ale falešně pozitivní. A konečně tu máme zdravé
negativně testované zaměstnance, kterých je 95 procent krát zbytek z dvou procent, což
je devadesát osm procent, což je 93 celých jedna procenta zdravých negativně
testovaných zaměstnanců. Do výpočtu podmíněné pravděpodobnosti by
nám vstoupily pozitivně testování, což je 4 celá 95 procenta a jedna celá 9 procenta,
což vidíme, jak přesně koresponduje s výpočtem pomocí počtu zaměstnanců. Výsledkem je opět 72 procentní
pravděpodobnost, že zaměstnanec, který má pozitivní test, je nakažený.