If you're seeing this message, it means we're having trouble loading external resources on our website.

Pokud používáš webový filtr, ujisti se, že domény: *.kastatic.org and *.kasandbox.org jsou vyloučeny z filtrování.

Hlavní obsah

Podmíněná pravděpodobnost a stromové diagramy: lékařské testy

Transkript

Podíváme se na podmíněnou pravděpodobnost u lékařských testů, kde se využívá velice často. Jako vždy doporučuji video zastavit a zkusit si úlohu vyřešit samostatně. My úlohu nejprve vyřešíme s konkrétními čísly, vymyslíme si počet zaměstnanců a poté si ukážeme, jak to dopadne při výpočtu se samotnými procenty se samotnými pravděpodobnostmi. Řekněme, že firma má 10 tisíc zaměstnanců, aby se nám to dobře počítalo. To jsou oni. Tato celá množina všech zaměstnanců. Dále víme, že 5 procent z nich je nakažených. Vyznačme si tedy úzký sloupec vpravo. Těchto pět procent zaměstnanců je nakažených, no a pět procent z deseti tisíc, to je pět set zaměstnanců. To znamená, že zbývajících, většina, 95 procent neboli devět a půl tisíce zaměstnanců, jsou zdraví. U testů, které firma používá, jsou falešně pozitivní dvě procenta, to znamená, že dvě procenta zdravých lidí, které otestujete budou mít pozitivní test. Týká se to tedy této většinové části zaměstnanců, vyznačme si to úzkým pruhem dole. Dvě procenta z nich budou mít pozitivní test, konkrétně z devět a půl tisíce dvě procenta tedy krát nula celá nula dva. To je 190 zaměstnanců. Zbytek těchto zdravých zaměstnanců bude mít negativní test, což je devět a půl tisíce bez sto devadesáti, neboli devět tisíc tři sta deset. Dále je u testů uvedeno, že jsou falešně negativní v jednom procentu případů. To se týká nakažených zaměstnanců a znamená to, že jednomu procentu z nich vyjde negativní test, vyznačíme si to malým políčkem nahoře. Z těchto pěti set zaměstnanců se to týká jednoho procenta, neboli pět set krát nula celá nula jedna, což je pět zaměstnanců. Ostatním nakaženým zaměstnancům vyjde test správně pozitivní, to jsou tito, a je jich pět set bez pěti, což je 495. Naším úkolem je vypočítat podmíněnou pravděpodobnost, která se omezuje pouze na zaměstnance s pozitivním testem. To znamená, že nás zajímají jednak nakažení pozitivní, ale také falešně pozitivní zdraví zaměstnanci. Omezíme se proto na tuto množinu pozitivních a falešně pozitivních pacientů. Ostatní do výpočtu nevstupují. A zajímá nás, jaké procento z nich je skutečně nakaženo. Jinými slovy počítáme podmíněnou pravděpodobnost, že zaměstnanec je nakažen za podmínky, že mu vyšel pozitivní test. Pravděpodobnost vypočítáme zlomkem, kdy v čitateli máme příznivé výsledky, což jsou paradoxně nakažení zaměstnanci. Těch je čtyři sta devadesát pět s pozitivním testem. A ve jmenovateli budeme mít všechny zaměstnance s pozitivním testem, což je 495 skutečně nakažených a 190 falešně pozitivních zdravých pacientů. Výpočtem zjistíme, že pravděpodobnost je přibližně 72 procent. Možná vám tato pravděpodobnost připadá nízká. Ona totiž také znamená, že s pozitivním testem má zaměstnanec dvaceti osmi procentní šanci, že je zdravý, což je docela hodně, a rozhodně je to daleko od dvou procent falešně pozitivních testů, které jsou zadány. Zdánlivý rozpor je způsoben tím, že přestože jsou testy takto spolehlivé, tak nakažených zaměstnanců je velice málo a tyto dvě čísla je něco, co musíme dát do souvislosti. Pět procent nakažených, dvě procenta falešně pozitivních, což jsou podobné hodnoty. A i proto nakažení pozitivní a zdraví pozitivní nejsou tak rozdílní, nebo ten rozdíl není takový, jaký byste možná čekali. Můžeme si to představit na extrémnějším případu. Představte si, že bychom vytvářeli test na nějakou velice vzácnou chorobu, kterou má jenom nula celá jedna procenta populace, tak velice snadno můžeme vytvořit test, který má spolehlivost devadesát devět celých devět procent. A to jednoduše tak, že všechny pacienty prohlásí za negativní a máme jistotu, že se splete nejvýš u nula celá jednoho procenta skutečně nakažených. Nyní si ale pojďme výpočet ukázat ještě jednou na stromovém diagramu bez vymýšlení počtu zaměstnanců, se skutečnými procenty a zadanými pravděpodobnostmi. Na začátku máme sto procent všech zaměstnanců. Víme, že pět procent z nich je nakažených. A také víme, že zbývajících 95 procent je zdravých. Dále víme, že test je falešně negativní v jednom procentu případů, tedy z těchto pěti procentech je falešně negativní jedno procento. Musíme tedy pronásobit pět procent krát jedno procento a dostáváme nula celá nula pět procent. Odsud se vzalo našich pět zaměstnanců. A zbývající jsou správně pozitivně testování, to znamená pět procent krát 99 procent, zbytek z jednoho procenta, což je 4 celá 95 procenta nakažených pozitivních pacientů. Pojďme se podívat do druhé větve se zdravými pacienty, tam máme falešně pozitivní dvě procenta testů. To znamená, že musíme opět pronásobit 95 procent zdravých zaměstnanců krát dvě procenta falešně pozitivních testů. Tím dostáváme jedna celá devět procenta zaměstnanců, kteří jsou zdraví ale falešně pozitivní. A konečně tu máme zdravé negativně testované zaměstnance, kterých je 95 procent krát zbytek z dvou procent, což je devadesát osm procent, což je 93 celých jedna procenta zdravých negativně testovaných zaměstnanců. Do výpočtu podmíněné pravděpodobnosti by nám vstoupily pozitivně testování, což je 4 celá 95 procenta a jedna celá 9 procenta, což vidíme, jak přesně koresponduje s výpočtem pomocí počtu zaměstnanců. Výsledkem je opět 72 procentní pravděpodobnost, že zaměstnanec, který má pozitivní test, je nakažený.