Bayesův teorém

Bayesova věta: ilustrace pomocí dvou spojených třídimenzionálních stromových diagramů

Bayesova věta (alternativně Bayesova formule, Bayesův vzorec) je věta teorie pravděpodobnosti, která udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností[1]. Poprvé na tuto souvislost upozornil anglický duchovní Thomas Bayes (1702–1761) v posmrtně vydaném článku An Essay towards solving a Problem in the Doctrine of Chances (1763). Roku 1774 větu znovu objevil francouzský matematik a fyzik Pierre-Simon Laplace, nicméně postupně upadla v zapomnění a rozšířila se až v 2. polovině 20. století.[2] Frekvenční interpretace pravděpodobnosti se poté nazývá klasická či Laplaceova, právě podle Pierre-Simona Laplace.

Jedno z mnoha použití Bayesovy věty je v oblasti statistické inference (konkrétně Bayesova inference). Věta taktéž položila základy relativně novému směru statistiky - Bayesovská statistika.[3]

Znění věty

Jednoduchá forma Bayesovy věty

Mějme dva náhodné jevy a , přičemž . Potom platí:

kde
  • je podmíněná pravděpodobnost jevu za předpokladu, že nastal jev
  • je podmíněná pravděpodobnost jevu podmíněná výskytem jevu
  • a jsou pravděpodobnosti jevů a

Bayesova věta

Mějme náhodné jevy a , pro . Nechť jsou jevy vzájemně neslučitelné pro každé a nechť v každém pokusu nastává právě jeden z nich, takže součet jejich pravděpodobností je roven jedné:

Potom platí:

kde
  • je podmíněná pravděpodobnost jevu za předpokladu, že nastal jev
  • je podmíněná pravděpodobnost jevu za předpokladu, že nastal jev
  • je pravděpodobnost jevu

Důkaz Bayesovy věty

Pro jednoduchost uvažujme pouze dva náhodné jevy. Důkaz Bayesovy věty vychází z definice podmíněné pravděpodobnosti:

kde je pravděpodobnost průniku jevů , . Symetricky:

Vyjádřením pravděpodobnosti průniku v obou rovnicích a následným dosazením jedné rovnosti do druhé, získáme výslednou Bayesovu formuli:

Alternativní forma Bayesovy věty

Při počítání s Bayesovou formulí je výhodné znát následující úpravu, jelikož často neznáme pravděpodobnost náhodných jevů, nýbrž pouze jejich pravděpodobnosti podmíněné.

Tato formule spočívá ve vhodné úpravě jmenovatele:

kde využíváme vztahu:

Po dosazení do původní věty tedy dostáváme:

[4]

Opět lze jednoduchými úvahami zobecnit pro více jevů. Mějme náhodné jevy , . Pravděpodobnost jevu lze interpretovat jako sumu součinu pravděpodobností a (Věta o úplné pravděpodobnosti), tj.

Podmíněnou pravděpodobnost jevu za pomocí výše zmíněných úvah vyjádříme následovně:

Příklady použití

Testování na drogy [5]

Nyní si ukažme příklad použití Bayesova pravidla při testování na drogy. Vyjdeme z předpokladů, že test na prokázání drog má senzitivitu 99 % a specificitu 99 %. Test se na první pohled zdá být docela přesný, ale pomocí Bayesovy věty lze ukázat, že netriviální procento testovaných může být nesprávně označeno za uživatele drog. Nechť je v testovaném podniku prevalence 0,5 %, tj. 0,5 % ze zaměstnanců drogy opravdu užívá.

Jaká je pravděpodobnost, že osoba s pozitivním testem drogy opravdu používá?

Označme si uživatele drog jako "A", "N" všechny ostatní. Nechť "+" znamená pozitivní test. Popišme si následující veličiny:

  • pravděpodobnost, že osoba je uživatelem drog (prevalence), tj.
  • pravděpodobnost, že osoba není uživatelem drog; zjistíme pomocí doplňkového jevu, tzn.
  • pravděpodobnost, že test je pozitivní, když je osoba uživatelem drog; jinými slovy sensitivita testu:
  • je pravděpodobnost, že test bude pozitivní, i přesto, že osoba není uživatelem drog; lze interpretovat jako doplněk k specificitě testu:
  • je pravděpodobnost, že test bude pozitivní.

Pravděpodobnost sice zadanou nemáme, ale lze ji vypočítat dle výše zmíněné formule:

Po dosazení dostáváme výsledek 1,49 %:

Díky těmto údajům můžeme vypočítat žádanou pravděpodobnost pomocí Bayesovy věty:

Všimněme si, že i přes vysokou specificitu a senzitivitu je výsledek testu poměrně nepřesný. U zaměstnance podniku s pozitivním testem je jen 33% pravděpodobnost, že je skutečně uživatelem drog.

Specificita a Sensitivita

Senzitivita testu (alt. citlivost testu) nám udává úspěšnost, s níž test zachytí přítomnost sledovaného stavu (nemoci)[6] u daného subjektu. V našem příkladu to znamená, že test správně identifikuje skutečné uživatele drog v 99 % případů.

Specificita testu nám vyjadřuje úspěšnost, s níž test určí případy, u nichž zkoumaný stav (nemoc) nenastává. 99% specificita testu znamená, že test s 99% pravděpodobností správně vyloučí osobu, která drogy nepoužívá.

Odkazy

Reference

  1. OBERHELMAN, David D. Stanford Encyclopedia of Philosophy2001311Principal Editor, Edward N. Zalta. Stanford Encyclopedia of Philosophy. Stanford, CA: The Metaphysics Research Lab, Center for the Study of Language and Information, Stanford University 1999; updated every three months. Internet URL: http://plato.stanford.edu, ISSN 1095-5054 1095-5054 Gratis Last visited: May 2001. Reference Reviews. 2001-06, roč. 15, čís. 6, s. 9–9. Dostupné online [cit. 2022-02-25]. ISSN 0950-4125. DOI 10.1108/rr.2001.15.6.9.311. 
  2. https://www.lesswrong.com/posts/RTt59BtFLqQbsSiqd/a-history-of-bayes-theorem - A History of Bayes' Theorem
  3. M., Bernardo, José. Bayesian Theory.. [s.l.]: John Wiley & Sons, Ltd Dostupné online. ISBN 978-0-470-31771-6, ISBN 0-470-31771-X. OCLC 781323108 
  4. BAZETT, Trefor. Introduction to Bayes’ Theorem. Cham: Springer International Publishing Dostupné online. ISBN 978-3-030-95792-6. 
  5. Bayesova věta [online]. [cit. 2018-03-17]. Dostupné online. 
  6. Senzitivita testu [online]. [cit. 2020-12-08]. Dostupné online. 

Související články

Externí odkazy

Zdroj