Dotaz k výpočtu pravděpodobnosti

Dobrý den, můj dotaz souvisí co se týče pravděpodobnosti. Zajímám se o různé strategie a v určitém dokumentu jsem viděl test s hodem mincí (panna, orel). Uváděli, že za 10 hodů (počet prováděl profesor na univerzitě) je pravděpodobnost 7 stejných stran, dejme tomu 7x v řadě panna - něco přes 2%, pokud bude hodů 100, pravděpodobnost se zvýší na 32,75%. Můj dotaz zní, zda se dá vypočítat pravděpodobnost, pokud bychom predikovali výsledek hodu za následujících 7 hodů střídavě panna - orel. Předem děkuji každému, kdo mi danou otázku pomůže vyřešit.


Obtížnost: Střední škola
Dominik Z.

Dominik Z.

13. 04. 2020   11:27

7 odpovědí

Tomáš B.
Tomáš B.
13.04.2020 12:43:21

Ahoj Dominiku, určitě se to dá spočítat, ale jedná se o téma, které je daleko za schopnostmi studenta střední školy a trochu jsi popletl i původní úlohu :-)

To, o čem mluvíš, se používá jako protipříklad proti lidské intuici. Zadáním je spočítat pravděpodobnost, že v dlouhé řadě nezávislých hodů se objeví alespoň 7 po sobě jdoucích pan. Pro 10 hodů je ppst menší než 2%. Kdyby ses ovšem ptal na pravděpodobnost, že se objeví přesně 7 po sobě jdoucích pan (a ne víc), je šance v 10 hodech už jen 1.2%. Smyslem je ukázat, že v delších sekvencích pokusů se překvapivě brzo objevují určité vzory, které bychom intuitivně označili jako ne-náhodné. A co si pamatuju, tak samotné odvození a důkaz obecného výsledku nám tehdy zabral přes 2 hodiny čistého času.

Tvoje otázka se týká predikce výsledku v následujích hodech. To je ovšem úplně jiná úloha, která s tou předchozí vůbec nesouvisí.

Predikce nesouvisí s pravděpodobností a můžeš predikovat pravděpodobnost nebo spočítat pravděpodobnost predikce, ale v tomhle kontextu jsi to slovo asi použít nechtěl.

Spočítat pravděpodobnost jevu v následujících hodech, jak se ptáš, je naopak velmi jednoduché a není těžké dokázat, že ať už si zvolíš libovolný vzor o délce K, bude šance na jeho výskyt 2^K.

Tuším, že tvoje otázka směřovala trochu jiným směrem, ale pravděpodobnost je opravdu poměrně náročný obor a je dost těžké dokonce i správně zformulovat zadání, abys spočítal to, co opravdu spočítat chceš.

Dominik Z.
Dominik Z.
13.04.2020 16:04:04

Děkuji za detailnější odpověď. Již několik let se zabývám strategii Martingale (zdvojování sázek). Jak u mince, tak u rulety je podobná pravděpodobnost; u rulety barvy červená, černá tedy 48,6%. Z dokumentu mě překvapilo, že pokud za 10 hodů je pravděpodobnost, že padne ta samá strana, okolo 2%, tak ze 100 hodů pravděpodobnost činí přes 32%. Jakožto hod minci je 50/50, ruleta podobně. Pokud mám kapitál na 6 proher, tak kdyby jsem nějaký čas sázel ruletu tak je pravděpodobnost, že přijdu o svůj vklad přes 32%. Ze zkušenosti jsem si všiml, že se mnohem méně stává pravý opak, pokud další sázku měníme barvy, např. červená další sázka bude černá, ne jako klasicky Martingale pořad stejnou sázku dokud nepadne. Jelikož je stejná pravděpodobnost, tak i na tento systém by ze 100 hodů byla pravděpodobnost přes 32%. Připadá mi méně pravděpodobné, že by výsledek byl nahodile přesně opačný než bych vsadil. Pokud se tu najde někdo kdo by mi s touto otázkou věděl pomoci budu rád. Děkuji.

Tomáš B.
Tomáš B.
13.04.2020 17:50:43

Jasně, teď už chápu směr dotazu :-) V původní odpovědi jsem chtěl zmínit problém martingale i gambler's fallacy, ale říkal jsem si, že bych odpověď moc komplikoval.

Systém, o kterém mluvíš, znám, před pár lety jsem ho viděl na nějakých webových stránkách, které ho vysvětlovaly a byly tam empirické "důkazy", že funguje a vydělává. Musím varovat, že tu stránku (která byla součástí affiliate programu nějakého online kasina) musel dělat statistik a chvíli mi trvalo, než jsem v oněch důkazech našel chytře skryté podvody. Takže ne, nefunguje.

Nejdřív samotná úloha martingale sázek. V teoretickém případě zdvojování sázky sice nemůžeš prohrát, ale ve chvíli, kdy si stanovíš jakýkoliv limit (stoploss) aktuální prohry, nemůžeš nikdy vyhrát. Limit může být v praxi daný například množstvím všech peněz na světě.

Ale řekněme, že máš stoploss po 6 sázkách a začínáš sázet $1. Herna je férová a hází se korunou, takže šance na výtězství v každém kroku je 50%. Potom je tvůj zisk Z ve střední hodnotě roven E[Z] = 63/64 - 63/64 = $0, tedy nevyhraješ ani neprohraješ.

Jenže herny férové nejsou. Ne moc, jenom trochu, aby to hráče neodradilo. Šance na vítězství bude například 49%. V tu chvíli je očekávaný zisk E[Z] = $-2.36. A pokud bude šance jen 48%, bude očekávaný zisk E[Z] = $-4.65. To je jen jednoduchá pravděpodobnost, která říká, že v dlouhodobé perspektivě nemůžeš vyhrát, pokud nebudeš v okamžité výhodě. Navíc nezohledňuju riziko okamžitého bankrotu, kde je to o řád složitější.

Výherní systém jsme rozbili a teď, v čem je jádro problému? Půjčíme si něco málo z teorie her. Budeme spolu hrát sudá-lichá, oba naráz řekneme číslo 0 nebo 1 a pokud je součet našich čísel sudý, vyhraješ, pokud je lichý, vyhraju já.

Protože na mě chceš vyzrát, říkáš 0 s ppstí, P(0) = p a říkáš 1 s ppstí P(1) = 1 - p. Mojí motivací je neprohát, takže budu dávat 0 nebo 1 se stejnou ppstí, P(0) = P(1) = 1/2. Potom je šance na tvoji výhru P(0+0 nebo 1+1) = p/2 + (1-p)/2 = 1/2.

To znamená, že moje neprohrávající strategie vede na konci dne na remízu (tomu se říká Mixed-strategy Nash equilibrium). A znamená to, že pokud kasino dává červenou a černou se stejnou šancí, nemůžeš vyhrát a na konci dne budeš v mínusu kvuli zelené nule.

A teď tvůj dotaz ohledně konsekutivních výsledků, kde můžu vysvětlení opřít o předchozí odstavce. Pokud totiž jedna strana zvolí uvedenou neprohrávající strategii, je jedno co a jak budeš sázet, také je jedno, kdy vstoupíš do hry, vždy budeš mít stejnou šanci jestli se trefíš nebo ne (a proto je tam zelená barva, aby vyhrálo kasino).

Částečně tady vstupuje do hry psychologie, protože si nedokážeš pamatovat všechny možné sekvence, abys ocenil jejich jedinečnost, ale šance na řadu barev RRRRRR je stejná jako šance na BBBBBB a je stejná jako šance na BRRBBR nebo RBBRRR, jenže když tam nevidíš vzor, říkáš si, že je to "více" náhodné. Tomu se říká gambler's fallacy.

Poslední vysvětlení se týká jevu, kdy si říkáš, že střídající se vzory se objevují častěji, než pravidelné. To je a není pravda. Vrátím se k původnímu problému 10 hodů:

  • ppst, že padne alespoň 7x za sebou panna = 1.96%

  • ppst, že dostaneme alespoň 7 po sobě jdoucích hodů, které začínají pannou a střídají se = 2.7%

  • ppst, že dostaneme alespoň 7 po sobě jdoucích hodů, které začínají orlem a střídají se = 2.7%

  • ppst, že dostaneme alespoň 7 po sobě jdoucích hodů, které se střídají = 3.9%

Takže je opravdu vyšší šance získat střídající vzory? Bohužel ne :-) Vzhledem k tomu, že už jsem dokázal, že ppsti predikce při hodech bez preferencí jsou vždy 1/2 (v případě férové mince), byl by to paradox. Jeho vysvětlení je ale jednoduché.

Vzor 1111111 dostaneš jako podmnožinu sekvence složené z alespoň 7 jedniček a nikdy jinak. Ale vzor 1010101 můžeš dostat jako podmnožinu více sekvencí, které mají neprázdný průnik (to je problém inkluze a exkluze), a proto máš tady zdánlivě větší šanci.

Paradox odstraníš ve chvíli, kdy se ptáš na šanci, že najdeš 1111111 nebo 0000000 a šanci, že najdeš 1010101 nebo 0101010. V tu chvíli zjistíš, že jsou pravděpodobnosti stejné, protože efekt inkluze a exkluze zmizel.

Souhlasí: 1    
Dominik Z.
Dominik Z.
13.04.2020 18:15:54

Děkuji mockrát, je vidět že matematice opravdu rozumíte. Bylo by možné dát mi na vás kontakt třeba email? Pokud nechcete zde veřejně můžete mi napsat na xxx.

Edit: E-mail smazán administrátorem. Vždy používejte pro komunikaci veřejné fórum Mathematicatoru, aby z vaší odpovědi mohli těžit i ostatní.

Tomáš B.
Tomáš B.
13.04.2020 19:23:35

To jsou jen základy pravděpodobnosti, když napíšeš dotaz sem, máš větší šanci, že dostaneš odpověď.

Dominik Z.
Dominik Z.
13.04.2020 19:40:08

Dobře to jsem rád, jen mě tak napadlo. Takže v podstatě když je pravděpodobnost ze 100 hodů na 1111111 něco přes 32% tak na 0101010 je úplně stejná jestli to chápu správně.

Tomáš B.
Tomáš B.
13.04.2020 22:31:54

Není, jak už jsem popsal v předchozím odstavci.

Koukni, když se ptáš na ppst 111, tak může být obsažená pouze v sekvencích 111, 1111, ...

Když se ale ptáš na ppst 101, tak může být obsažená v sekvencích 101, 1010, 0101, 10101, ...

Proto je ppst alternující sekvence vyšší.

Nicméně (!!!), tahle úvaha vůbec nesouvisí se sázkou na další barvu, tam je ppst 111 i 101 stejná a směr tvých úvah ukazuje na falešné přesvědčení, že na základě předchozích pokusů můžeš určit ten další, tomu se říká gambler's fallacy.

V tomhle bodě je dobré si uvědomit, že se dál nehneš. Na pochopení je potřeba trochu vyšší matematiky a velká preciznost. Ty mícháš pravděpodobnosti různých jevů a nevidíš v nich rozdíl, to je přirozené, protože teorie pravděpodobnosti umí být hodně neintuitivní. Takže jedna rada na závěr - nesázej, nemůžeš vyhrát!

Pro napsání komentáře se musíte přihlásit.