Pravděpodobnost výběru sudého čísla

Přeji pěkné odpoledne,

nedávno jsem se setkal s na první pohled poměrně triviální úlohou na výpočet pravděpodobnosti. Bohužel se okolo postupu řešení rozvířila poměrně divoká názorová bouře. Uvedu zde tedy zadání úlohy, svoje přístupy k řešení a rovněž přístupy svých oponentů. Chtěl bych tedy poprosit o sdělení, jak byste k řešení přistupovali vy, a především by mě zajímal váš názor na to, proč tyto dva postupy vedou ke zcela odlišnému výsledku (tj. který přístup je nevalidní a ve kterém kroku).

Zadání zní přibližně následovně:

Uvažujme o potenciálním generátoru náhodných čísel, který náhodně generuje čísla z nekonečné množiny přirozených čísel (zde definováno jako kladná celá čísla). Jaká je pravděpodobnost, že takové náhodně vygenerované přirozené číslo bude sudé?

Dle mého názoru je zadání nedostatečné, protože vůbec nepopisuje, jaké diskrétní rozložení pravděpodobnosti tento generátor simuluje.

Generátor zde můžeme chápat jako náhodnou veličinu \(X\), která nabývá hodnot z nekonečného výběrového prostoru \(\Omega = \mathbb{ N} \). Náhodnou veličinu zde musí nutně popisovat diskrétní pravděpodobnostní funkce \( p: \Omega \rightarrow \left< 0,1 \right>,\) kde \(\sum_{ i \in \Omega} \left(p \left( i \right)\right) = 1 \), tedy suma pravděpodobností všech jevů z výběrového prostoru je \(1\).

Jelikož zřejmě existuje nekonečné množství různých takových funkcí \(p\), pak předpokládám, že pro každé \(x \in \left< 0,1 \right> \) existuje taková pravděpodobnostní funkce \(p_x\), aby platilo \(\sum_{ i \in \Omega} p_x(2 \cdot i) = x \), tedy můžeme sestrojit všechny takové náhodné veličiny \(X\), aby pravděpobnost, že tato náhodná veličina nabude sudé hodnoty, byla potenciálně rovna všem hodnotám z intervalu \(\left<0,1\right>\).

Tedy ještě jednou - odpovědí na úlohu by bylo, že pravděpodobnost vygenerování sudého čísla může být libovolná, tj. jakékoliv číslo z intervalu \(\left<0,1\right>\), přičemž záleží na zvoleném rozložení pravděpodobnosti.

Pokud bychom však zadání upravili a dodali, že každé číslo může být vygenerováno se stejnou pravděpodobností, pak dle mého názoru neexistuje žádné řešení, protože taková náhodná veličina nemůže ani teoreticky existovat. Jelikož totiž neexistuje žádná nekonečná řada daná aritmetickou posloupností s nulovou diferencí (tj. geometrickou posloupností s kvocientem \(1\)), která by konvergovala k hodnotě \(1\), pak není možné sestrojit žádnou takovou pravděpodobnostní funkci, která by tuto náhodnou veličinu popisovala. Úloha by tedy neměla žádné řešení, nemůžeme určit pravděpodobnost, že náhodná veličina nabude sudé hodnoty, protože náhodná veličina splňující zadané podmínky nemůže existovat.

Tolik k mému řešení úlohy, nyní bych popsal alternativní řešení oponentů, které vede k úplně jiným výsledkům. V tuto chvíli předpokládáme, že pravděpodobnost, že náhodná veličina nabude nějaké hodnoty, je pro všechny prvky výběrového prostoru dle zadání stejná.

Toto řešení využívá jiné přístupy. Předpokládáme, že generujeme náhodná čísla z množiny \(\mathbb{ N} _a \triangleq \){ \(n \in \mathbb{ N} |n \leq a\)} , tedy z množiny, která obsahuje všechna přirozená čísla menší nebo rovna \( a \).

Tato množina tvoří výběrový prostor diskrétní náhodné veličiny \(X_a\), jejíž pravděpodobnostní funkce je definovaná pro každé \(x \in \mathbb{ N} _a \) jako \(p\left(X_a = x\right) = \frac{ 1} { a} \), tedy každé číslo je generováno se stejnou pravděpodobností. Tuto náhodnou veličinu sestrojit můžeme, neboť její výběrový prostor je konečná množina.

Pro sudé \(a\) je v takové množině \(\frac{ a} { 2} \) sudých čísel, zatímco pro liché \(a\) taková množina obsahuje \(\frac{ a-1} { 2} \) sudých čísel, obecně tedy obsahuje \(\lfloor\frac{ a} { 2} \rfloor\) sudých čísel, kde \(\lfloor.\rfloor: \mathbb{ R} \rightarrow \mathbb{ Z} \) je funkce zobrazující reálné číslo na nejbližší nižší (nebo stejné) celé číslo.

Pravděpodobnost, že náhodná veličina \(X_a\) nabude sudé hodnoty, je tedy \(\frac{ \lfloor \frac{ a} { 2} \rfloor} { a} \).

Pokud budeme nyní \(a\) přibližovat nekonečnu, měli bychom potenciálně konvergovat k hodnotě, jež je rovna řešení úlohy.

\(\lim_{ x \to \infty} \frac{ \lfloor \frac{ a} { 2} \rfloor} { a} = \frac{ 1} { 2} \),

tedy pravděpodobnost, že náhodná veličina \(X_a\) pro nekonečný výběrový prostor nabude sudé hodnoty, je \(\frac{ 1} { 2} \).

Jak tedy vidíte, byly použity dva postupy, které jsou na první pohled oba korektní (nebo tedy alespoň já prostě nevidím ani na jednom z nich žádný nedostatek). Velice by mě tedy zajímalo, jaký problém zde objevíte vy. Byl bych rád, kdybyste se zaměřili na to, v jakém kroku se které řešení rozpadá, a proč není možné jej použít.

Moje otázka tedy zní: Jak je možné, že dva na první pohled solidní přístupy k řešení vedou ke zcela jiným výsledkům? Dle prvního postupu žádné řešení neexistuje a nemůže existovat, dle druhého je výsledkem \(\frac{ 1} { 2} \).

Otázku jsem již pokládal na webu https://www.ontola.com/cs/ondi/ttmzxy/pravdepodobnost…, ale tam jsme se ničeho nedobrali.

Mimochodem, nejedná se o školní úlohu, kategorii školy udávám jen proto, že bez ní není možné příspěvek odeslat.

Děkuji předem za odpovědi a přeji příjemný zbytek odpoledne.

✓   Téma bylo vyřešeno.

Obtížnost: Vysoká škola
Tomáš K.

Tomáš K.

26. 01. 2021   16:33

2 odpovědi

Tomáš B.
Tomáš B.
26.01.2021 18:20:02

Ahoj Tomáši,

nemáš zrovna jednoduché otázky :)

Takže, předpokládám, že víš, že pravděpodobnost je speciální typ funkce splňující základní axiomy, nezápornost, jednotu a spočetnou aditivitu, obvykle ji označujeme jako míra. Na výpočet pravděpodobnosti potřebuješ měřitelný prostor a pokud dostaneš "generátor" bez dalšího upřesnění, opravdu nemáš co počítat.

Pak máš nějaké předpoklady o nutnosti diskrétní pravděpodobnostní funkce, což jednoduše není pravda. Když to řeknu jinak, dokud platí axiom o spočetné aditivitě, tak diskrétní uniformní funkce nad spočetným prostorem nemůže existovat, což je poměrně jednoduché dokázat, tudíž nutně potřebuješ spojitou funkci a kontinuum.

Kolegové, kteří argumentují limitou pravděpodobnosti konečných prostorů, mají pravdu, ale jedná se o intuitivní argument a v konečném důsledku není úplně korektní, ale je opravitelný.

Jak jsem říkal, pod spočetnou aditivitou nelze mít vlastní míru, aby pravděpodobnost nad spočetným prostorem byla uniformní. Ovšem lze využít obecnější verzi axiomu a můžeš spočetnou aditivitu nahradit konečnou aditivitou. Pod konečnou aditivitou je možné použít limitní argument konečných pravděpodobností.

Podle Hahn-Banachovy věty lze na normovaném vektorovém prostoru každý omezený lineární funkcionál rozšířit na spojitý lineární funkcionál, aniž bys změnil jeho normu. To garantuje existenci limity v tom smyslu, jak ji uvádíš a pravděpodobnost výběru sudého čísla bude 1/2

Pokud chápeš omezení plynoucí z definice Riemannova integrálu, tak víš, že ne na všech prostorech jsi schopen zadefinovat pravděpodobnost. Z toho důvodu zavádíme míru ve smyslu Lebesgueova integrálu, protože pak můžeme definovat pravděpodobnost na více prostorech a taky můžeme mít více typů hustoty.

Ty se snažíš aplikovat svoje znalosti na problém, který takhle řešitelný není, což ovšem neznamená, že se jedná o neřešitelný problém. :)

Souhlasí: 2    
Tomáš K.
Tomáš K.
26.01.2021 19:17:52

Zdravím, Tomáši,

už tomu rozumím, děkuji moc za poměrně vyčerpávající odpověď a přeji příjemný zbytek večera!

Pro napsání komentáře se musíte přihlásit.