Rozdělení pravděpodobnosti

Rozdělení pravděpodobnosti (někdy také distribuce pravděpodobnosti) náhodné veličiny je pravidlo, kterým se každému jevu popisovanému touto veličinou přiřazuje určitá pravděpodobnost. Rozdělení pravděpodobnosti náhodné veličiny vznikne, pokud je každé hodnotě diskrétní náhodné veličiny nebo intervalu hodnot spojité náhodné veličiny přiřazena pravděpodobnost.

Rozdělení pravděpodobnosti lze také chápat jako zobrazení, které každému elementárnímu jevu přiřazuje určité reálné číslo, které charakterizuje pravděpodobnost tohoto jevu.

Rozdělení pravděpodobnosti diskrétní náhodné veličiny

Pravděpodobnost, že diskrétní náhodná veličina X {\displaystyle X} bude mít po provedení náhodného pokusu hodnotu x {\displaystyle x} , značíme P ( X = x ) {\displaystyle P(X=x)} , P [ X = x ] {\displaystyle P[X=x]} nebo stručně P ( x ) {\displaystyle P(x)} .

Výsledkem jednoho náhodného pokusu je to, že náhodná veličina bude mít právě jednu hodnotu. Všechny hodnoty definičního oboru náhodné veličiny tedy představují úplný systém neslučitelných jevů, což znamená, že součet pravděpodobností všech možných hodnot x {\displaystyle x} diskrétní náhodné proměnné X {\displaystyle X} je roven 1, tzn.

x P [ X = x ] = 1 {\displaystyle \sum _{x}P[X=x]=1}

Pravděpodobnostní funkce

Rozdělení pravděpodobnosti diskrétní náhodné veličiny se tedy vyjádří tak, že se určí pravděpodobnost P ( x ) {\displaystyle P(x)} pro všechna x {\displaystyle x} definičního oboru veličiny X {\displaystyle X} . Pravděpodobnosti jednotlivých hodnot x {\displaystyle x} jsou tedy vyjádřeny funkcí P ( x ) {\displaystyle P(x)} , která se nazývá pravděpodobnostní funkce.

Demonstrace diskrétního rozdělení pravděpodobnosti

Hodnoty pravděpodobností funkce vyjadřujeme obvykle tabulkou, např.

x P(x)
x 1 {\displaystyle x_{1}} P ( x 1 ) {\displaystyle P(x_{1})}
x 2 {\displaystyle x_{2}} P ( x 2 ) {\displaystyle P(x_{2})}
x n {\displaystyle x_{n}} P ( x n ) {\displaystyle P(x_{n})}

Také se používá vyjádření ve formě grafu (viz obrázek). V některých případech lze také použít vyjádření pomocí matematického vzorce.

Znalost pravděpodobnostní funkce lze použít k výpočtu pravděpodobnosti. Například pravděpodobnost, že náhodná veličina X {\displaystyle X} leží mezi hodnotami x 1 {\displaystyle x_{1}} a x 2 {\displaystyle x_{2}} , se určí jako

P [ x 1 X x 2 ] = x = x 1 x 2 P ( x ) {\displaystyle P[x_{1}\leq X\leq x_{2}]=\sum _{x=x_{1}}^{x_{2}}P(x)}

Distribuční funkce diskrétní veličiny

Pomocí pravděpodobnostní funkce lze zavést distribuční funkci vztahem

F ( x ) = P [ X x ] {\displaystyle F(x)=P[X\leq x]}

Distribuční funkce je neklesající a je spojitá zprava. Hodnoty distribuční funkce leží v rozsahu 0 F ( x ) 1 {\displaystyle 0\leq F(x)\leq 1} . Pro diskrétní náhodnou veličinu X {\displaystyle X} lze pro libovolné reálné číslo x {\displaystyle x} vyjádřit distribuční funkci vztahem

F ( x ) = t x P ( t ) {\displaystyle F(x)=\sum _{t\leq x}P(t)}

Vlastnosti

Jestliže hodnoty náhodné veličiny leží v intervalu ( a , b {\displaystyle (a,b\rangle } , pak F ( a ) = 0 {\displaystyle F(a)=0} a F ( b ) = 1 {\displaystyle F(b)=1} .

Distribuční funkci lze, podobně jako pravděpodobnostní funkci, použít k výpočtu pravděpodobnosti, neboť

P [ x 1 < X x 2 ] = F ( x 2 ) F ( x 1 ) {\displaystyle P[x_{1}<X\leq x_{2}]=F(x_{2})-F(x_{1})}

Důležitá diskrétní rozdělení

Rozdělení pravděpodobnosti spojité náhodné veličiny

Distribuční funkce několika normálních rozdělení s různými charakteristikami. Červenou čárou je vyznačeno normované normální rozdělení.
Hustota pravděpodobnosti několika normálních rozdělení.

Spojitá náhodná veličina má spojitou distribuční funkci F ( x ) {\displaystyle F(x)} . Rozdělení spojité náhodné veličiny nelze popsat pravděpodobnostní funkcí v určitém bodě.

Hustota pravděpodobnosti

Podrobnější informace naleznete v článku Hustota pravděpodobnosti.

Hustota pravděpodobnosti je funkce, jejíž hodnotu pro libovolný zvolený prvek z množiny možných vzorků (hodnot náhodné proměnné) lze interpretovat jako relativní četnost hodnoty tohoto prvku v rámci celé množiny možných vzorků daného času.

Rozdělení pravděpodobnosti spojité náhodné veličiny se určuje prostřednictvím funkce, která se nazývá hustota rozdělení pravděpodobnosti (hustota pravděpodobnosti, anglicky Probability Density Function, PDF). Pro spojitou náhodnou veličinu obecně neplatí, že také hustota pravděpodobnosti je spojitá.

Je-li ρ ( x ) {\displaystyle \rho (x)} hustota pravděpodobnosti spojité náhodné veličiny X {\displaystyle X} , pak platí

Ω ρ ( x ) d x = 1 {\displaystyle \int _{\Omega }\rho (x)\mathrm {d} x=1\,} ,

kde Ω {\displaystyle \Omega } je definiční obor veličiny X {\displaystyle X} . Pro hodnoty x {\displaystyle x} mimo definiční obor Ω {\displaystyle \Omega } je hustota pravděpodobnosti nulová, takže ρ ( x ) = 0 {\displaystyle \rho (x)=0} pro x Ω {\displaystyle x\notin \Omega } .

Ze znalosti hustoty pravděpodobnosti ρ ( x ) {\displaystyle \rho (x)} je možné určit pravděpodobnost, že náhodná veličina X {\displaystyle X} nabývá hodnotu z intervalu x 1 , x 2 {\displaystyle \langle x_{1},x_{2}\rangle } , tedy

P [ x 1 X x 2 ] = x 1 x 2 ρ ( x ) d x {\displaystyle P[x_{1}\leq X\leq x_{2}]=\int _{x_{1}}^{x_{2}}\rho (x)\mathrm {d} x}

Pravděpodobnost, že spojitá náhodná veličina nabývá určité (přesně dané) hodnoty, je nulová, což plyne z předchozího vztahu. Důsledkem toho je, že pro spojitou náhodnou veličinu platí vztahy

P [ x 1 X x 2 ] = P [ x 1 < X x 2 ] = P [ x 1 X < x 2 ] = P [ x 1 < X < x 2 ] {\displaystyle P[x_{1}\leq X\leq x_{2}]=P[x_{1}<X\leq x_{2}]=P[x_{1}\leq X<x_{2}]=P[x_{1}<X<x_{2}]}

Distribuční funkce spojité veličiny

Distribuční funkce F ( x ) {\displaystyle F(x)} jednorozměrné reálné náhodné veličiny X {\displaystyle X} se definuje jako pravděpodobnost, že realizace této náhodné veličiny nepřekročí x {\displaystyle x} :

F ( x ) = P [ X x ] {\displaystyle F(x)=P[X\leq x]}

Distribuční funkce je neklesající, zprava spojitá, její limita {\displaystyle -\infty } je nula, v {\displaystyle \infty } pak jedna.

Komplementární distribuční funkce se pak definuje jako 1 F ( x ) {\displaystyle 1-F(x)} .

Pro spojitou náhodnou veličinu s hustotou pravděpodobnosti ρ ( x ) {\displaystyle \rho (x)} se distribuční funkce dá spočítat také podle vztahu

F ( x ) = x ρ ( t ) d t {\displaystyle F(x)=\int \limits _{-\infty }^{x}\rho (t)\mathrm {d} t}

Vlastnosti

Platí, že F ( ) = 0 {\displaystyle F(-\infty )=0} a F ( ) = 1 {\displaystyle F(\infty )=1} .

Distribuční funkci lze použít k výpočtu pravděpodobnosti, neboť

P [ x 1 X x 2 ] = F ( x 2 ) F ( x 1 ) {\displaystyle P[x_{1}\leq X\leq x_{2}]=F(x_{2})-F(x_{1})}

Lze dokázat, že mezi hustotou pravděpodobnosti ρ ( x ) {\displaystyle \rho (x)} a distribuční funkcí F ( x ) {\displaystyle F(x)} platí vztah

ρ ( x ) = d F ( x ) d x {\displaystyle \rho (x)={\frac {\mathrm {d} F(x)}{\mathrm {d} x}}} ,

pokud derivace distribuční funkce v daném bodě x {\displaystyle x} existuje.

Důležitá spojitá rozdělení

Vícerozměrné rozdělení pravděpodobnosti

Sdružená a marginální pravděpodobnost

Mějme n {\displaystyle n} -rozměrný náhodný vektor X {\displaystyle \mathbf {X} } , jehož složkami jsou diskrétní náhodné veličiny X i {\displaystyle X_{i}} . Jejich rozdělení lze popsat sdruženou (simultánní) pravděpodobností

P ( x ) = P ( x 1 , x 2 , . . . , x n ) = P [ X 1 = x 1 X 2 = x 2 X n = x n ] {\displaystyle P(\mathrm {x} )=P(x_{1},x_{2},...,x_{n})=P[X_{1}=x_{1}\cap X_{2}=x_{2}\cap \cdots \cap X_{n}=x_{n}]}

Tento vztah udává pravděpodobnost, že náhodná veličina X 1 {\displaystyle X_{1}} nabude hodnotu x 1 {\displaystyle x_{1}} , náhodná veličina X 2 {\displaystyle X_{2}} nabude hodnoty x 2 {\displaystyle x_{2}} , atd. pro všechna X i {\displaystyle X_{i}} a x i {\displaystyle x_{i}} .

Pro n = 2 {\displaystyle n=2} sdružené pravděpodobnosti zobrazují v korelační tabulce

x y 1 {\displaystyle y_{1}} y 2 {\displaystyle y_{2}} y s {\displaystyle y_{s}} Součet
x 1 {\displaystyle x_{1}} P ( x 1 , y 1 ) {\displaystyle P(x_{1},y_{1})} P ( x 1 , y 2 ) {\displaystyle P(x_{1},y_{2})} P ( x 1 , y s ) {\displaystyle P(x_{1},y_{s})} P 1 ( x 1 ) {\displaystyle P_{1}(x_{1})}
x 2 {\displaystyle x_{2}} P ( x 2 , y 1 ) {\displaystyle P(x_{2},y_{1})} P ( x 2 , y 2 ) {\displaystyle P(x_{2},y_{2})} P ( x 2 , y s ) {\displaystyle P(x_{2},y_{s})} P 1 ( x 2 ) {\displaystyle P_{1}(x_{2})}
x r {\displaystyle x_{r}} P ( x r , y 1 ) {\displaystyle P(x_{r},y_{1})} P ( x r , y 2 ) {\displaystyle P(x_{r},y_{2})} P ( x r , y s ) {\displaystyle P(x_{r},y_{s})} P 1 ( x r ) {\displaystyle P_{1}(x_{r})}
Součet P 2 ( y 1 ) {\displaystyle P_{2}(y_{1})} P 2 ( y 2 ) {\displaystyle P_{2}(y_{2})} P 2 ( y s ) {\displaystyle P_{2}(y_{s})} 1

Pravděpodobnosti P 1 ( x i ) {\displaystyle P_{1}(x_{i})} a P 2 ( y j ) {\displaystyle P_{2}(y_{j})} jsou marginální (okrajové) pravděpodobnosti. Platí tedy

P 1 ( x ) = y P ( x , y ) {\displaystyle P_{1}(x)=\sum _{y}P(x,y)}
P 2 ( y ) = x P ( x , y ) {\displaystyle P_{2}(y)=\sum _{x}P(x,y)}

Dále platí

x y P ( x , y ) = x P 1 ( x ) = y P 2 ( y ) = 1 {\displaystyle \sum _{x}\sum _{y}P(x,y)=\sum _{x}P_{1}(x)=\sum _{y}P_{2}(y)=1}

Sdružená a marginální distribuční funkce

Sdruženou (simultánní) distribuční funkci lze pro n {\displaystyle n} -rozměrný náhodný vektor X {\displaystyle \mathbf {X} } diskrétních veličin X i {\displaystyle X_{i}} definovat jako

F ( x ) = F ( x 1 , x 2 , . . , x n ) = F ( X 1 x 1 X 2 x 2 X n x n ) {\displaystyle F(x)=F(x_{1},x_{2},..,x_{n})=F(X_{1}\leq x_{1}\cap X_{2}\leq x_{2}\cap \cdots \cap X_{n}\leq x_{n})}

Sdružená distribuční funkce (pro dvě proměnné X, Y) splňuje podmínky

F ( , y ) = F ( x , ) = F ( , ) = 0 {\displaystyle F(-\infty ,y)=F(x,-\infty )=F(-\infty ,-\infty )=0}
F ( , ) = 1 {\displaystyle F(\infty ,\infty )=1}

Podobné podmínky platí také pro vícerozměrné náhodné vektory.

Marginální (okrajové) distribuční funkce lze pro vektor dvou proměnných X {\displaystyle X} a Y {\displaystyle Y} zapsat vztahy

F 1 ( x ) = F ( x , ) {\displaystyle F_{1}(x)=F(x,\infty )}
F 2 ( y ) = F ( , y ) {\displaystyle F_{2}(y)=F(\infty ,y)}

Podobně lze marginální distribuční funkce určit také v případě vícerozměrných náhodných vektorů.

Sdružená a marginální hustota pravděpodobnosti

Rozdělení dvou spojitých náhodných veličin je možné popsat sdruženou hustotou pravděpodobnosti f ( x , y ) {\displaystyle f(x,y)} . Sdružená hustota pravděpodobnosti musí splňovat podmínku

Ω [ Ω f ( x , y ) d x ] d y = 1 {\displaystyle \int _{\Omega }\left[\int _{\Omega }f(x,y)\mathrm {d} x\right]\mathrm {d} y=1}

Marginální hustoty pravděpodobnosti se určí jako

f 1 ( x ) = Ω f ( x , y ) d y {\displaystyle f_{1}(x)=\int _{\Omega }f(x,y)\mathrm {d} y}
f 2 ( y ) = Ω f ( x , y ) d x {\displaystyle f_{2}(y)=\int _{\Omega }f(x,y)\mathrm {d} x}

Sdruženou distribuční funkci pak je

F ( x , y ) = x [ y f ( t , u ) d t ] d u {\displaystyle F(x,y)=\int _{-\infty }^{x}\left[\int _{-\infty }^{y}f(t,u)\mathrm {d} t\right]\mathrm {d} u}

Ze sdružené distribuční funkce lze naopak získat sdruženou hustotu pravděpodobnosti

f ( x , y ) = 2 F ( x , y ) x y {\displaystyle f(x,y)={\frac {\partial ^{2}F(x,y)}{\partial x\partial y}}}


Podobně lze postupovat také v případě n {\displaystyle n} -rozměrných vektorů spojitých náhodných veličin. Sdruženou hustotu pravděpodobnosti je pak možné získat jako

f ( x ) = f ( x 1 , x 2 , . . . , x n ) = n F ( x 1 , x 2 , . . . , x n ) x 1 x 2 x n {\displaystyle f(\mathbf {x} )=f(x_{1},x_{2},...,x_{n})={\frac {\partial ^{n}F(x_{1},x_{2},...,x_{n})}{\partial x_{1}\partial x_{2}\cdots \partial x_{n}}}}

Marginální pravděpodobnost lze definovat pro libovolnou skupinu m {\displaystyle m} veličin ( m < n {\displaystyle m<n} ) daného n {\displaystyle n} -rozměrného náhodného vektoru. Rozdělení je závislé pouze na daných m {\displaystyle m} veličinách a na zbývajících n m {\displaystyle n-m} veličinách nezávisí. Pro m > 2 {\displaystyle m>2} je nutno rozlišovat podvojnou nezávislost a nezávislost vzájemnou.

Jsou-li veličiny X i {\displaystyle X_{i}} vzájemně nezávislé, pak platí

F ( x ) = F 1 ( x 1 ) F 2 ( x 2 ) F n ( x n ) {\displaystyle F(\mathbf {x} )=F_{1}(x_{1})F_{2}(x_{2})\cdots F_{n}(x_{n})}
P ( x ) = P 1 ( x 1 ) P 2 ( x 2 ) P n ( x n ) {\displaystyle P(\mathbf {x} )=P_{1}(x_{1})P_{2}(x_{2})\cdots P_{n}(x_{n})}
f ( x ) = f 1 ( x 1 ) f 2 ( x 2 ) f n ( x n ) {\displaystyle f(\mathbf {x} )=f_{1}(x_{1})f_{2}(x_{2})\cdots f_{n}(x_{n})}

Podmíněné rozdělení pravděpodobnosti

Podmíněné rozdělení náhodné veličiny X {\displaystyle X} vzhledem k veličině y {\displaystyle y} je rozdělení veličiny X {\displaystyle X} za podmínky, že náhodná veličina Y {\displaystyle Y} nabyla hodnoty y {\displaystyle y} .

Podmíněné rozdělení je definováno jako podíl rozdělení sdruženého a marginálního.

Pro dvě diskrétní náhodné veličiny X , Y {\displaystyle X,Y} je možné podmíněnou pravděpodobnost veličiny X {\displaystyle X} vzhledem k  Y {\displaystyle Y} zapsat jako

P ( x | y ) = P ( x , y ) P 2 ( y ) {\displaystyle P(x|y)={\frac {P(x,y)}{P_{2}(y)}}}

pro P 2 ( y ) 0 {\displaystyle P_{2}(y)\neq 0} , kde P 2 ( y ) {\displaystyle P_{2}(y)} je marginální pravděpodobnost a P ( x , y ) {\displaystyle P(x,y)} je pravděpodobnost sdružená.

Obdobně vznikne pro podmíněnou pravděpodobnost veličiny Y {\displaystyle Y} vzhledem k  X {\displaystyle X} vztah

P ( y | x ) = P ( x , y ) P 1 ( x ) {\displaystyle P(y|x)={\frac {P(x,y)}{P_{1}(x)}}}

pro P 1 ( x ) 0 {\displaystyle P_{1}(x)\neq 0} , kde P 1 ( x ) {\displaystyle P_{1}(x)} je marginální pravděpodobnost a P ( x , y ) {\displaystyle P(x,y)} je opět sdružená pravděpodobnost.

Podmíněná distribuční funkce

Podmíněné distribuční funkce zapsat zapsat jako

F ( x | y ) = t x P ( t , y ) P 2 ( y ) {\displaystyle F(x|y)=\sum _{t\leq x}{\frac {P(t,y)}{P_{2}(y)}}}
F ( y | x ) = t y P ( x , t ) P 1 ( x ) {\displaystyle F(y|x)=\sum _{t\leq y}{\frac {P(x,t)}{P_{1}(x)}}}

Podmíněná hustota pravděpodobnosti

U dvourozměrného náhodného vektoru, jehož složkami jsou spojité náhodné veličiny X {\displaystyle X} a Y {\displaystyle Y} , lze podmíněné hustoty pravděpodobnosti vyjádřit jako

f ( x | y ) = f ( x , y ) f 2 ( y ) {\displaystyle f(x|y)={\frac {f(x,y)}{f_{2}(y)}}}

pro f 2 ( y ) 0 {\displaystyle f_{2}(y)\neq 0} a

f ( y | x ) = f ( x , y ) f 1 ( x ) {\displaystyle f(y|x)={\frac {f(x,y)}{f_{1}(x)}}}

pro f 1 ( x ) 0 {\displaystyle f_{1}(x)\neq 0} , kde f ( x , y ) {\displaystyle f(x,y)} je sdružená hustota pravděpodobnosti a f 1 ( x ) {\displaystyle f_{1}(x)} a f 2 ( y ) {\displaystyle f_{2}(y)} jsou marginální hustoty pravděpodobnosti.

Pro podmíněné distribuční funkce spojitých náhodných veličin X , Y {\displaystyle X,Y} pak platí

F ( x | y ) = x f ( t , y ) d t f 2 ( y ) {\displaystyle F(x|y)={\frac {\int _{-\infty }^{x}f(t,y)\mathrm {d} t}{f_{2}(y)}}}
F ( y | x ) = y f ( x , t ) d t f 1 ( x ) {\displaystyle F(y|x)={\frac {\int _{-\infty }^{y}f(x,t)\mathrm {d} t}{f_{1}(x)}}}

Charakteristiky rozdělení náhodné veličiny

Související informace naleznete také v článku Charakteristika náhodné veličiny.

Charakteristiky náhodné veličiny jsou vhodně vybrané číselné údaje, které shrnují základní informace o rozdělení pravděpodobnosti náhodné veličiny. Charakteristiky poskytují pouze základní a hrubou představu o náhodné veličině, neboť charakteristiky (obvykle) nepostačují k jednoznačnému popisu rozdělení pravděpodobnosti. Naproti tomu rozdělení pravděpodobnosti sice poskytuje jednoznačný popis náhodné veličiny, obvykle však není dostatečně přehledné.

Důležitými charakteristikami rozdělení jsou střední hodnota a rozptyl.

Literatura

  • HAMPL, Martin. Realita, společnost a geografická organizace: hledání integrálního řádu. Praha : DemoArt, 1998. ISBN 80-902154-7-5

Související články

Externí odkazy

  • Logo Wikimedia Commons Obrázky, zvuky či videa k tématu rozdělení pravděpodobnosti na Wikimedia Commons
Autoritní data Editovat na Wikidatech
  • NKC: ph125263
  • PSH: 7723
  • BNF: cb119780901 (data)
  • GND: 4121894-2
  • LCCN: sh85038545
  • NDL: 00564751
  • NLI: 987007557953805171