Otázka:
Kdo zavedl náhodné proměnné do pravděpodobnosti?
Conifold
2015-04-22 07:22:58 UTC
view on stackexchange narkive permalink

Myslel jsem si, že odpověď je Kolmogorov. Takže Shafer-Vovkova recenze Kolmogorovovy slavné axiomatizace pravděpodobnosti z roku 1933 mě trochu překvapila: " Dnes již není známo to, co věděl Frechet a jeho současníci. Kolmogorov známe a co následovalo; většinou jsme zapomněli na to, co předcházelo ... Náš přehled o tom potvrdí, co Frechet řekl v roce 1937 a co říká Kolmogorov v předmluvě: byla to syntéza a manuál, nikoli zpráva o novém výzkumu. Jako každá učebnice, její matematika byl pro většinu svých čtenářů nový, ale jeho skutečná originalita byla rétorická a filozofická “.

Jinými slovy, Kolmogorovova kniha se hodně podobala Euklidovým prvkům, systematizovala vše, co již bylo známo, a zničila předchůdce. Rychlý pohled na Wikipedii to potvrzuje, jeho historie pravděpodobnosti má mezeru mezi Laplaceem (1812) a Kolmogorovem a dokáže přeskočit i ta jména, která Kolmogorov sám jmenoval: Borel, Bernstein a von Mises. Dalším exponátem je název populárního článku Gerovitche: Muž, který vynalezl moderní pravděpodobnost.

Recenze obsahuje mnoho zajímavých informací. Například Borel definoval v roce 1898 spočítatelné aditivní míry a v letech 1905-1909 prozkoumal spojení mezi nimi a geometrickou pravděpodobnost. Frechet zobecnil Borel / Lebesgueovy míry na abstraktní prostory, Hausdorff s nimi srovnal pravděpodobnost do roku 1914 a Bernstein vydal verzi axiomů pravděpodobnosti v roce 1917. O náhodných proměnných však moc neříká. Klasičtí autoři (Bernoulli, de Moivre, Poisson, Laplace) hovoří o náhodných událostech, pokusech a distribucích, ale ne o něčem tak abstraktním.

Kdo a kdy představil koncept náhodné proměnné, byl to „základní pojem“ před teorií míry?

Dokument Senety je také zajímavý, ale přepisuje vše, počínaje Bernoulliho Ars Conjectandi z roku 1713, v moderním zápisu s náhodnými proměnnými, takže je těžké určit, odkud pocházejí, nebo notace .

Kdo představil notaci sady stavitelů zahrnující náhodné proměnné, jako je Pr $ (| \ xi | > \ varepsilon) $, a kdy se stalo běžným v ní vyjádřit výsledky?

Myslím, že to může být užitečné číst: Jan von Plato, [Vytváření moderní pravděpodobnosti: její matematická fyzika a filozofie v historické perspektivě] (https://books.google.it/books?id=cE0uKNiIHpkC&pg=PR5) (1994).
Máte-li nastavenou notaci Pr ($ | \ xi |> \ epsilon $), máte na mysli to, co se obvykle čte jako „pravděpodobnost, že absolutní hodnota náhodné proměnné $ \ xi $ je větší než $ \ epsilon $“ ?, a znáš na to mezitím odpověď?
@MichaelBächtold Ano, pokud jde o notaci, bohužel jsem na tento problém trochu zapomněl a nikdy jsem se to nedozvěděl. Jsem stále zvědavý.
Viz také https://hsm.stackexchange.com/a/9718/229 „Kdo vytvořil termín * náhodná proměnná *?“
Tři odpovědi:
Alexandre Eremenko
2015-04-23 04:16:29 UTC
view on stackexchange narkive permalink

Tato otázka nemá definitivní odpověď, protože lidé operovali s náhodnými proměnnými dlouho předtím, než byla dána jakákoli přísná definice.

Teorie pravděpodobnosti začíná v 16. století, ne-li dříve. Cardano o tom napsal například knihu. V roce 1773 napsal de Moivre důležitou knihu, kde v podstatě představil hlavní metodu moderní pravděpodobnosti (harmonická analýza). To hodně vyvinul Laplace. Důležitý vývoj nastal v 19. století (například Čebyšev). Všichni tito lidé mluvili o náhodných proměnných, aniž by poskytli přesnou definici. Mám na mysli „přesnou definici“ z pohledu moderního matematika, který rozumí pouze definicím uvedeným v teorii množin. Samozřejmě ještě neexistovala žádná teorie množin.

Na počátku 20. století byla pravděpodobnost vysoce rozvinutou teorií s podstatnými aplikacemi ve fyzice (například Brownův pohyb). Na začátku 20. století již existovaly všechny základní aplikace pravděpodobnosti, včetně statistické mechaniky, finanční matematiky a samozřejmě statistik.

Byly zahájeny pokusy o zavedení přísného odůvodnění v duchu nově vyvinuté teorie množin ve druhém desetiletí 20. století. Jeden časný systém axiomů byl způsoben S. Bernsteinem, další J. Schauderem. Ještě další systém nadací byl způsoben von Misesem.

Kolmogorovův systém byl publikován v roce 1933. Postupně (ne okamžitě!) Jej převzal.

Chcete-li odpovědět na vaši další otázku, ne toto nelze srovnávat s Euklidem. Euclid poskytl systematickou a komplexní expozici veškeré matematiky, která v té době existovala. Kolmogorovova kniha je maličká brožura, kde navrhuje pouze nový systém axiomů, což dokazuje několik velmi obecných vět. Je to malá výzkumná monografie, ne expozice známých věcí.

Poznámka. Díky modernímu vzdělávacímu systému si mnoho mladých matematiků myslí, že před Kolmogorovem neexistovala teorie pravděpodobnosti a před Grothendieckem žádná algebraická geometrie. Rozvíjením tohoto principu o krok dále lze říci, že před Cantorem nebyla žádná matematika :-) Protože veškerá moderní matematika je založena na teorii množin.

Nejsem si jistý Čebyševem, ale v Cardanu neexistují žádné náhodné proměnné, de Moivre nebo Laplace nemluví o náhodných proměnných, přesné ani ne. Myslí a píší ve smyslu pokusů a distribucí. I Borel často takové nastavení preferoval, jak se zdá, ale mezi Laplaceem a Kolmogorovem existuje jasný posun, takže s největší pravděpodobností existuje definitivní odpověď.
Prvky nedaly výklad všech známých matematik, nezmiňuje se mimo jiné o kuželosečkách, ale je to expanzivní. Snad lepší srovnání je s částmi knih I a V, které tvoří základy, Kolmogorov udělal zbytek v pozdějších pracích. Posouzení Grundbegriffe jako syntézy spíše než výzkumné monografie je Kolmogorovovo vlastní, stejně jako Frechetovo.
Nesouhlasím s „udělal zbytek v pozdějších pracích“. Kolmogorov nikdy nenapsal žádný komplexní průzkum pravděpodobnosti (ani žádný jiný předmět). Jeho výstup sestává většinou z velmi krátkých referátů. A malá knížka, o které mluvíme, je určitě výzkumná práce. S novými nápady.
Michael Bächtold
2019-02-03 02:25:47 UTC
view on stackexchange narkive permalink

Pokud jde o notaci $ \ text {Pr} (| \ xi | > \ varepsilon) $ zde jsem zatím našel:

Cajori v roce 1929 Historie matematických notací neříká nic o teorii pravděpodobnosti, což naznačuje, že předmět na počátku 20. století ještě nevyvinul žádnou speciální nebo široce přijímanou notaci. Zdá se, že to podporuje Jeff Miller, který píše:

Symboly pro pravděpodobnost události $ A $ na vzoru $ P (A) $ nebo $ Pr (A) $ jsou relativně nedávný vývoj vzhledem k tomu, že pravděpodobnost byla studována po celá staletí. Grundbegriffe derWahrscheinlichkeitsrechnung (1933) A. N. Kolmogorova použil symbol $ \ mathbf {P} (A) $ . Použití velkých písmen pro události bylo převzato z teorie množin, kde se vztahovalo k množinám. Náhodné proměnné a rozdělení pravděpodobnosti (1937), H. Cramér, „první moderní kniha o pravděpodobnosti v angličtině“, používá $ P (A) $ . Ve stejném roce napsal JV Uspensky ( Úvod do matematické pravděpodobnosti ) jednoduše $ (A) $ , následoval AA Markov Wahrscheinlichkeitsrechnung (1912, s. 179). Vliv W. Fellera AnIntroduction to Probability Theory and its Applications volume 1 (1950) používá $ Pr \ {A \} $ a $ \ mathbf {P} \ {A \} $ v pozdějších vydáních.

Ale ponoření trochu hlouběji najde několik dřívějších zdrojů.

Než nějaké uvedu, dovolte mi poznamenat, že mi připadá Millerovo tvrzení, že velká písmena pro události byly převzaty z teorie množin, docela pochybné, vzhledem k tomu, že již Bayes v Eseji k řešení problému v nauce o šancích ( 1763) použil pro událost velká písmena $ M $ .

Dále mi dovolte citovat Markova z jeho Wahrscheinlichkeitsrechnung (1912) str. 14-15 (můj překlad):

Nepovažujeme za nadbytečné vyjadřovat větu o násobení pravděpodobností pomocí vzorce $$ (AB) = (A) (B, A) = (B) (A, B), $$ kde $ (AB) $ označuje pravděpodobnost současného výskytu obou událostí $ A $ a $ B $ , $ (A) $ a $ (B) $ označují pravděpodobnosti událostí $ A $ a $ B $ , $ (B, A) $ span > označuje pravděpodobnost události $ B $ , když je $ A $ známo, a $ (A, B) $ označuje pravděpodobnost události $ A $ , když $ B $ je znám došlo.

Nemám přístup k jeho prvnímu ruskému vydání ( Исчисление вероятностей 1900), ale Poincaré ve svém Calcul des probabilités ( 1896) str. 37 používal téměř stejnou notaci jako Markov.

Pravděpodobnost, že dojde $ A $ i $ B $ , se rovná pravděpodobnost $ B $ , vynásobená pravděpodobností $ A $ , kdy víme, že došlo k $ B $ .

Nebo se naopak rovná pravděpodobnosti, že $ A $ , vynásobený pravděpodobností, že $ B $ nastane, za předpokladu $ A $ by se měl objevit. $$ (A \ text {and} B) = (B) (A \ text {si} B) = (A) (B \ text {si} A). $$

Je zajímavé, že na rozdíl od Markova Poincaré neposkytuje explicitní definici notace $ (A) $ . Místo toho jej vyvine z podoby štítků na rovnice o několik stránek dříve, na matematické objekty, které se mohou v rovnicích objevit.

Pro zápis, který je blíže $ \ text {Pr} (A) $ , zdá se, že tu hrál roli Hausdorff a jeho otec otec Bruns. Bruns ve své Wahrscheinlichkeitsrechnung und Kollektivmaßlehre ( 1906) píše $ \ mathfrak {W} (E) $ pro pravděpodobnost události $ E $ ( $ \ mathfrak {W} $ ve zkratce Wahrscheinlichkeit ). Kniha je založena na přednáškách, které Bruns přednášel každé dva roky od začátku 80. let na univerzitě v Lipsku. Hausdorff se těchto přednášek zúčastnil v roce 1890 a stenografoval je (ale k Hausdorffovým poznámkám nemám přístup).

V roce 1900/01 Hausdorff sám přednášel o teorii pravděpodobnosti a ve svých příspěvcích k výpočtu pravděpodobnosti zavedl notaci $ p_F (E) $ pro podmíněnou pravděpodobnost. em> (1901):

Pokud během pokusu $ E $ rozhodne, zda k události dojde, či nikoli, číslo z vůbec příznivých rovných případů se dělí počtem vůbec možných stejných případů, pravděpodobnost $ E $ span> par excellence, absolutní pravděpodobnost $ p (E) $ . Pokud se naopak mezi příznivé a možné případy, které způsobí určitou další událost $ F $ , počítají pouze ty případy, pak relativní pravděpodobnost $ E $ za předpokladu, že je realizováno $ F $ , což je termín, pro který je pravopisná $ p_F (E) $ a zhruba relativní pravděpodobnost $ E $ , posito Doporučil bych $ F $ .

Můj překlad:

Pokud při pokusu o rozhodování o výskytu nebo nepřítomnosti události $ E $ je počet příznivých a stejně pravděpodobných případů vydělen počtem všech možných a stejně pravděpodobné případy se objeví pravděpodobnost řádného $ E $ , absolutní pravděpodobnost $ p (E) $ . Pokud se naopak mezi příznivými a možnými případy počítají pouze ty, které vyvolávají další určenou událost $ F $ , pak relativní pravděpodobnost $ E $ za podmínky, že je realizováno $ F $ , což je koncept, pro který je notace $ p_F (E) $ a řeč relativní pravděpodobnost $ E $ , posito $ F $ může být doporučeno.

K tomuto článku je v Felix Hausdorff, Gesammelte Werke, skupina V ( 2005). Purkert zde vysvětluje, že tím Hausdorff ovlivnil několik autorů.

Například Bruns v poznámce ke své knize z roku 1906 píše, že Bayesova věta je jednoduchým důsledkem čistě aritmetických vět, pokud zavedeme pojem podmíněná „pravděpodobnost jako u Hausdorffa. (Ale nevím, jestli Brunsův $ \ mathfrak {W} (E) $ byl inspirován Hausdorffovým $ p (E) $ nebo pokud ji Bruns už používal před rokem 1900.)

Czuber, který je autorem článku o teorii pravděpodobnosti v Kleinově Encyklopedii matematiky ( 1900) a v knize Wahrscheinlichkeitsrechnung und ihre Anwendung auf Fehlerausgleichung, Statistik und Lehensversicherung ( 1903) přijal Hausdorffovu notaci ve druhém přepracovaném vydání své knihy ( 1908) a napsal $ \ mathfrak {W} $ jako Bruns, místo Hausdroffova $ p $ . Czuber uznává Hausdorffa v poznámce pod čarou na str. 45 pro uvedení jasnosti do předmětu s touto notací. Broggi také přijal Hausdorffovu notaci v Versicherungsmathematik (1911) ( Matematica attuariale ).

V pozdějších Hausdorffových přednáškách Wahrscheinlichkeitsrechnung ( 1923, 1931, Gesammelte Werke Band V str. 595) lze také najít definici náhodné proměnné s konečně mnoha hodnotami a (první?) Použití nerovnosti pro označení události.

Tam používá notace $ w (A) $ namísto $ p (A) $ a zápisy (str. 608 Gesammelete Werke Band V, můj překlad)

Nechť $ A_1, A_2, \ ldots, A_m $ být úplnou disjunkcí, $ w (A_i) = p_i, \ sum p_1 = 1 $ . Představte si, že ke každému případu je $ A_i $ přiřazeno skutečné číslo $ x_i $ (například číslo $ i $ ). Pokud $ p_i $ jsou $ > 0 $ a $ x_i $ se navzájem liší a $ x $ označuje jeden z nich, potom voláme $ x $ proměnná , která může nabývat hodnot $ x_1, \ ldots, x_m $ ; pouze zde je ve srovnání s běžným používáním jazyka proměnná zpřesněna tím, že může předpokládat každou hodnotu $ x_i $ s určitou pravděpodobností $ p_i $ . Ztělesnění [Innbegriff] $ p_i, x_i $ nazýváme distribucí proměnného $ x $ .

Taková rozdělení hrají hlavní roli v aplikacích počtu pravděpodobností.

Bezprostředně poté definuje očekávanou hodnotu a $ k $ -tý okamžik $ \ mu_k $ proměnné $ x $ span > a na další stránce píše

Je-li $ t $ kladné číslo a součet $ \ overset {*} {\ sum} $ běží pouze nad těmi $ i $ s $ | x_i | \ geq t $ , poté pro $ k = 2,4, \ ldots $ $$ \ mu_k = \ sum p_i x ^ k_i \ geq \ overset {*} {\ sum} p_i x ^ k_i \ geq t ^ k \ cdot \ overset {*} {\ sum} p_i, $$ $$ \ overset {*} {\ sum} p_i \ leq \ dfrac {\ mu_k} {t ^ k} $$ nebo se zjevnou notací $ $ w (| x | \ geq t) \ leq \ dfrac {\ mu_k} {t ^ k}, \ quad w (| x | < t) \ geq 1 - \ dfrac {\ mu_k} {t ^ k} \; (\ text {Tschebyscheff}) $$

Hledal jsem v článku Todhunter Historie matematické teorie pravděpodobnosti ( 1865) a v Czuberově encyklopedii ( 1900) dokonce dřívější použití notací jako $ p (A), P (A), Pr (A) $ , ale žádné se nepodařilo najít. Použití velkého / malého písmene $ P $ k vyjádření pravděpodobnosti je samozřejmě mnohem starší než 1900. Například Laplace to často používá. Ale z moderního hlediska je třeba $ p $ Laplaceova a dřívějších matematiků chápat jako číslo mezi 0 a 1, zatímco $ p $ zavedené společností Hausdorff nebo závorky používané společností Poincare a Markov lze považovat za operátory, kteří přijímají události jako vstupy a čísla výnosů mezi 0 a 1 jako výstupy.

Co mám Nehledalo se na první použití notace $ P (A | B) $ pro podmíněné pravděpodobnosti. Související otázka je https://mathoverflow.net/q/163582/745.

Děkuji, je to mnohem víc, než jsem mohl najít. Hádám, že to znamená, že náhodné proměnné jsou ještě novější, můj dojem byl, že rané zdroje přinejmenším pracují s distribučními funkcemi jako základními.
@Conifold: Sledování historie náhodných proměnných a toho, jak se vyvinuly do $ X \ colon \ Omega \ to \ mathbb {R} $, by bylo stále velmi zajímavé. K moderní interpretaci zcela jistě došlo po vynálezu sad a map (~ 1900), ale jak říká Eremenko, náhodné proměnné se používaly mnohem dříve. Stále mě trápí, že matematici cítili potřebu interpretovat náhodné proměnné jako mapy, ale nikdy neměli tolik nutkání udělat to samé pro proměnné množství Leibniz. Viz například diskuse [zde] (https://mathoverflow.net/questions/307947).
Michael Bächtold
2020-08-01 04:13:45 UTC
view on stackexchange narkive permalink

Říkáte, že „v Cardanu, de Moivre nebo Laplaceovi nejsou žádné náhodné proměnné“, ale alespoň v Laplaceovi existují. Ne ve smyslu map ze vzorového prostoru do měřitelného prostoru, ale v intuitivním smyslu pro proměnné veličiny, které mohou nabývat různých hodnot s různou pravděpodobností .

V následujícím Laplaceovi v tomto intuitivním smyslu jasně zachází s $ \ alpha $ jako s náhodnou proměnnou. Z Mémoire sur les probabilités , 1778 ( francouzština, angličtina):

II.

Předpokládáme, že dva hráči $ A $ a $ B $ , z nichž příslušné dovednosti jsou neznámé, hrajte jakoukoli hru a navrhujeme určit pravděpodobnost, že $ A $ vyhraje první $ n $ hry.

Pokud by se otázka týkala pouze jedné hry, je jasné, že $ A $ nebo $ B $ span> musí nutně vyhrát, tyto dvě události jsou stejně pravděpodobné, a to takovým způsobem, že pravděpodobnost první je $ \ frac {1} {2} $ ; odtud podle obvyklého pravidla analýzy šancí dospějeme k závěru, že pravděpodobnost $ A $ vítězství v prvním $ n $ her je $ \ frac {1} {2 ^ n} $ . Tento důsledek bude přesný, pokud pravděpodobnost $ \ frac {1} {2} $ byla založena na absolutní rovnosti mezi možnostmi dvou událostí, o nichž existuje otázka ; ale rovnost existuje pouze relativně k neznalosti, kterou máme o dovednostech dvou hráčů, a tato rovnost nebrání tomu, aby jeden byl schopen být mnohem silnější než druhý. Předpokládáme tedy, že $ \ frac {1+ \ alpha} {2} $ představuje pravděpodobnost, že nejsilnější hráč vyhraje hru, a $ \ frac {1- \ alpha} {2} $ ten z nejslabších; pojmenováním $ P $ pravděpodobnost, že $ A $ vyhraje první $ n $ hry, budeme mít $$ P = \ frac {1} {2 ^ n} (1+ \ alpha) ^ n \ quad \ text {or} \ quad P = \ frac {1} {2 ^ n} (1- \ alpha) ^ n, $$ podle $ A $ span> bude nejsilnější nebo nejslabší: nyní, protože nemáme důvod předpokládat spíše jeden než druhý, je jasné, že abychom měli skutečnou hodnotu $ P $ , musíme vzít průměr součtu dvou předchozích hodnot, což dává $$ P = \ frac {1} {2 ^ {n + 1}} [(1+ \ alpha) ^ n + (1- \ alpha) ^ n]. $$

[...]

Nyní, pokud bychom znali limit a zákon možnosti hodnot $ \ alpha $ [rozdělení pravděpodobnosti $ \ alpha $ ], není nic jednoduššího, než tento problém přesně vyřešit; protože pokud pojmenujeme $ q $ tento limit a pokud budeme reprezentovat $ \ psi (\ alpha) $ span > pravděpodobnost [hustota] $ \ alpha $ , nejprve vidíme, že $ \ alpha $ má nutně spadnout mezi $ 0 $ a $ q $ , funkce $ \ psi (\ alpha) $ musí být takové, abychom měli $$ \ int d \ alpha \ psi (\ alpha) = 1, $$ integrál převzatý z $ \ alpha = 0 $ do $ \ alpha = q $ . Znásobíme tedy $ d \ alpha \ psi (\ alpha) $ pravděpodobnosti, které předcházejí, a integrací těchto produktů z $ \ alpha = 0 $ do $ \ alpha = q $ , budeme mít hledané pravděpodobnosti; tímto způsobem najdeme pro hodnotu $ P $ v článku II, $$ P = \ int d \ alpha \ psi (\ alpha) \ frac {1} {2 ^ {n + 1}} [(1+ \ alpha) ^ n + (1- \ alpha) ^ n]. $$

Další příklady takových náhodných proměnných najdete ve stejném článku. Také Čebyšev má náhodné proměnné tohoto typu.



Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...