Pokud jde o notaci $ \ text {Pr} (| \ xi | > \ varepsilon) $ zde jsem zatím našel:
Cajori v roce 1929 Historie matematických notací neříká nic o teorii pravděpodobnosti, což naznačuje, že předmět na počátku 20. století ještě nevyvinul žádnou speciální nebo široce přijímanou notaci. Zdá se, že to podporuje Jeff Miller, který píše:
Symboly pro pravděpodobnost události $ A $ na vzoru $ P (A) $ nebo $ Pr (A) $ jsou relativně nedávný vývoj vzhledem k tomu, že pravděpodobnost byla studována po celá staletí. Grundbegriffe derWahrscheinlichkeitsrechnung (1933) A. N. Kolmogorova použil symbol $ \ mathbf {P} (A) $ . Použití velkých písmen pro události bylo převzato z teorie množin, kde se vztahovalo k množinám. Náhodné proměnné a rozdělení pravděpodobnosti (1937), H. Cramér, „první moderní kniha o pravděpodobnosti v angličtině“, používá $ P (A) $ . Ve stejném roce napsal JV Uspensky ( Úvod do matematické pravděpodobnosti ) jednoduše $ (A) $ , následoval AA Markov Wahrscheinlichkeitsrechnung (1912, s. 179). Vliv W. Fellera AnIntroduction to Probability Theory and its Applications volume 1 (1950) používá $ Pr \ {A \} $ a $ \ mathbf {P} \ {A \} $ v pozdějších vydáních.
Ale ponoření trochu hlouběji najde několik dřívějších zdrojů.
Než nějaké uvedu, dovolte mi poznamenat, že mi připadá Millerovo tvrzení, že velká písmena pro události byly převzaty z teorie množin, docela pochybné, vzhledem k tomu, že již Bayes v Eseji k řešení problému v nauce o šancích ( 1763) použil pro událost velká písmena $ M $ .
Dále mi dovolte citovat Markova z jeho Wahrscheinlichkeitsrechnung (1912) str. 14-15 (můj překlad):
Nepovažujeme za nadbytečné vyjadřovat větu o násobení pravděpodobností pomocí vzorce $$ (AB) = (A) (B, A) = (B) (A, B), $$ kde $ (AB) $ označuje pravděpodobnost současného výskytu obou událostí $ A $ a $ B $ , $ (A) $ a $ (B) $ označují pravděpodobnosti událostí $ A $ a $ B $ , $ (B, A) $ span > označuje pravděpodobnost události $ B $ , když je $ A $ známo, a $ (A, B) $ označuje pravděpodobnost události $ A $ , když $ B $ je znám došlo.
Nemám přístup k jeho prvnímu ruskému vydání ( Исчисление вероятностей 1900), ale Poincaré ve svém Calcul des probabilités ( 1896) str. 37 používal téměř stejnou notaci jako Markov.
Pravděpodobnost, že dojde $ A $ i $ B $ , se rovná pravděpodobnost $ B $ , vynásobená pravděpodobností $ A $ , kdy víme, že došlo k $ B $ .
Nebo se naopak rovná pravděpodobnosti, že $ A $ , vynásobený pravděpodobností, že $ B $ nastane, za předpokladu $ A $ by se měl objevit. $$ (A \ text {and} B) = (B) (A \ text {si} B) = (A) (B \ text {si} A). $$
Je zajímavé, že na rozdíl od Markova Poincaré neposkytuje explicitní definici notace $ (A) $ . Místo toho jej vyvine z podoby štítků na rovnice o několik stránek dříve, na matematické objekty, které se mohou v rovnicích objevit.
Pro zápis, který je blíže $ \ text {Pr} (A) $ , zdá se, že tu hrál roli Hausdorff a jeho otec otec Bruns. Bruns ve své Wahrscheinlichkeitsrechnung und Kollektivmaßlehre ( 1906) píše $ \ mathfrak {W} (E) $ pro pravděpodobnost události $ E $ ( $ \ mathfrak {W} $ ve zkratce Wahrscheinlichkeit ). Kniha je založena na přednáškách, které Bruns přednášel každé dva roky od začátku 80. let na univerzitě v Lipsku. Hausdorff se těchto přednášek zúčastnil v roce 1890 a stenografoval je (ale k Hausdorffovým poznámkám nemám přístup).
V roce 1900/01 Hausdorff sám přednášel o teorii pravděpodobnosti a ve svých příspěvcích k výpočtu pravděpodobnosti zavedl notaci $ p_F (E) $ pro podmíněnou pravděpodobnost. em> (1901):
Pokud během pokusu $ E $ rozhodne, zda k události dojde, či nikoli, číslo z vůbec příznivých rovných případů se dělí počtem vůbec možných stejných případů, pravděpodobnost $ E $ span> par excellence, absolutní pravděpodobnost $ p (E) $ . Pokud se naopak mezi příznivé a možné případy, které způsobí určitou další událost $ F $ , počítají pouze ty případy, pak relativní pravděpodobnost $ E $ za předpokladu, že je realizováno $ F $ , což je termín, pro který je pravopisná $ p_F (E) $ a zhruba relativní pravděpodobnost $ E $ , posito Doporučil bych $ F $ .
Můj překlad:
Pokud při pokusu o rozhodování o výskytu nebo nepřítomnosti události $ E $ je počet příznivých a stejně pravděpodobných případů vydělen počtem všech možných a stejně pravděpodobné případy se objeví pravděpodobnost řádného $ E $ , absolutní pravděpodobnost $ p (E) $ . Pokud se naopak mezi příznivými a možnými případy počítají pouze ty, které vyvolávají další určenou událost $ F $ , pak relativní pravděpodobnost $ E $ za podmínky, že je realizováno $ F $ , což je koncept, pro který je notace $ p_F (E) $ a řeč relativní pravděpodobnost $ E $ , posito $ F $ může být doporučeno.
K tomuto článku je v Felix Hausdorff, Gesammelte Werke, skupina V ( 2005). Purkert zde vysvětluje, že tím Hausdorff ovlivnil několik autorů.
Například Bruns v poznámce ke své knize z roku 1906 píše, že Bayesova věta je jednoduchým důsledkem čistě aritmetických vět, pokud zavedeme pojem podmíněná „pravděpodobnost jako u Hausdorffa. (Ale nevím, jestli Brunsův $ \ mathfrak {W} (E) $ byl inspirován Hausdorffovým $ p (E) $ nebo pokud ji Bruns už používal před rokem 1900.)
Czuber, který je autorem článku o teorii pravděpodobnosti v Kleinově Encyklopedii matematiky ( 1900) a v knize Wahrscheinlichkeitsrechnung und ihre Anwendung auf Fehlerausgleichung, Statistik und Lehensversicherung ( 1903) přijal Hausdorffovu notaci ve druhém přepracovaném vydání své knihy ( 1908) a napsal $ \ mathfrak {W} $ jako Bruns, místo Hausdroffova $ p $ . Czuber uznává Hausdorffa v poznámce pod čarou na str. 45 pro uvedení jasnosti do předmětu s touto notací. Broggi také přijal Hausdorffovu notaci v Versicherungsmathematik (1911) ( Matematica attuariale ).
V pozdějších Hausdorffových přednáškách Wahrscheinlichkeitsrechnung ( 1923, 1931, Gesammelte Werke Band V str. 595) lze také najít definici náhodné proměnné s konečně mnoha hodnotami a (první?) Použití nerovnosti pro označení události.
Tam používá notace $ w (A) $ namísto $ p (A) $ a zápisy (str. 608 Gesammelete Werke Band V, můj překlad)
Nechť $ A_1, A_2, \ ldots, A_m $ být úplnou disjunkcí, $ w (A_i) = p_i, \ sum p_1 = 1 $ . Představte si, že ke každému případu je $ A_i $ přiřazeno skutečné číslo $ x_i $ (například číslo $ i $ ).
Pokud $ p_i $ jsou $ > 0 $ a $ x_i $ se navzájem liší a $ x $ označuje jeden z nich, potom voláme $ x $ proměnná , která může nabývat hodnot $ x_1, \ ldots, x_m $ ; pouze zde je ve srovnání s běžným používáním jazyka proměnná zpřesněna tím, že může předpokládat každou hodnotu $ x_i $ s určitou pravděpodobností $ p_i $ . Ztělesnění [Innbegriff] $ p_i, x_i $ nazýváme distribucí proměnného $ x $ .
Taková rozdělení hrají hlavní roli v aplikacích počtu pravděpodobností.
Bezprostředně poté definuje očekávanou hodnotu a $ k $ -tý okamžik $ \ mu_k $ proměnné $ x $ span > a na další stránce píše
Je-li $ t $ kladné číslo a součet $ \ overset {*} {\ sum} $ běží pouze nad těmi $ i $ s $ | x_i | \ geq t $ , poté pro $ k = 2,4, \ ldots $ $$ \ mu_k = \ sum p_i x ^ k_i \ geq \ overset {*} {\ sum} p_i x ^ k_i \ geq t ^ k \ cdot \ overset {*} {\ sum} p_i, $$ $$ \ overset {*} {\ sum} p_i \ leq \ dfrac {\ mu_k} {t ^ k} $$ nebo se zjevnou notací $ $ w (| x | \ geq t) \ leq \ dfrac {\ mu_k} {t ^ k}, \ quad w (| x | < t) \ geq 1 - \ dfrac {\ mu_k} {t ^ k} \; (\ text {Tschebyscheff}) $$
Hledal jsem v článku Todhunter Historie matematické teorie pravděpodobnosti ( 1865) a v Czuberově encyklopedii ( 1900) dokonce dřívější použití notací jako $ p (A), P (A), Pr (A) $ , ale žádné se nepodařilo najít. Použití velkého / malého písmene $ P $ k vyjádření pravděpodobnosti je samozřejmě mnohem starší než 1900. Například Laplace to často používá. Ale z moderního hlediska je třeba $ p $ Laplaceova a dřívějších matematiků chápat jako číslo mezi 0 a 1, zatímco $ p $ zavedené společností Hausdorff nebo závorky používané společností Poincare a Markov lze považovat za operátory, kteří přijímají události jako vstupy a čísla výnosů mezi 0 a 1 jako výstupy.
Co mám Nehledalo se na první použití notace $ P (A | B) $ pro podmíněné pravděpodobnosti. Související otázka je https://mathoverflow.net/q/163582/745.