經(jīng)過漫長的預(yù)熱,終于要開始看概率論了,心里還是比較開心的。本著把數(shù)學(xué)應(yīng)用到計算機(jī)工業(yè)中的初心,將大學(xué)數(shù)學(xué)的基本學(xué)科梳理了一遍,收獲卻是意外的大。原本只想把基本概念回顧一遍,但一旦沾上了公理化的思想,后續(xù)的學(xué)習(xí)就沒法騎馬觀燈似地飛奔了。但也正因放慢了腳步,才發(fā)現(xiàn)過去對數(shù)學(xué)的認(rèn)識是一片空白的。數(shù)學(xué)的問題和方法并不屬于某個獨立的領(lǐng)域,它就是這個邏輯世界的基本問題和方法,是萬物的組織形態(tài)和原理。
1. 樣本空間
概率統(tǒng)計可能是當(dāng)今程序員認(rèn)為最有用的數(shù)學(xué)了,當(dāng)然這只是因為我們正好處于這個發(fā)展階段。數(shù)學(xué)從來就是工業(yè)革命的助推器,不過不同的階段的主角有所不同而已?,F(xiàn)實問題永遠(yuǎn)是復(fù)雜的、甚至不確定的,數(shù)學(xué)也從來沒有企圖精確地描述這個世界,而永遠(yuǎn)是針對我們關(guān)心的某個側(cè)面,提取其通用的模型。概率論也不例外,它并不是這個不確定世界的終極克星,而同樣只研究那些隨機(jī)現(xiàn)象中的確定性問題。
首先,對隨機(jī)現(xiàn)象的限定就要求其有“確定性”:在重復(fù)試驗中要表現(xiàn)出穩(wěn)定的統(tǒng)計規(guī)律。那些雜亂無章的現(xiàn)象,或現(xiàn)象中不可預(yù)見的側(cè)面,并不屬于概率論的研究的范疇。其次,討論的問題和結(jié)論也是有明確的定義和結(jié)果的,它們同樣是通過嚴(yán)格論證推導(dǎo)出來的確定性結(jié)果。能正視這個問題,才不至于把概率統(tǒng)計捧上天,而忽略了它的數(shù)學(xué)本質(zhì)。
以上廢話只是我的個人見解,你大可認(rèn)為我在虛張聲勢,下面我們就來好好談?wù)劊菏裁词歉怕??相信很多人會說是“可能性、隨機(jī)性、不確定性”的度量,這個回答還是讓人一頭霧水:什么叫“可能性”?如何“度量”它?如果你有基本的公理思想,就不會拿出這種有循環(huán)定義之嫌的解釋,嚴(yán)格的數(shù)學(xué)定義也從來不是一種修辭性的描述。學(xué)習(xí)如何定義概念,是數(shù)學(xué)抽象的第一步,也是后續(xù)理論的起點和根基。
先來看看我們要討論的對象:它是一些隨機(jī)現(xiàn)象,即事情的結(jié)果有多種可能,究竟是哪種結(jié)果并不確定。但經(jīng)驗或直觀又往往告訴我們:這些結(jié)果發(fā)生的“可能性”有著比較穩(wěn)定的值,或者大量的試驗結(jié)果會有規(guī)律性的統(tǒng)計結(jié)果。隨機(jī)現(xiàn)象非常多,有些是我們直觀上能理解的,比如一個質(zhì)地均勻的篩子,一般認(rèn)為六個面出現(xiàn)的可能性是一樣的。還有一些卻是靠著經(jīng)驗總結(jié)的,比如車站客流量、降水量等。但現(xiàn)實中任何隨機(jī)現(xiàn)象都有著復(fù)雜的物理成因,過程中它們相互融合,根本無法精確地計算每時每刻的狀態(tài)。
幸好概率論并不關(guān)心詳細(xì)的過程,也不負(fù)責(zé)解釋這一切現(xiàn)象,它只負(fù)責(zé)用數(shù)學(xué)來描述隨機(jī)現(xiàn)象。隨機(jī)現(xiàn)象的成因復(fù)雜多變,很多都不是概率論的討論范疇,但還有一些可以分解為更小的隨機(jī)現(xiàn)象,這些現(xiàn)象便可以由概率論自身來解釋。但是必須有大家都認(rèn)同的、無異議的描述,才可以在此基礎(chǔ)上研究一些確定性的問題。數(shù)學(xué)語言的基本元素是集合,還有其衍生出來的數(shù)、映射等常用概念,我們自然也是從集合開始定義概率。