任務(wù)2——區(qū)別看待技術(shù)和運(yùn)氣因素——就不是那么輕松了。在短期內(nèi),運(yùn)氣常會主導(dǎo)棒球比賽:即使最好的球隊(duì)也會輸?shù)?/3的比賽,即使最好的擊球手安全上壘的概率也只有2/5。有時(shí)候,運(yùn)氣因素甚至?xí)谏w一個(gè)隊(duì)員的真實(shí)技術(shù)水平長達(dá)一年之久。某一個(gè)賽季中,一個(gè)擊球手的真實(shí)擊球率為0.275,受運(yùn)氣因素影響,這個(gè)球手的擊球率有10%的概率出現(xiàn)浮動(dòng),時(shí)而升至0.300,時(shí)而降到0.250。
設(shè)計(jì)完善的預(yù)測系統(tǒng)能夠辨識出那些容易受運(yùn)氣影響的數(shù)據(jù),比如,平均擊球數(shù)就比本壘打數(shù)善變。投手的表現(xiàn)也是出了名的不穩(wěn)定,所以數(shù)據(jù)整理對預(yù)測投手的表現(xiàn)至關(guān)重要。若想預(yù)測一位投手的輸贏,參考他取得的三振出局?jǐn)?shù)以及保送數(shù)目,要比翻閱他前一賽季的輸贏紀(jì)錄更有價(jià)值,因?yàn)閺拿磕甑那闆r來看,前一類數(shù)據(jù)要更穩(wěn)定些。
像所有預(yù)測一樣,對棒球比賽進(jìn)行預(yù)測是為找出決定輸贏的根本原因:將擊球手三振出局就能阻止對手安全上壘,從而阻止對手得分,進(jìn)而阻止他們贏得比賽,所以三振出局?jǐn)?shù)更為關(guān)鍵。然而,預(yù)測這回事,越往下探究,就會遇到越多的噪聲干擾:投手的輸贏紀(jì)錄受自己發(fā)揮的影響,也受制于對手得分的多少,而后者是他無法左右的。西雅圖水手隊(duì)的明星投手菲利克斯·埃爾南德斯在2009年和2010年的投球表現(xiàn)都很不錯(cuò),但輸贏紀(jì)錄卻有很大差距,分別是19∶5和13∶12,因?yàn)?010年水手隊(duì)的擊球手水平極差,給了對手很多機(jī)會。
此類事例的出現(xiàn)絕非偶然,只要用心整理數(shù)據(jù),就會發(fā)現(xiàn)端倪。棒球比賽為我們提供的數(shù)據(jù)也許是全世界最豐富的:過去的140年里,在大聯(lián)盟球場上發(fā)生的每一件事都被忠實(shí)、準(zhǔn)確地記錄下來,而且每年還有數(shù)百位棒球手在很多較大的聯(lián)盟中打球。另外,盡管棒球是團(tuán)隊(duì)運(yùn)動(dòng),卻是以高度有序的方式進(jìn)行的:投球手輪流投球,擊球手按序擊球,這樣每人都有各自的統(tǒng)計(jì)數(shù)據(jù)。復(fù)雜的、非線性的統(tǒng)計(jì)問題很少出現(xiàn),因果關(guān)系很容易理順。
這使得棒球預(yù)測者的工作變得十分輕松。(在這項(xiàng)運(yùn)動(dòng)中,)一個(gè)假設(shè)通常可以根據(jù)經(jīng)驗(yàn)進(jìn)行檢驗(yàn),利用精確度比較高的統(tǒng)計(jì)數(shù)據(jù)來證實(shí)或者證偽。而對于經(jīng)濟(jì)預(yù)測或政治預(yù)測來說,可用的數(shù)據(jù)就少很多——美國總統(tǒng)大選每4年才舉行一次,不是每年都能產(chǎn)生幾百個(gè)數(shù)據(jù)點(diǎn)——缺少數(shù)據(jù),預(yù)測往往更易誤入歧途。