然而,網(wǎng)頁的出現(xiàn)僅僅是個(gè)開始。就在谷歌剛滿三歲的2001年,在洛杉磯舉行的一次業(yè)界集會(huì)上,其創(chuàng)始人拉里·佩奇和謝爾蓋·布林進(jìn)行了一場(chǎng)公開的演講。兩位創(chuàng)始人在這次講話中解釋說,盡管Google索引看起來足夠龐大,其網(wǎng)頁數(shù)量甚至達(dá)到了13億之多,但除了網(wǎng)頁自身附帶的小部分信息外,這些數(shù)量驚人的網(wǎng)頁并沒有提供更多有價(jià)值的信息。佩奇說:“目前,人們?nèi)耘f只能存取互聯(lián)網(wǎng)上業(yè)已存在的資料和信息。人們無法對(duì)圖書館里收藏的書籍資料進(jìn)行存取,無法對(duì)雜志內(nèi)容進(jìn)行存取,無法對(duì)報(bào)紙內(nèi)容進(jìn)行存取,即使是過期的報(bào)紙也做不到。同樣地,人們對(duì)于已經(jīng)播放的電視節(jié)目也無法存取。但是這一切都將被改變?!?/p>
早在佩奇還是斯坦福大學(xué)的一名研究生時(shí),他就參與過作為該大學(xué)數(shù)字化圖書館項(xiàng)目一部分的某些實(shí)驗(yàn)項(xiàng)目,而將傳統(tǒng)的紙質(zhì)媒體數(shù)字化的設(shè)想也正是開始于那段科研經(jīng)歷。但是直到2001年,谷歌對(duì)于是否應(yīng)該做點(diǎn)什么具體工作來加速傳統(tǒng)媒體的數(shù)字化仍舊沒有明確的表態(tài)。圖書館、出版社以及電視臺(tái)這類機(jī)構(gòu)似乎有能力完成數(shù)字化的日常零碎工作并且能夠?qū)⑽募?wù)器上向公眾開放的信息進(jìn)行整理,而谷歌的“爬行器”則像它之前將大量網(wǎng)頁進(jìn)行編錄索引那樣,負(fù)責(zé)將這些傳統(tǒng)傳媒機(jī)構(gòu)整理出來的信息編入索引。
然而,一年后的2002年,佩奇和布林以及他們的團(tuán)隊(duì)決定不再猶豫,要憑借自己的力量開始對(duì)最完整記錄人類對(duì)世界的理解的信息類型――紙質(zhì)書籍進(jìn)行數(shù)字化的可行性進(jìn)行審查。眾所周知,Google算法在網(wǎng)頁之間的優(yōu)選認(rèn)定上比較擅長(zhǎng),但是它不能夠?qū)⒕W(wǎng)頁上出現(xiàn)的最有價(jià)值信息像傳統(tǒng)的紙質(zhì)書籍那樣向其用戶提供高質(zhì)量的選擇建議。
很顯然,與谷歌工程師熟悉的將網(wǎng)頁編入索引和對(duì)網(wǎng)頁進(jìn)行排名運(yùn)算的工作不同,書籍?dāng)?shù)字化絕對(duì)是一個(gè)全新的挑戰(zhàn)性課題。將書本中的文字轉(zhuǎn)換成由0和1組成字節(jié)的數(shù)字模式所需要的不只是強(qiáng)悍的計(jì)算機(jī)知識(shí),是否具備其他領(lǐng)域的專業(yè)知識(shí)似乎顯得更為重要。比如用于設(shè)計(jì)圖像設(shè)備的機(jī)械工程學(xué)知識(shí),用來游說擁有大量圖書資源的大學(xué)圖書館參與合作的公關(guān)學(xué)知識(shí),以及怎樣將要掃描的書籍毫發(fā)無損地來回運(yùn)送的后勤保障知識(shí),甚至還包括要確保項(xiàng)目進(jìn)行中不會(huì)觸犯版權(quán)法的法律知識(shí)。此外,要完成這項(xiàng)工作還要有一個(gè)必不可少的條件,那就是強(qiáng)大的資金保證。因?yàn)镚oogle決定從事的書籍?dāng)?shù)字化工程不只是針對(duì)某家大型圖書館的藏書,也不只是針對(duì)那些有價(jià)值的學(xué)術(shù)性書籍、那些普通的大眾書籍甚至是那些飽受爭(zhēng)議的書籍等,而是要將上述的所有書籍――迄今為止在全球書目數(shù)據(jù)庫(WorldCat)里列出并被收藏在全球25000家圖書館內(nèi)的3200萬本書籍――中的每一冊(cè)都進(jìn)行數(shù)字化。
瑪麗莎?梅耶爾(Marissa Mayer)曾經(jīng)把谷歌的圖書搜索項(xiàng)目(Google Book Search)稱之為“我們的登月”計(jì)劃。這種比喻至少在某些方面看來是恰當(dāng)?shù)?。紙質(zhì)書籍的數(shù)字化一直以來就是很多人的夢(mèng)想。但這個(gè)夢(mèng)想往往被認(rèn)為過于雄心勃勃而在短期內(nèi)很難實(shí)現(xiàn)。從1961年約翰·肯尼迪總統(tǒng)宣布著名的“登月”計(jì)劃開始,到1969年人類安全地在月球上著陸,美國用了10年時(shí)間完成自己的這一夢(mèng)想。與此相似的是,谷歌也打算用10年的時(shí)間來完成它的“登月”――Google 圖書搜索。(2007年9月,谷歌又為它的另一項(xiàng)“登月”計(jì)劃撥款,那就是投資3000萬美元開發(fā)Google Lunar X Prize。)