—如何玩轉(zhuǎn)搜索
計(jì)算機(jī)搜索具有其他任何技術(shù)發(fā)明都無(wú)法比擬的優(yōu)勢(shì),它使得我們?cè)谛畔r(shí)代的生存發(fā)展成為可能。氧氣所到之處,一切都會(huì)隨之改變。與此類似,搜索功能可以實(shí)現(xiàn)電腦文件、電子郵件、日歷條目、數(shù)據(jù)庫(kù)內(nèi)容和網(wǎng)絡(luò)信息的快速檢索,這種能力已經(jīng)改變了我們存儲(chǔ)信息、取回信息及使用信息的方式。換言之,計(jì)算機(jī)搜索已經(jīng)把我們從本不完美的大腦造成的混亂當(dāng)中解放出來(lái)。
借助搜索功能,你再也不必像過(guò)去那樣,費(fèi)盡心思要把自己的信息資料歸置得井井有條了。這就好比你再也不用一件一件地把所有衣服都掛好一樣。相反,你只要把衣服扔到那個(gè)越來(lái)越高的大堆上就行。等到你想穿一件9號(hào)碼的襯衫時(shí),直接提出要求,那件衣服就像變魔術(shù)一樣,神奇地出現(xiàn)在衣服堆的最頂上。這是多么自由的感覺(jué)??!
過(guò)去10~15年間,計(jì)算機(jī)輔助搜索已經(jīng)成為我們生活當(dāng)中不可分割的一個(gè)組成部分。搜索技術(shù)不斷演化,從最初只有研究人員和科學(xué)家在他們那些稀奇古怪的計(jì)算機(jī)上使用的東西,一直演變成我們大多數(shù)人每天都會(huì)本能地使用很多次的普通工具。我們呼吸,我們眨眼,我們吃飯,我們睡覺(jué),我們“Google”。
結(jié)果我們大多數(shù)人都沒(méi)有對(duì)計(jì)算機(jī)搜索予以太多的關(guān)注。實(shí)際上,我們現(xiàn)在已經(jīng)普遍認(rèn)為搜索是理所當(dāng)然的事情。不過(guò),搜索實(shí)際上是一種技能,它對(duì)新式有序組織至關(guān)重要。你在搜索這件事上變得越機(jī)智,你在濾除次要信息、抓住關(guān)鍵問(wèn)題方面做得就越好。具備實(shí)施目標(biāo)明確的快速搜索能力,有助于盡快找到自己需要的信息。有了計(jì)算機(jī)搜索,你就不必勞神費(fèi)力地考慮在哪里能找到某條信息,也用不著處心積慮地算計(jì)該把這個(gè)內(nèi)容放在什么地方。自己想要的資料,只要一搜索,馬上就會(huì)出現(xiàn)。
因此,我們努力掌握搜索技能吧。我在這一章中會(huì)分享自己進(jìn)行搜索的一些策略和訣竅,以便讓你的搜索更有效。我以“Google搜索”作為本章的中心議題,因?yàn)榇蠖鄶?shù)人都使用Google搜索。雖然Google搜索有很多競(jìng)爭(zhēng)對(duì)手,但我認(rèn)為Google搜索憑借簡(jiǎn)潔的搜索界面和成熟的關(guān)聯(lián)算法,還是會(huì)一如既往地為我們提供最好的搜索引擎服務(wù)(我曾經(jīng)供職于Google公司,這一點(diǎn)不會(huì)影響上述事實(shí))。
搜索引擎的設(shè)置
Google搜索和大多數(shù)搜索引擎使用的是一種稱為“爬蟲”(crawler)的自動(dòng)軟件代理技術(shù),這種代理也叫“蜘蛛”(spider)或“機(jī)器人”(robot)。爬蟲程序會(huì)頻繁地訪問(wèn)網(wǎng)絡(luò)站點(diǎn),讀取并捕獲網(wǎng)頁(yè)上的大部分文本信息,同時(shí)也會(huì)跟蹤進(jìn)入該網(wǎng)站的其他頁(yè)面。
爬蟲程序在一個(gè)網(wǎng)站上搜集到的信息會(huì)添加到搜索引擎的網(wǎng)頁(yè)索引中。當(dāng)你提請(qǐng)查詢的時(shí)候,搜索引擎會(huì)快速分析網(wǎng)頁(yè)索引中的相關(guān)信息,以便找出匹配內(nèi)容。搜索結(jié)果按照相關(guān)性排序,相關(guān)程度最高的網(wǎng)頁(yè)排在最前面。(當(dāng)然,我說(shuō)的是搜索的自然結(jié)果,而不是付費(fèi)搜索結(jié)果。在Google搜索結(jié)果頁(yè)面的最上方和該頁(yè)的右側(cè),可以看到那些很小的純文本型付費(fèi)廣告。)
搜索引擎使用很多不同的相關(guān)因子來(lái)決定與你的查詢要求相關(guān)性最高的結(jié)果是什么。Google搜索使用的相關(guān)因子有200多個(gè),其中包括你的搜索條件出現(xiàn)在網(wǎng)頁(yè)的什么地方,這個(gè)條件出現(xiàn)的頻率有多高等因素。譬如,只是在搜索框中輸入videoconferencing(視頻會(huì)議)這個(gè)詞,Google搜索到的結(jié)果會(huì)有數(shù)百萬(wàn)條。這個(gè)時(shí)候排在最前面的搜索結(jié)果有維基百科(Wikipedia)的網(wǎng)站和《商業(yè)周刊》(Business Week)的一篇文章。在這兩個(gè)搜索結(jié)果中,videoconferencing這個(gè)單詞都是出現(xiàn)在網(wǎng)頁(yè)的標(biāo)題中(這正是“查詢條件出現(xiàn)位置”這個(gè)因子的影響),而且這個(gè)單詞在網(wǎng)站和周刊文章中至少出現(xiàn)了4次(這是“出現(xiàn)頻率”因子在起作用)。