日韩精品 中文字幕 动漫,91亚洲午夜一区,在线不卡日本v一区v二区丶,久久九九国产精品自在现拍

正文

第6章 是法國(guó)的巴黎,還是拉斯韋加斯的巴黎?(2)

Google時(shí)代的工作方法 作者:(美)道格拉斯·梅里爾


盡管大多數(shù)搜索引擎都遵從這個(gè)通用模式,然而沒(méi)有哪兩個(gè)搜索引擎的運(yùn)作模式完全相同。在不同的搜索引擎上使用同樣的條件進(jìn)行搜索,得到的結(jié)果不盡相同,原因就在這里。

Google公司的PageRank好(網(wǎng)頁(yè)等級(jí))算法是Google搜索區(qū)別于其他搜索引擎的重要一點(diǎn)。Google公司的共同創(chuàng)始人拉里·佩奇和謝爾蓋·布林(Sergey Brin)認(rèn)識(shí)的時(shí)候,兩人都是斯坦福大學(xué)研究生。他們有一個(gè)課程設(shè)計(jì)項(xiàng)目,要尋找一種從大量數(shù)據(jù)中獲取有價(jià)值信息的途徑。正是這個(gè)項(xiàng)目導(dǎo)致了PageRank算法的開(kāi)發(fā)。

PageRank算法根據(jù)特定網(wǎng)頁(yè)的相似度判定其“好壞”,這種方式跟我們通常判定別人的方式一樣。例如,你在大街上偶然遇到一個(gè)陌生人,這個(gè)人莫名其妙地給你解釋什么是搜索,你大概不會(huì)當(dāng)真。為什么要當(dāng)真呢?他是個(gè)陌生人啊。你不知道他說(shuō)的是不是合情合理。

然而,你卻買了這本書(shū),而且看到了這一章。很有可能,你相信我可以在計(jì)算機(jī)搜索方面說(shuō)出些門道。為什么你容易相信我,而不是相信街上遇到的那個(gè)陌生人呢?這在很大程度上是因?yàn)榧偃缥覍?duì)自己談?wù)摰闹黝}一無(wú)所知,那么出版社是不會(huì)給我出版這本書(shū)的。(對(duì)吧?)換言之,你之所以相信我,是因?yàn)槟阈湃蔚某霭嫔缧湃挝摇?/p>

PageRank算法本質(zhì)上就是采用同樣的工作機(jī)理。這個(gè)算法不是去詢問(wèn)它所信任的人,而是要看網(wǎng)頁(yè)是否鏈接到它的排序頁(yè)面上。它更“信任”那些大量相關(guān)網(wǎng)頁(yè)鏈接所指向的頁(yè)面。換句話說(shuō),如果很多相關(guān)網(wǎng)頁(yè)鏈接到某個(gè)頁(yè)面上,那這個(gè)頁(yè)面必定會(huì)有值得其他網(wǎng)頁(yè)鏈接的理由,這個(gè)頁(yè)面大概就是“好的”。同樣,這個(gè)頁(yè)面在PageRank排序中會(huì)有一個(gè)更高的等級(jí),序列等級(jí)的提高有助于該頁(yè)面在Google搜索結(jié)果排序位置的前移。

順便說(shuō)一句,你可能會(huì)以為PageRank源于Web page(網(wǎng)頁(yè))。不過(guò),你錯(cuò)了。這是一個(gè)雙關(guān)語(yǔ),佩奇(Larry Page)是用自己的名字給這個(gè)算法命名的。

對(duì)搜索結(jié)果進(jìn)行精確排序是件難事,這首先是因?yàn)槲覀兪褂玫恼Z(yǔ)言十分復(fù)雜。例如,假如我只是告訴你我要去bank(銀行或河邊),你能確定我是要去取錢嗎?或許你還以為要到河邊溜達(dá)呢?

與此類似,如果你在計(jì)算機(jī)上搜索apples(蘋(píng)果),搜索引擎怎么能知道你要找的是一種水果還是一個(gè)公司呢?Google搜索算法以從億萬(wàn)條過(guò)去的搜索結(jié)果中匯總提取的龐大數(shù)據(jù)為基礎(chǔ),形成有根據(jù)的猜測(cè)。如果像剛才所說(shuō)的那樣,你在Google搜索框中輸入apples這個(gè)單詞,Google搜索通常會(huì)猜想你要搜索有關(guān)水果的信息。Google搜索也會(huì)作好兩手準(zhǔn)備,排在前面的搜索結(jié)果有水果信息,同時(shí)也會(huì)有蘋(píng)果公司的信息。然而,如果你輸入的是單數(shù)形式的apple,那么你搜索蘋(píng)果公司的可能性就會(huì)顯著加大。在這種情況下,排在前面的搜索結(jié)果當(dāng)中,跟蘋(píng)果公司有關(guān)的信息就會(huì)占有壓倒性的多數(shù)。如此一來(lái),Google會(huì)依據(jù)搜索條件中是否含有復(fù)數(shù)標(biāo)志s給出不同的排位結(jié)果。對(duì)于其他的搜索內(nèi)容,問(wèn)題可能會(huì)更加復(fù)雜。Google公司及其競(jìng)爭(zhēng)對(duì)手之所以聘請(qǐng)數(shù)以百計(jì)的工程師,鍥而不舍地調(diào)整它們的搜索引擎,以便提供相關(guān)度最高的搜索結(jié)果,原因就在于此。

獲取相關(guān)度最高的搜索結(jié)果


上一章目錄下一章

Copyright ? 讀書(shū)網(wǎng) rgspecialties.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)