WIKI使用導(dǎo)航
站長百科導(dǎo)航
站長專題
- 網(wǎng)站推廣
- 網(wǎng)站程序
- 網(wǎng)站賺錢
- 虛擬主機(jī)
- cPanel
- 網(wǎng)址導(dǎo)航專題
- 云計算
- 微博營銷
- 虛擬主機(jī)管理系統(tǒng)
- 開放平臺
- WIKI程序與應(yīng)用
- 美國十大主機(jī)
網(wǎng)頁快照
為什么我們只要在搜索引擎的搜索框內(nèi)輸入想要查詢的關(guān)鍵詞,搜索引擎就會立即在廣闊無垠的因特網(wǎng)上,把包含關(guān)鍵詞所有網(wǎng)頁一網(wǎng)打盡,呈現(xiàn)在我們的面前。
如果您了解了搜索引擎的工作原理,就不會這樣認(rèn)為了。每一張網(wǎng)頁上都有很多超鏈接,鏈接到另外一些網(wǎng)頁上,而這些網(wǎng)頁上依然有很多超鏈接,又可以鏈接到另另外一些網(wǎng)頁上……
按照這個方法,您最后發(fā)現(xiàn),幾乎所有因特網(wǎng)上的網(wǎng)頁都被鏈接在一起了。其實(shí)這就是搜索引擎的工作原理,搜索引擎用這樣順藤摸瓜的辦法找到所有能找到的網(wǎng)頁,事實(shí)上,這表面上看起來有些愚蠢,不過搜索引擎確實(shí)是用這種手段混飯吃的。
更令人氣憤的是,搜索引擎每找到一張網(wǎng)頁,都要復(fù)制下來,放入自己的腰包,到最后,它把因特網(wǎng)上幾乎所有的網(wǎng)頁都收羅到腰包中了。這個腰包就是搜索引擎的網(wǎng)頁數(shù)據(jù)庫,這個數(shù)據(jù)庫中包含了所有被復(fù)制下來的首頁。
搜索引擎中的老大哥Google,它的名字就來自于數(shù)學(xué)中的一個幾乎不可超越的數(shù):google,這個數(shù)是10的100次方,從名字就可以看出Google搜索引擎的胃口是多么的貪婪,在它的網(wǎng)頁數(shù)據(jù)庫中禁錮了四億多張網(wǎng)頁(這是它自己說的),這四億張網(wǎng)頁就是它在因特網(wǎng)上復(fù)制下來的,這每一張被復(fù)制下來的網(wǎng)頁叫做一張 網(wǎng)頁快照 。
當(dāng)用戶使用搜索引擎在因特網(wǎng)上搜索網(wǎng)頁時,那其實(shí)就在搜索引擎的網(wǎng)頁數(shù)據(jù)庫中搜索,用戶誤認(rèn)為搜索引擎一下子就在因特網(wǎng)上找到了包含關(guān)鍵詞的網(wǎng)頁。
因特網(wǎng)上的網(wǎng)頁并不是一成不變的,而是不斷增加、刪除、改動。因此,搜索引擎網(wǎng)頁數(shù)據(jù)庫中的網(wǎng)頁也需要及時更新,既把因特網(wǎng)上網(wǎng)頁重新復(fù)制一遍,如果你在你的網(wǎng)站上刪除一張網(wǎng)頁,那么搜索引擎數(shù)據(jù)庫中的復(fù)制品-網(wǎng)頁快照并不會立刻被刪除,而是要過一段才會被刪除。但是,Google的網(wǎng)頁快照是標(biāo)示快照存檔時間的,那么,在這個時間點(diǎn)上,該網(wǎng)頁肯定還存在。舉例:2008年7月20日打開一個Google的網(wǎng)頁快照,而這張快照上顯示是Google在7月10日搜索并存檔的。什么意思?這表示:2008年7月20日,這個網(wǎng)頁或許已被刪除或更新,但是,2008年7月10日,當(dāng)Google對該網(wǎng)頁復(fù)制存檔的時候,該網(wǎng)頁是確實(shí)存在的。
搜索引擎還試圖收集一切能夠找到的URL ,還把包含相同關(guān)鍵詞的網(wǎng)頁進(jìn)行排隊,純商業(yè)化的搜索引擎采用純商業(yè)原則,還有按點(diǎn)擊率給網(wǎng)頁排位,這樣保證了用戶的搜索效率達(dá)到最高。
搜索引擎只是一個工具,熟練的駕駛它,可以在因特網(wǎng)中找到十分豐富的資源,目前網(wǎng)頁快照最人性化的是“百度”,“百度快照”擁有g(shù)oogle快照的全部功能外,還增加的關(guān)鍵字定位功能,為用戶提供更加快速、高效關(guān)鍵詞搜索方式,在方便程度上來講“百度快照”大大超越了同類其他搜索引擎。