WIKI使用導(dǎo)航
站長百科導(dǎo)航
站長專題
- 網(wǎng)站推廣
- 網(wǎng)站程序
- 網(wǎng)站賺錢
- 虛擬主機(jī)
- cPanel
- 網(wǎng)址導(dǎo)航專題
- 云計算
- 微博營銷
- 虛擬主機(jī)管理系統(tǒng)
- 開放平臺
- WIKI程序與應(yīng)用
- 美國十大主機(jī)
主要搜索引擎介紹
Google[ ]
Google是全球最大的搜索引擎,目前在中文搜索市場排名第二,以技術(shù)與創(chuàng)新著稱。借助和America Online、Netscape及其他公司的合作伙伴關(guān)系,它所回應(yīng)的查詢遠(yuǎn)遠(yuǎn)多于其他在線服務(wù)商。Google.com是互聯(lián)網(wǎng)上5大最受歡迎的網(wǎng)站之一,在全球范圍內(nèi)擁有無數(shù)的用戶,全球受眾:超過百分之五十的點擊量來自美國境外。
網(wǎng)站地址: http://www.google.com
除搜索業(yè)務(wù)外,還擁有以搜索為基礎(chǔ)的Google Adwords,Google Adsense廣告系統(tǒng),Gmail,Google企業(yè)套件等多項業(yè)務(wù)。
Google的SiteMap技術(shù)[ ]
Google的SiteMap技術(shù)是什么?
Google Sitemap可以讓網(wǎng)站建設(shè)者通過使用特定格式的sitemap文件,通知Google并指引Google spider收錄相應(yīng)網(wǎng)頁。正確地使用Google Sitemap,可以確保讓Google spider不遺漏網(wǎng)站內(nèi)的任何頁面,及時地、連續(xù)地收錄進(jìn)Google的索引數(shù)據(jù)庫。無論從哪個角度,網(wǎng)頁被收錄進(jìn)索引數(shù)據(jù)庫是網(wǎng)頁出現(xiàn)在SERP的最基本條件,而Google Sitemap則提供了網(wǎng)頁收錄的捷徑,這在某種意義上可以視之為Google的后門。
既然說是Google某種意義上的后門,那么,Google一定會抓取 Sitemap 中的所有網(wǎng)址并為其編制索引嗎?這個問題Google的官方也做出了相關(guān)的回答,內(nèi)容如下:
我們不保證一定會抓取所有網(wǎng)址并為其編制索引。例如,我們不會抓取您的 Sitemap 中所含的圖片網(wǎng)址或為其編制索引。但是,我們會使用 Sitemap 中的數(shù)據(jù)了解網(wǎng)站的結(jié)構(gòu),這樣可以讓我們改進(jìn)抓取工具的日程,并在日后能更好地對網(wǎng)站進(jìn)行抓取。大多數(shù)情況下,網(wǎng)站管理員會從 Sitemap 提交中受益,您決不會因此而受到處罰。
從Google的官方回答來看,Google一定會抓取 Sitemap 中的所有網(wǎng)址并為其編制索引,而只是有利于其進(jìn)行抓取,某種意義上來說,Google的Sitemap對于提供網(wǎng)站搜索的位置有很大的幫助,這個幫助基本上有兩個用途:
- Google站點地圖給你提供了一個途徑來告訴Google你的網(wǎng)站有價值的信息
- 你可以通過Google站點地圖來了解Google是怎么看待你的網(wǎng)站的
怎樣設(shè)立Google站點地圖[ ]
設(shè)立Google的站點地圖,第一件事情就是要創(chuàng)建一個Google賬戶,這個賬戶可以是你的Gmail信箱的賬戶,或者是Adwords,Adesnse的賬戶就可以了。
一般來說,有兩種類型的 sitemap。 第一種類型的 sitemap 是通常按部分列出您網(wǎng)站網(wǎng)頁的 HTML 網(wǎng)頁,用于幫助用戶查找所需的信息。 雖然此類 sitemap 能夠幫助訪問者和搜索引擎瀏覽網(wǎng)站,但是它不同于 XML Sitemap,XML Sitemap 可通過網(wǎng)站管理員工具提交給 Google。
A:使用 RSS / Atom 供稿作為 Sitemap
Google 接受 RSS(真正簡單的聯(lián)合供稿)2.0 供稿和 Atom 1.0 供稿。如果您的博客有 RSS 或 Atom 供稿,您可以將該供稿的網(wǎng)址作為 Sitemap 提交。 大多數(shù)博客軟件會為您創(chuàng)建供稿。 如果您的網(wǎng)站沒有供稿,您可以使用 Feedburner 創(chuàng)建并發(fā)布供稿。
B:創(chuàng)建基于文本文件的 Sitemap
一個 Sitemap 應(yīng)包含一個您網(wǎng)站的網(wǎng)址(最多 50,000 個)列表。 如果您的網(wǎng)站很大,包含的網(wǎng)址超過 50,000 個,則應(yīng)創(chuàng)建多個 Sitemap,并為它們提交一個 Sitemap 索引文件 <>。
您可以向 Google 提供純文本文件,其中每行包含一個網(wǎng)址。 例如:
http://www.example.com/file1.html
http://www.example.com/file2.html
要獲得最佳效果,請按照下列指南操作:
- 由于 Google 完全按照所提供的網(wǎng)址進(jìn)行抓取,您需要完整指定網(wǎng)址。
- 每個文本文件最多可以包含 50,000 個網(wǎng)址。 如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個,則可以將列表分割成多個文本文件,然后分別添加每個文件。
- 文本文件需使用 UTF-8 編碼。 在保存文件時您可指明此項(例如,在記事本中,此項會在"另存為"對話框中的"編碼"菜單中列出)。
- 文本文件不應(yīng)包含網(wǎng)址列表以外的任何信息。
- 文本文件不應(yīng)包含任何頁眉或頁腳信息。
- 您可以對文本文件進(jìn)行任意命名。 Google 建議將文件的擴(kuò)展名定為 .txt,以表明其為文本文件(例如 sitemap.txt)。
您應(yīng)將文本文件上傳到服務(wù)器,通常傳至希望搜索引擎抓取的最高級目錄。 創(chuàng)建此文件后,您即可將其作為 Sitemap 提交。 如果您對編制網(wǎng)絡(luò)服務(wù)器的腳本或管理網(wǎng)絡(luò)服務(wù)器不熟悉,手動進(jìn)行此過程是最簡單的方法,也不失為一種最好的方法。
如果您有多個網(wǎng)站,可以創(chuàng)建一個或多個 Sitemap 將所有經(jīng)過驗證網(wǎng)站的網(wǎng)址包含在其中,然后將這些 Sitemap 保存在一個位置,以此來簡化 Sitemap 的創(chuàng)建和提交過程。 所有網(wǎng)站都必須使用網(wǎng)站管理員工具進(jìn)行驗證。
C:根據(jù) Sitemap 協(xié)議創(chuàng)建 Sitemap
Google 可以接受多種格式的 Sitemap,但是我們建議您根據(jù) Sitemap 協(xié)議創(chuàng)建 Sitemap,因為這種格式的文件也可以提交至作為 sitemaps.org 成員的其他搜索引擎,如 MSN 和 Yahoo!。
您可以通過以下多種方式創(chuàng)建 Sitemap:
- 根據(jù) Sitemap 協(xié)議手動創(chuàng)建 Sitemap
- 使用 Sitemap 生成器。如果您可以訪問網(wǎng)絡(luò)服務(wù)器并且服務(wù)器裝有 Python,則可以利用我們的腳本來創(chuàng)建采用 Sitemap 協(xié)議的 Sitemap。 Google Sitemap 生成器是一個 Python 腳本,可以利用 Sitemap 協(xié)議為您的網(wǎng)站創(chuàng)建 Sitemap。 此腳本可以通過網(wǎng)址列表、網(wǎng)絡(luò)服務(wù)器目錄或通過訪問日志創(chuàng)建 Sitemap。
- 使用第三方工具。 很多第三方提供了可用于創(chuàng)建有效的 Sitemap 的工具。
向 Google 添加網(wǎng)站[ ]
加入 Google 搜索結(jié)果是不需要付費的,并且非常容易執(zhí)行;您甚至不需要將網(wǎng)站提交給 Google。 Google 是一個完全自動化的搜索引擎,它使用稱為"信息采集軟件"的軟件定期抓取網(wǎng)絡(luò)并找到可添加到 Google 索引的網(wǎng)站。事實上,列入搜索結(jié)果中的絕大多數(shù)網(wǎng)站都不是人工提交的,而是信息采集軟件抓取網(wǎng)絡(luò)時找到并自動添加的。
但是,如果您的網(wǎng)站提供專門的產(chǎn)品、內(nèi)容或服務(wù),則您可以把它們投放在Google 網(wǎng)絡(luò)搜索和其他 Google 服務(wù)上,以便在全世界范圍內(nèi)進(jìn)行傳播。 有關(guān)更多信息,請訪問 Google 內(nèi)容中心。
要判斷您的網(wǎng)站當(dāng)前是否包含在 Google 索引中,請對您的網(wǎng)址執(zhí)行"site:"搜索。 例如,索 [site:google.com] 會返回以下結(jié)果:http://www.google.com/search?q=site%3Agoogle.com。
雖然 Google 可抓取超過數(shù)十億個網(wǎng)頁,但遺漏少數(shù)網(wǎng)站也在所難免。 造成 Spider 遺漏網(wǎng)站的常見原因如下:
- 網(wǎng)站未通過多個鏈接牢靠地連接到網(wǎng)絡(luò)上的其他網(wǎng)站。
- 網(wǎng)站在 Google 最近一次抓取后才啟動。
- 網(wǎng)站的設(shè)計讓 Google 很難有效抓取其中的內(nèi)容。
- 網(wǎng)站在我們抓取時暫時不可用,或我們在抓取時收到錯誤消息。 您可以使用 Google 網(wǎng)站管理員工具來查看當(dāng)我們試圖抓取您的網(wǎng)站時是否收到了錯誤。
公平準(zhǔn)確地展示互聯(lián)網(wǎng)內(nèi)容是我們的宗旨。 為實現(xiàn)此目標(biāo),我們提供了有關(guān)構(gòu)建便于抓取的網(wǎng)站的指南和提示。 雖然我們無法保證信息采集軟件能找到某個特定網(wǎng)站,但遵循以下指南應(yīng)該可以增加網(wǎng)站在我們的搜索結(jié)果中顯示的機(jī)會。
考慮創(chuàng)建并提交關(guān)于您的網(wǎng)頁的詳細(xì) Sitemap。 Sitemap 是您向 Google 索引提交所有網(wǎng)址并詳細(xì)了解您的網(wǎng)頁在 Google 顯示情況的一條捷徑。 通過 Sitemap,我們可以隨時自動獲得有關(guān)您當(dāng)前網(wǎng)頁及其更新的所有信息。 請注意,提交 Sitemap 并不能保證您網(wǎng)站上的所有網(wǎng)頁都會被抓取或包含在我們的搜索結(jié)果中。
百度[ ]
百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,( Baidu.com,Inc)簡稱百度。于1999年底成立于美國硅谷,它的創(chuàng)建者為資深信息檢索技術(shù)專家、超鏈分析專利的唯一持有人——百度總裁李彥宏,及其好友——在硅谷有多年商界成功經(jīng)驗的百度執(zhí)行副總裁徐勇博士。截止2009年,百度是目前中國大陸訪問使用量最高的搜索引擎。
網(wǎng)站地址:http://www.baidu.com
百度的Sitemap[ ]
準(zhǔn)確的說,叫它baidu sitemap不太準(zhǔn)確,而且會有朋友問,百度有類似于google的xml格式sitemap嗎?答案是有,但是它又不完全等同于sitemap。根據(jù)百度官方的描述,我們應(yīng)該管它叫做《互聯(lián)網(wǎng)新聞開放協(xié)議》。但是我還是喜歡叫它baidu sitemap,我覺得這個名稱對站長來說更親切一些:)
其實按照百度官方的解釋,我們應(yīng)該稱之為《互聯(lián)網(wǎng)新聞開放協(xié)議》。但Google的Sitemap叫習(xí)慣了,所以一時不改不了口,暫且就叫它百度Sitemap吧。
從官方的公布的文檔名稱,我們清楚的知道這個XML文檔只針對的是站內(nèi)的新聞,似乎對我們沒有什么價值。這點就反映在我們對“新聞”一詞的理解上,我認(rèn)為百度的“新聞”一詞應(yīng)該包括:新聞、文章、文檔資料等,而這些都是很多網(wǎng)站所必備的東西。而且蜘蛛是跟據(jù)鏈接來爬行的,所以當(dāng)我們的網(wǎng)站通過互聯(lián)網(wǎng)開放協(xié)議的審查后,百度就會來抓取這個xml文檔里的信息,而且還會順著鏈接找到其它的內(nèi)容,百度也會連這些內(nèi)容一并抓取了。
有這些好處,為什么有很多站長到現(xiàn)在還不知道有這個東西的存在呢,可能主要的原因是百度的Sitemap在提交會由百度審核,目前國內(nèi)許多的站長的抄襲嚴(yán)重,所以提交審核自然有許多不會被通過了,自然打消人們的積極性。
下面來說說百度Sitemap中XML標(biāo)簽所代表的含義的:
- < document>——標(biāo)記整個XML文件內(nèi)容的開始和結(jié)束。
- < website>——站點地址。
- < webmaster>——負(fù)責(zé)人員的Email。當(dāng)有必要時,我們通過這個地址與您聯(lián)系。
- < updateperi>——更新周期,以分鐘為單位。搜索引擎將遵照此周期訪問該頁面,使頁面上的新聞更及時地出現(xiàn)在百度新聞中。
- < item>——標(biāo)記每篇新聞信息的開始和結(jié)束。標(biāo)記內(nèi)為單篇新聞信息,不包括新聞專題。
- < title>——新聞標(biāo)題。
- < link>——新聞url地址,與單篇新聞一一對應(yīng);若分頁的新聞存在多個URL,相當(dāng)于多篇新聞。
< description>——新聞內(nèi)容簡介。
- < text>——完整的新聞?wù)模▋H包含正文文字,不包含HTML語言等其它字符)。此項的目的是使該篇新聞更多、更準(zhǔn)地出現(xiàn)在搜索結(jié)果中。
- < image>——新聞?wù)膬?nèi)相關(guān)圖片,采用絕對地址。若該篇新聞無相關(guān)圖片,可以為空;若含有多張圖片,請重復(fù)使用該標(biāo)簽。此項的目的是使該篇新聞的相關(guān)圖片展現(xiàn)在搜索結(jié)果中。
- < headlineimg>——為有可能成為頭條的新聞制作的頭條圖,采用絕對地址。
- < keywords>——反映新聞主題內(nèi)容的一個或多個關(guān)鍵詞,關(guān)鍵詞之間以空格隔開。此項僅作為參考,檢索結(jié)果不完全依賴于此標(biāo)簽中的內(nèi)容。
- < category>——新聞分類, 可以遵循網(wǎng)站自身的分類體系,最好采用一級分類。
- < author>——新聞作者,可以為機(jī)構(gòu)或個人 。
- < source>——新聞來源,即原創(chuàng)媒體或其它機(jī)構(gòu) 。
- < pubdate>——新聞發(fā)布時間,與該篇新聞HTML頁面上的發(fā)布時間保持一致。請精確到分鐘;若您網(wǎng)站的發(fā)布時間未記錄小時分鐘,提供年月日即可。
不知道大家注意到?jīng)]有,在百度的Sitemap中所有的新聞?wù)膬?nèi)容全都放在Text標(biāo)簽內(nèi),這樣做雖然能讓百度有效的收錄所有的新聞?wù)膬?nèi)容,但同時也存在風(fēng)險,如果XML文件地址被泄露的話,那網(wǎng)站內(nèi)容就被會被輕意的讀取、復(fù)制。 是否應(yīng)該使用baidu sitemap,相信大家心里應(yīng)該有數(shù),每個網(wǎng)站都有自己的算盤。如果覺得自己的網(wǎng)站不錯,以我建議在做搜索引擎優(yōu)化的時侯還是做一做baidu sitemap。
雅虎[ ]
雅虎公司是一家全球性的互聯(lián)網(wǎng)通訊、商貿(mào)及媒體公司。其網(wǎng)絡(luò)每月為全球超過一億八千萬用戶提供多元化的網(wǎng)上服務(wù)。雅虎是全球第一家提供互聯(lián)網(wǎng)導(dǎo)航服務(wù)的網(wǎng)站,不論在瀏覽量、網(wǎng)上廣告、家庭或商業(yè)用戶接觸面上,雅虎都居于領(lǐng)導(dǎo)地位,也是最為人熟悉及最有價值的互聯(lián)網(wǎng)品牌之一,在全球消費者品牌排名中位居第38 位。
雅虎還在網(wǎng)站上提供各種商務(wù)及企業(yè)服務(wù),以幫助客戶提高生產(chǎn)力及網(wǎng)絡(luò)使用率,其中包括廣受歡迎的為企業(yè)提供定制化網(wǎng)站解決方案的雅虎企業(yè)內(nèi)部網(wǎng);影音播放、商店網(wǎng)站存儲和管理;以及其他網(wǎng)站工具及服務(wù)等。雅虎在全球共有24個網(wǎng)站,其總部設(shè)在美國加州圣克拉克市,在歐洲、亞太區(qū)、拉丁美洲、加拿大及美國均設(shè)有辦事處。
網(wǎng)站地址:http://www.yahoo.com
雅虎中國
1999年9月,雅虎中國網(wǎng)站開通。2005年8月,中國雅虎由阿里巴巴集團(tuán)全資收購。中國雅虎(www.yahoo.com.cn)開創(chuàng)性地將全球領(lǐng)先的互聯(lián)網(wǎng)技術(shù)與中國本地運營相結(jié)合,并一直致力于以創(chuàng)新、人性、全面的網(wǎng)絡(luò)應(yīng)用,為億萬中文用戶帶來最大價值的生活體驗,成為中國互聯(lián)網(wǎng)的“生活引擎”。
口碑網(wǎng)(www.koubei.com)是中國最大的生活搜索引擎,涵蓋餐飲娛樂、租房、買房、工作、旅游等生活消費信息,信息遍布所有大中城市。自 2004年6月成立以來,一直致力于做百姓的生活好向?qū)В?006年10月,阿里巴巴集團(tuán)正式戰(zhàn)略投資口碑網(wǎng)。本地生活搜索是口碑網(wǎng)提供給用戶的重要服務(wù)功能,口碑網(wǎng)兩大行業(yè)頻道餐飲休閑、房產(chǎn)交易都在同類網(wǎng)站中居首位。
2008年6月,中國雅虎和口碑網(wǎng)整合,成立雅虎口碑網(wǎng),正式進(jìn)軍生活服務(wù)領(lǐng)域。以全網(wǎng)搜索為基礎(chǔ),為生活服務(wù)消費者打造出一個海量、方便、可信的生活服務(wù)平臺-雅虎口碑網(wǎng)。網(wǎng)站一經(jīng)推出,就確立了在同行業(yè)的領(lǐng)先地位。
中文搜索引擎列表[ ]
- 谷歌 http://www.google.cn
- 百度 http://www.baidu.com
- 雅虎中文 http://www.yahoo.cn
- 易搜 http://yisou.com
- 有道 http://www.youdao.com
- SOSO http://www.soso.com
- 愛問 http://iask.com
- 搜狗 http://www.sogou.com
- 盤古搜索 http://www.panguso.com/