久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔
站長(zhǎng)百科 | 數(shù)字化技能提升教程 數(shù)字化時(shí)代生存寶典
首頁(yè)
數(shù)字化百科
電子書(shū)
建站程序
開(kāi)發(fā)
服務(wù)器
辦公軟件
開(kāi)發(fā)教程
服務(wù)器教程
軟件使用教程
運(yùn)營(yíng)教程
熱門電子書(shū)
WordPress教程
寶塔面板教程
CSS教程
Shopify教程
導(dǎo)航
程序頻道
推廣頻道
網(wǎng)賺頻道
人物頻道
網(wǎng)站程序
網(wǎng)頁(yè)制作
云計(jì)算
服務(wù)器
CMS
論壇
網(wǎng)店
虛擬主機(jī)
cPanel
網(wǎng)址導(dǎo)航
WIKI使用導(dǎo)航
WIKI首頁(yè)
最新資訊
網(wǎng)站程序
站長(zhǎng)人物
頁(yè)面分類
使用幫助
編輯測(cè)試
創(chuàng)建條目
網(wǎng)站地圖
站長(zhǎng)百科導(dǎo)航
站長(zhǎng)百科
主機(jī)偵探
IDCtalk云說(shuō)
跨境電商導(dǎo)航
WordPress啦
站長(zhǎng)專題
網(wǎng)站推廣
網(wǎng)站程序
網(wǎng)站賺錢
虛擬主機(jī)
cPanel
網(wǎng)址導(dǎo)航專題
云計(jì)算
微博營(yíng)銷
虛擬主機(jī)管理系統(tǒng)
開(kāi)放平臺(tái)
WIKI程序與應(yīng)用
美國(guó)十大主機(jī)
編輯“
ECMS:高手提供的教程
”
人物百科
|
營(yíng)銷百科
|
網(wǎng)賺百科
|
站長(zhǎng)工具
|
網(wǎng)站程序
|
域名主機(jī)
|
互聯(lián)網(wǎng)公司
|
分類索引
跳轉(zhuǎn)至:
導(dǎo)航
、?
搜索
警告:
您沒(méi)有登錄。如果您做出任意編輯,您的IP地址將會(huì)公開(kāi)可見(jiàn)。如果您
登錄
或
創(chuàng)建
一個(gè)賬戶,您的編輯將歸屬于您的用戶名,且將享受其他好處。
反垃圾檢查。
不要
加入這個(gè)!
<span style="border:1px solid #000; float:right; padding:6px; margin-bottom:15px; text-align:center;"><strong>導(dǎo)航:</strong> [[ECMS:采集使用篇|上一級(jí)]] | [[帝國(guó)CMS]] | {{Template:帝國(guó)導(dǎo)航}}</span> <div style="clear:both; border:1px solid #999; background:#f0f0f0; font-size:14px; font-weight:bold; margin:20px 0 20px; padding:0 5px;"> 采集技巧(作者:藥蓮) </div> <p style="padding-left:15px;"> 發(fā)現(xiàn)不少人在[[采集]]方面有些或多或少的問(wèn)題。今天來(lái)說(shuō)一下采集技巧。</p> <p style="padding-left:15px;">說(shuō)之前先提一下:如果想要取得他人的幫助,光說(shuō)一下“XX網(wǎng)頁(yè)我采不到”,或是“XX網(wǎng)頁(yè)的XX正則我怎么設(shè)不對(duì)呀”,一般比較少會(huì)有人來(lái)幫你。因?yàn)橄胍獛湍?,幫你者就必須自己先?xiě)一個(gè)完整的那個(gè)網(wǎng)站,或是至少那個(gè)列表頁(yè)的采集正則。在你是問(wèn)某一個(gè)小問(wèn)題,在別人就是大動(dòng)工的寫(xiě)一整套正則了——最差最差,也是要打開(kāi)那個(gè)網(wǎng)頁(yè),一點(diǎn)點(diǎn)地找正則所在……別人不是該你的,有沒(méi)有義務(wù)是一回事,有沒(méi)有精力又是另一回事。就算勤勞如蓮,大多數(shù)時(shí)間也是懶得理會(huì),爬爬走過(guò)的</p> <p style="padding-left:15px;">所以,如果想取得他人的幫助,最好是哪個(gè)正則有問(wèn)題,就把自己寫(xiě)的那個(gè)部分正則也貼出來(lái)(如果能貼全套的則更好,別人可以整套地幫你測(cè)試),無(wú)論是尋找癥結(jié)所在,還是節(jié)省他人時(shí)間上,都是很有幫助的。</p> <p style="padding-left:15px;">另外,也不要把想取得幫助的網(wǎng)頁(yè)的代碼整個(gè)的復(fù)制粘貼上來(lái),貼個(gè)網(wǎng)頁(yè)地址就可以了,你貼一大片代碼,進(jìn)來(lái)看的人一下就被嚇出去了……</p> <p style="padding-left:15px;">下面來(lái)說(shuō)一下采集技巧:(個(gè)人經(jīng)驗(yàn))</p> <ol> <li>采集的正則能寫(xiě)得越簡(jiǎn)單越好。<br> 當(dāng)然,復(fù)雜的話針對(duì)性強(qiáng),比較不容易采到不要的內(nèi)容,但能在保證不采到不要的內(nèi)容的前提下,越簡(jiǎn)單,一個(gè)正則對(duì)該網(wǎng)頁(yè)的通用性就越強(qiáng)。比如說(shuō)一樣是采<a href="鏈接">這個(gè)鏈接,個(gè)人覺(jué)得,如果你已經(jīng)設(shè)定了鏈接區(qū)域,區(qū)域內(nèi)不會(huì)有別的鏈接的話,與其把鏈接正則寫(xiě)成<a href="[!--newsurl--]">,還不如寫(xiě)成href="[!--newsurl--]"。這樣,萬(wàn)一有幾頁(yè)的[[鏈接]]對(duì)方寫(xiě)成了<A href="鏈接">,也不會(huì)影響你的采集效果。<br> 當(dāng)然,對(duì)方不會(huì)莫名其妙地改變自己的模板,上面只是舉個(gè)例子。而我是懶人,懶人的目標(biāo)就是用最少的正則采到最多的新聞。<br> 正則寫(xiě)得簡(jiǎn)單,還是對(duì)自己采集水平的一個(gè)鍛煉。越簡(jiǎn)單,找正則規(guī)律的要求就越高,多鍛煉自己,采集時(shí)才比較容易一次就采到自己想要的東西。 <li>在正則內(nèi)盡管減少空格和回車的使用。<br> 這樣說(shuō)可能不是很明白??崭裾l(shuí)不用?注意:這里說(shuō)的不是一個(gè)或兩個(gè)空格,而是大片相連的空格。<br> 空格的存在當(dāng)然是必要的,但寫(xiě)采集正則時(shí)出現(xiàn)大片相連的空格甚至包含大量回車時(shí)只能說(shuō)明兩個(gè)問(wèn)題:一,要么是對(duì)方的網(wǎng)頁(yè)太難采集,讓你不得不使用大片相連空格及回車來(lái)區(qū)分采集區(qū)域,否則找不到別的辦法了;二,要么是你太懶,懶得仔細(xì)地找正則,看到什么就是什么,大片的復(fù)制下來(lái)再說(shuō),反正復(fù)制得越多越不容易和別的重復(fù)。<br> 相信大多數(shù)人都是第二種。<br> 但要注意,當(dāng)你大量復(fù)制對(duì)方網(wǎng)頁(yè)代碼當(dāng)成正則時(shí),你也把自己推入了一種很可能采集失敗,或是某幾頁(yè)能成功,某幾頁(yè)以失敗告終的險(xiǎn)境。某幾頁(yè)成功、某幾頁(yè)失敗的原因,同第1條所述,對(duì)方有可能偶爾在頁(yè)面內(nèi)改變正則。這種情況雖然不大遇到,但要充分考慮到。<br> 大多數(shù)復(fù)制大量代碼當(dāng)正則的同志,是處于一種不成功便成仁的境地的。因?yàn)榭崭襁€算好,不會(huì)出太多問(wèn)題;但回車的問(wèn)題很嚴(yán)重。我采集時(shí),發(fā)現(xiàn),往往有些網(wǎng)頁(yè)在正則內(nèi)使用了回車,就會(huì)采集失敗——完全不認(rèn)采集區(qū)域?;剀囀莻€(gè)很好的辨識(shí)標(biāo)志,但——具體原因還不明了——有時(shí)它會(huì)導(dǎo)致整個(gè)采集過(guò)程的失敗。 <li>分頁(yè)區(qū)域正則。<br> 很多人能很好地設(shè)定整個(gè)頁(yè)面的正則,但往往失敗在分頁(yè)正則上(我到現(xiàn)在都不是每個(gè)分頁(yè)都能采得到)。這里提幾個(gè)技巧。<br> 第一,盡量不要把分頁(yè)區(qū)域包含在新聞?wù)恼齽t內(nèi)。這一點(diǎn)……如果有人看菜鳥(niǎo)手冊(cè)的話……嚴(yán)正聲明,那里面是寫(xiě)錯(cuò)的,當(dāng)時(shí)對(duì)采集不是很了解,所以寫(xiě)錯(cuò)了。如果把分頁(yè)區(qū)域包含在新聞?wù)恼齽t內(nèi),會(huì)導(dǎo)致采到的新聞?dòng)袃尚械?頁(yè)、第2頁(yè)等的顯示——因?yàn)榘褜?duì)方的分頁(yè)也當(dāng)正文采來(lái)了。<br> 第二,要注意“上下頁(yè)導(dǎo)航”和“全部列出式”?,F(xiàn)在大多數(shù)網(wǎng)頁(yè)是兩種模式同時(shí)存在的。所以在寫(xiě)正則時(shí),如果你是使用某一種模式,要注意過(guò)濾掉另一種模式的鏈接,不然會(huì)導(dǎo)致采到過(guò)多的分頁(yè),一般是會(huì)出現(xiàn)兩個(gè)第2頁(yè)。<br> 第三,當(dāng)分頁(yè)采集屢屢失敗,又實(shí)在查不出錯(cuò)在哪里時(shí),請(qǐng)看一下第2、3、4……頁(yè)的新聞?wù)牡恼齽t,是否與你寫(xiě)的新聞?wù)齽t一致。有的網(wǎng)頁(yè),后面幾頁(yè)用到的代碼和第一頁(yè)會(huì)不一樣,往往會(huì)比第一頁(yè)少掉一些,這時(shí),如果你用的新聞?wù)恼齽t正好用到了后面幾頁(yè)沒(méi)有的代碼,那你分頁(yè)正則即使寫(xiě)得完全沒(méi)有問(wèn)題,由于后幾頁(yè)的正文它采集不到,顯示出來(lái)的就是沒(méi)有采到分頁(yè)(T_T 某蓮曾在這個(gè)問(wèn)題上給它耗掉整整一個(gè)晚上,血淚史啊……) <li>采集中盡量減少用*,或者,至少有選擇性地用*。<br> 比如<a href="鏈接">OOXXOOXX</a>這個(gè),不少人喜歡用<a href="[!--newsurl--]">*</a>來(lái)采集。但是試問(wèn),這個(gè)*有什么意義嗎?列位哪位有見(jiàn)過(guò),有哪個(gè)<a>.....</a>之間是沒(méi)有東西的嗎?所以這個(gè)*放在這里,有放沒(méi)放是一個(gè)樣的。除非是這個(gè)鏈接正則太復(fù)雜了,一定要靠*之后的代碼繼續(xù)區(qū)分判斷,以過(guò)濾掉不要的,這時(shí)才需要用*。<br> 用*有一個(gè)弊端——在你對(duì)正則看得不是很清楚,不太負(fù)責(zé)任地加*的時(shí)候,很可能不能完全采集到你想采集的內(nèi)容,或是一不小心把要采集的內(nèi)容去掉了。所以能不用*盡量不要用*。 </ol> *'''小林教你如何采集(作者:小林)''' 感謝小林提供的教程. 以采集新浪體育的冠軍聯(lián)賽為例,如下圖: <div style="border:1px solid #999; width:917px;"> [[{{ns:image}}:xlcj1.gif]]</div> <div style="border:1px solid #999; background:#f0f0f0; font-size:14px; font-weight:bold; margin:20px 0 20px; padding:0 5px;"> 藥蓮教你如何采集[小林教程解析版] </div> 感謝藥蓮(phamlily)提供的教程. 是在小林教程基礎(chǔ)上進(jìn)行解析,更加詳細(xì): '''第一部分''' <div style="border:1px solid #999; width:913px;"> [[{{ns:image}}:ylcj1.gif]]</div><br> <div style="border:1px solid #999; width:814px;"> [[{{ns:image}}:ylcj2.gif]]</div> '''第二部分''' <div style="border:1px solid #999; width:908px;"> [[{{ns:image}}:ylcj3.gif]]</div><br> <div style="border:1px solid #999; width:638px;"> [[{{ns:image}}:ylcj4.gif]]</div><br> <div style="border:1px solid #999; width:763px;"> [[{{ns:image}}:ylcj5.gif]]</div> '''第三部分''' <div style="border:1px solid #999; width:913px;"> [[{{ns:image}}:ylcj6.gif]]</div><br> <div style="border:1px solid #999; width:730px;"> [[{{ns:image}}:ylcj7.gif]]</div><br> <div style="border:1px solid #999; width:761px;"> [[{{ns:image}}:ylcj8.gif]]</div> '''第四部分''' <div style="border:1px solid #999; width:914px;"> [[{{ns:image}}:ylcj9.gif]]</div><br> <div style="border:1px solid #999; width:605px;"> [[{{ns:image}}:ylcj10.gif]]</div><br> <div style="border:1px solid #999; width:753px;"> [[{{ns:image}}:ylcj11.gif]]</div> '''第五部分''' <div style="border:1px solid #999; width:914px;"> [[{{ns:image}}:ylcj12.gif]]</div><br> <div style="border:1px solid #999; width:763px;"> [[{{ns:image}}:ylcj13.gif]]</div> <div style="border:1px solid #999; background:#f0f0f0; font-size:14px; font-weight:bold; margin:20px 0 20px; padding:0 5px;"> 相關(guān)視頻下載 </div> 帝國(guó)采集演示視頻:[http://down.zzbaike.com/download/ecmscjsp-1537.html 點(diǎn)擊下載] [[Category:帝國(guó)管理系統(tǒng)|D]] [[Category:CMS采集]]
摘要:
請(qǐng)注意,您對(duì)站長(zhǎng)百科的所有貢獻(xiàn)都可能被其他貢獻(xiàn)者編輯,修改或刪除。如果您不希望您的文字被任意修改和再散布,請(qǐng)不要提交。
您同時(shí)也要向我們保證您所提交的內(nèi)容是您自己所作,或得自一個(gè)不受版權(quán)保護(hù)或相似自由的來(lái)源(參閱
Wordpress-mediawiki:版權(quán)
的細(xì)節(jié))。
未經(jīng)許可,請(qǐng)勿提交受版權(quán)保護(hù)的作品!
取消
編輯幫助
(在新窗口中打開(kāi))
本頁(yè)使用的模板:
模板:帝國(guó)導(dǎo)航
(
查看源代碼
)(受保護(hù))
取自“
http://kktzf.com.cn/wiki/ECMS:高手提供的教程
”