久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔

ECMS:帝國(guó)CMS的采集正則

來(lái)自站長(zhǎng)百科
Sutrong討論 | 貢獻(xiàn)2009年1月6日 (二) 16:59的版本
(差異) ←上一版本 | 最后版本 (差異) | 下一版本→ (差異)
跳轉(zhuǎn)至: 導(dǎo)航、? 搜索

導(dǎo)航: 上一級(jí) | 帝國(guó)CMS | 首頁(yè) | DedeCMS | Drupal | PHPCMS | PHP168 | Xoops | Joomla | PowerEasy | SupeSite

帝國(guó)CMS的采集正則

1、作用:通過(guò)設(shè)置采集正則以便使系統(tǒng)識(shí)別你要采集的內(nèi)容。

2、帝國(guó)CMS的采集正則是什么樣的,下面我們用實(shí)例講解:

(1)、假如我們要采集頁(yè)面的內(nèi)容頁(yè)為如下頁(yè)面:

圖1:HTML頁(yè)面

Cjzz1.gif

圖2:查看頁(yè)面源代碼為如下:

Cjzz2.gif

(2)、由上圖的源代碼內(nèi)容我們可以得出帝國(guó)CMS的采集正則:

新聞標(biāo)題正則:

<td>標(biāo)題:<strong>[!--title--]</strong></td>

新聞內(nèi)容正則:

<td>內(nèi)容:<font color="#FF0000">[!--newstext--]</font></td>

上面中的“[!--title--]”與“[!--newstext--]”分別為“標(biāo)題”字段與“內(nèi)容”字段的正則變量。用于指定我們要采集的內(nèi)容位置。

(3)、由上面我們得出了,帝國(guó)CMS采集正則是把正則變量替換要采集內(nèi)容后的代碼內(nèi)容。格式:

識(shí)別代碼頭部[!--變量名--]識(shí)別代碼尾部

注意事項(xiàng):上面的“識(shí)別代碼頭部”一定是要唯一的標(biāo)記。

3、帝國(guó)CMS正則還有表示任意內(nèi)容的字符:“*”

如果“識(shí)別代碼頭部”中有內(nèi)容是變化的,那么我們可以用*代替它。如頁(yè)面源代碼為如下,我們要采集下面的鏈接地址:

<a title="任意可變內(nèi)容" href="鏈接地址">標(biāo)題</a>

通過(guò)使用“*”任意內(nèi)容表示字符,我們可以用下面的正則忽略可變內(nèi)容,獲得鏈接地址:

<a title="*" href="[!--newsurl--]">

附加說(shuō)明:[!--newsurl--]為頁(yè)面鏈接地址的正則變量。

4、其它說(shuō)明:

(1)、正則要找出唯一性的代碼。有時(shí)候空格都會(huì)成為識(shí)別的依據(jù)。
(2)、對(duì)于特殊字符請(qǐng)?jiān)谇懊婕由稀癨\”,當(dāng)然直接將特殊字符改為“*”最合適了。特殊字符如下:
“ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。