久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔
站長百科 | 數(shù)字化技能提升教程 數(shù)字化時代生存寶典
首頁
數(shù)字化百科
電子書
建站程序
開發(fā)
服務(wù)器
辦公軟件
開發(fā)教程
服務(wù)器教程
軟件使用教程
運營教程
熱門電子書
WordPress教程
寶塔面板教程
CSS教程
Shopify教程
導(dǎo)航
程序頻道
推廣頻道
網(wǎng)賺頻道
人物頻道
網(wǎng)站程序
網(wǎng)頁制作
云計算
服務(wù)器
CMS
論壇
網(wǎng)店
虛擬主機
cPanel
網(wǎng)址導(dǎo)航
WIKI使用導(dǎo)航
WIKI首頁
最新資訊
網(wǎng)站程序
站長人物
頁面分類
使用幫助
編輯測試
創(chuàng)建條目
網(wǎng)站地圖
站長百科導(dǎo)航
站長百科
主機偵探
IDCtalk云說
跨境電商導(dǎo)航
WordPress啦
站長專題
網(wǎng)站推廣
網(wǎng)站程序
網(wǎng)站賺錢
虛擬主機
cPanel
網(wǎng)址導(dǎo)航專題
云計算
微博營銷
虛擬主機管理系統(tǒng)
開放平臺
WIKI程序與應(yīng)用
美國十大主機
編輯“
Siteserver-信息采集管理-信息采集概述
”
人物百科
|
營銷百科
|
網(wǎng)賺百科
|
站長工具
|
網(wǎng)站程序
|
域名主機
|
互聯(lián)網(wǎng)公司
|
分類索引
跳轉(zhuǎn)至:
導(dǎo)航
、?
搜索
警告:
您沒有登錄。如果您做出任意編輯,您的IP地址將會公開可見。如果您
登錄
或
創(chuàng)建
一個賬戶,您的編輯將歸屬于您的用戶名,且將享受其他好處。
反垃圾檢查。
不要
加入這個!
<span style="text-align:center; border:1px solid #000; float:right; padding:6px;"><strong>導(dǎo)航:</strong> [[Siteserver使用教程|上一頁]]</span> <div style="clear:both;"></div> '''信息采集概述''' [[Web]]是一個巨大的資源寶庫,目前頁面數(shù)目已超過400億,每小時還以驚人的速度增長,里面有你需要的大量有價值的信息,例如潛在客戶的列表與聯(lián)系信息,競爭產(chǎn)品的價格列表,實時金融新聞,供求信息,論文摘要等等。 可是由于關(guān)鍵信息都是以半結(jié)構(gòu)化或自由文本形式存在于大量的[[HTML]]網(wǎng)頁中,很難直接加以利用。 [[SiteServer]] [[CMS]] 信息[[采集]]功能的主要目標(biāo)就是解決[[網(wǎng)絡(luò)]]信息的采集問題,系統(tǒng)通過一些定制的采集邏輯,自動從指定網(wǎng)站或[[數(shù)據(jù)庫]]中獲取內(nèi)容并保存到[[網(wǎng)站]]中。 '''一、主要功能''' SiteServer CMS 提供強大的信息采集功能[[模塊]],用戶只需要告訴系統(tǒng)目標(biāo)網(wǎng)頁并簡單地設(shè)置頁面規(guī)則,很快就可以直接得到所需要的數(shù)據(jù)了。 [[Image:Siteserver0199.gif]] 除了典型的Web頁面信息采集外,系統(tǒng)還提供數(shù)據(jù)庫信息采集與單文件頁采集功能: #Web頁面信息采集用于自動從指定網(wǎng)站中獲取內(nèi)容; #數(shù)據(jù)庫信息采集用于自動從指定數(shù)據(jù)庫中獲取內(nèi)容; #單文件頁采集用于將指定網(wǎng)頁采集到本地的對應(yīng)文件中。 '''二、系統(tǒng)特點''' * 結(jié)果數(shù)據(jù)高度準(zhǔn)確 * 對目標(biāo)網(wǎng)站進(jìn)行信息自動抓取,支持HTML頁面內(nèi)各種數(shù)據(jù)的采集,如文本信息、圖片、附件、日期等 * 用戶對每類信息自定義來源與分類 * 可以下載圖片與各類文件 * 支持定時任務(wù),可以與SiteServer CMS 定時模塊相配合,定期抽取目標(biāo)網(wǎng)站 * 支持記錄唯一索引,避免相同信息重復(fù)入庫 * 支持智能替換功能,可以將內(nèi)容中嵌入的所有的無關(guān)部分如廣告去除 * 支持下一頁自動瀏覽功能 * 支持?jǐn)?shù)據(jù)的多種后期處理方式 * 數(shù)據(jù)直接進(jìn)入數(shù)據(jù)庫而不是文件中,因此與利用這些數(shù)據(jù)的網(wǎng)站程序或者桌面程序之間沒有任何耦合 * 支持?jǐn)?shù)據(jù)庫表結(jié)構(gòu)完全自定義,充分利用現(xiàn)有數(shù)據(jù)庫結(jié)構(gòu) * 支持多個欄目的信息采集可用同一配置一對多處理 * 保證信息的完整性與準(zhǔn)確性,絕不會出現(xiàn)亂碼 '''三、運用行業(yè)''' 通過信息采集功能,用戶將在信息來源,資源整合方面節(jié)約大量的人力與資金。廣泛應(yīng)用于門戶網(wǎng)站,新聞媒體,科研單位、企業(yè)網(wǎng)站等領(lǐng)域。 ==參考資料== *[http://help.siteserver.cn SiteServer官方] [[category:SiteServer|S]]
摘要:
請注意,您對站長百科的所有貢獻(xiàn)都可能被其他貢獻(xiàn)者編輯,修改或刪除。如果您不希望您的文字被任意修改和再散布,請不要提交。
您同時也要向我們保證您所提交的內(nèi)容是您自己所作,或得自一個不受版權(quán)保護(hù)或相似自由的來源(參閱
Wordpress-mediawiki:版權(quán)
的細(xì)節(jié))。
未經(jīng)許可,請勿提交受版權(quán)保護(hù)的作品!
取消
編輯幫助
(在新窗口中打開)
取自“
http://kktzf.com.cn/wiki/Siteserver-信息采集管理-信息采集概述
”