火車采集器使用教程介紹,采集規(guī)則寫(xiě)法介紹
時(shí)間:2021-03-12 13:15:17 作者:無(wú)名 瀏覽量:53
如果你經(jīng)常會(huì)在大型的新聞或者資訊
網(wǎng)站中發(fā)表文章的話,一篇一篇的發(fā)送的話就會(huì)很耽誤時(shí)間,同時(shí)也耽誤我們工作的效率。為了提高更新網(wǎng)站的效率,這就能夠使用火車頭
采集器這款工具,在使用這款工具的過(guò)程中,需要提前設(shè)置采集規(guī)則,才能夠有更高的效率進(jìn)行發(fā)送。本篇文章給大家來(lái)分享的就是火車頭采集器這款工具的采集規(guī)則寫(xiě)法介紹,幫助小伙伴們更快的上手進(jìn)行使用,快來(lái)詳細(xì)的了解一下吧!
方法介紹
1. 新建文章采集節(jié)點(diǎn)
我們打開(kāi)火車采集器這款工具之后,成功登錄這款工具之后,我們?cè)谲浖黜?yè)面中依次點(diǎn)擊“采集—采集節(jié)點(diǎn)管理—增加新節(jié)點(diǎn)—選擇普通文章”,以上選項(xiàng)完成之后,點(diǎn)“確定”按鈕進(jìn)行下一步。
2. 填寫(xiě)采集列表規(guī)則
節(jié)點(diǎn)名稱:在這里可以隨便進(jìn)行編寫(xiě),但是需要用自己分清楚,因?yàn)楣?jié)點(diǎn)多了會(huì)產(chǎn)生混亂。
匹配網(wǎng)址:是在采集目標(biāo)列表頁(yè)面中,更好的查看列表的規(guī)則。在使用過(guò)程中,建議大家從第二頁(yè)開(kāi)始進(jìn)行采集查看,因?yàn)楹芏嗑W(wǎng)站的列表的第一面跟其它內(nèi)頁(yè)是有很大的差別。
火車采集器使用教程介紹圖二
區(qū)域結(jié)束的HTML:在采集目標(biāo)列表頁(yè)打開(kāi)源代碼!在要采集的文章標(biāo)題后面的附近找一段在本頁(yè)是唯一并且其它要采集的的頁(yè)面也是唯一的html標(biāo)簽!
以上選項(xiàng)設(shè)置完成后,直接點(diǎn)擊保存信息,更好的進(jìn)入下一步。如果規(guī)則寫(xiě)作全部正確之后,就會(huì)出現(xiàn)內(nèi)容的網(wǎng)址獲取規(guī)則測(cè)試。
3. 采集內(nèi)容規(guī)則
文章標(biāo)題:在文章標(biāo)題的前后找兩個(gè)標(biāo)簽之后,能夠幫助用戶更好的識(shí)別標(biāo)題。
火車采集器使用教程介紹圖三
文章內(nèi)容:在文章內(nèi)容前后找兩個(gè)標(biāo)簽,能識(shí)別出內(nèi)容的!采集的網(wǎng)站的文章內(nèi)容前后唯一標(biāo)簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫(xiě)成<div class=”content”>[內(nèi)容]<ul class=”page clearfix”>。
對(duì)于其他的功能也不用管了,確定之后點(diǎn)擊保存配置同時(shí)進(jìn)行預(yù)覽,如果前面的列表規(guī)則跟內(nèi)容規(guī)則都寫(xiě)對(duì)了的話,那現(xiàn)在就會(huì)預(yù)覽到內(nèi)容。
- 軟件性質(zhì):國(guó)產(chǎn)軟件
- 授權(quán)方式:免費(fèi)版
- 軟件語(yǔ)言:簡(jiǎn)體中文
- 軟件大。23789 KB
- 下載次數(shù):4599 次
- 更新時(shí)間:2021/3/11 12:34:25
- 運(yùn)行平臺(tái):WinAll...
- 軟件描述:火車采集器是使用人數(shù)比較多的互聯(lián)網(wǎng)數(shù)據(jù)挖掘軟件。能采集99%的網(wǎng)頁(yè),就算網(wǎng)頁(yè)需要... [立即下載]
相關(guān)資訊
相關(guān)軟件