時(shí)間:2017-05-08 11:13:29 作者:不思議游戲 瀏覽量:32
火車采集器的所有版本均支持下載圖片。
這里所說的圖片是 源代碼里的有標(biāo)準(zhǔn)樣式標(biāo)簽的圖片地址。
所以只要您采集的源代碼里有這這樣的圖片代碼,采集器會(huì)將其中的圖片下載到本地。
如果是一個(gè)直接的圖片地址,如http://www.locoy.com/logo.gif ,或者不規(guī)則的圖片源碼,
采集器是會(huì)做為文件下載。
下載文件是需要收費(fèi)版本支持。
圖片的下載設(shè)置如下:
勾選 “將相對(duì)地址補(bǔ)全為絕對(duì)地址” , "下載圖片" 即可完成下載
“將相對(duì)地址補(bǔ)全為絕對(duì)地址”:勾選后,會(huì)把標(biāo)簽采集到相對(duì)地址補(bǔ)全為絕對(duì)地址。
“下載圖片”:勾選后,源代碼里的含標(biāo)準(zhǔn)樣式的代碼圖片將會(huì)下載
“探測(cè)文件真實(shí)地址但不下載”:有時(shí)候采集到的附件下載地址,其實(shí)不是真實(shí)的的下載地址,點(diǎn)擊后是會(huì)有跳轉(zhuǎn)的,勾選這個(gè)就會(huì)把真實(shí)地址給采集出來,但是只是得到下載地址并不下載。
“探測(cè)文件并下載”:勾選后,可以把采集到的任何格式的文件附件下載下來。
比如我們需要把下載的圖片保存為格式
下面我們來將其拆分為 頭+中+尾 三部分
http://www.locoy.com/ 是網(wǎng)站域名;
images/201510/ 是文件路徑,201510是年月的意思
1.jpg 是文件名和后綴
其他設(shè)置--文件圖片下載--文件鏈接地址前綴:設(shè)置為 http://www.locoy.com/
其他設(shè)置--文件圖片下載--所有文件保存根目錄:可以根據(jù)您需要設(shè)置
內(nèi)容采集規(guī)則--數(shù)據(jù)處理--文件下載--文件保存目錄:設(shè)置為 images/201510/
此時(shí)我們需要在綠色字體前加 \ 做轉(zhuǎn)義,年月做替換,故是下圖設(shè)置效果:
內(nèi)容采集規(guī)則--數(shù)據(jù)處理--文件下載--文件保存格式:您可以自定義設(shè)置重命名