您的位置:極速下載站 → 電腦軟件 → 網(wǎng)絡(luò)軟件 → 下載工具 → 善肯網(wǎng)頁TXT采集器
善肯網(wǎng)頁TXT采集器是一款由個人開發(fā)的小說網(wǎng)站TXT采集工具,喜歡看小說的網(wǎng)友都喜歡到網(wǎng)站上看小說,但在網(wǎng)頁上看小說總覺得哪里不對勁,使用這款善肯網(wǎng)頁TXT采集器可以把小說下載到硬盤上,支持17K小說網(wǎng)、定點小說網(wǎng)、飛盧小說網(wǎng)等等,下載成功后可以在電腦閱讀也可以傳到手機上進行閱讀,喜歡看小說的網(wǎng)友可以下載網(wǎng)頁小說下載采集器使用。
使用說明
使用推薦有點懂或者可以看懂正則表達式的朋友使用,如果不了解正則表達式可以現(xiàn)學(xué)一下,用到的都是很基礎(chǔ)的,不會太難。
規(guī)則設(shè)置
1、輸入網(wǎng)址后,可以實時預(yù)覽(不論有有沒規(guī)則,有規(guī)則就是匹配規(guī)則后的內(nèi)容,沒有就是源代碼,目前測試,并非所有網(wǎng)頁都能獲取其內(nèi)容,具體大家可以自己去實驗,能獲取源代碼的就是可以匹配出內(nèi)容的)
2、目錄頁和內(nèi)容頁分別匹配不同的規(guī)則:
目錄頁:
文本名稱規(guī)則
作者名稱規(guī)則
章節(jié)規(guī)則(此處需有兩個()一處匹配章節(jié)路徑,一個匹配章節(jié)名稱)
內(nèi)容頁:
內(nèi)容規(guī)則
3、關(guān)于替換:
通用替換(非正則):所有規(guī)則都會自動加上通用替換(有共性的替換規(guī)則)
定制替換(非正則):單個網(wǎng)站的特有替換規(guī)則
正則替換:暫未開發(fā),請求打賞支持開發(fā)~~。
想換行可用內(nèi)容與\n進行替換,\n是替換數(shù)據(jù)不是原數(shù)據(jù)。
可以根據(jù)自己的需求增刪,。(原數(shù)據(jù)和替換數(shù)據(jù)必填,一個空格都行,否則會拋異常)
刪除:選中一行,按DELETE鍵刪除
4、關(guān)于規(guī)則保存:
保存都是以文件名來的,不同的名稱則為不同的規(guī)則,比較終保存為xml形式。
5、關(guān)于地址解析
解析地址1:測試未刪,以后會加功能,暫留著
解析地址2:推薦使用
6、理論上,只要是目錄頁指向內(nèi)容頁的形式都可以抓取【能獲取源代碼的情況下】。具體請大家自己去實驗。
關(guān)于文件
1、commonrule.xml 文件存放的是通用替換規(guī)則,
2、rule文件夾下存放的是以網(wǎng)站為單位的規(guī)則。
如果需要直接拷貝單條規(guī)則放到rule文件夾下就可以使用規(guī)則了,前提是xml文件格式是對的,
3、其他
暫時還沒想到你們可能還會出現(xiàn)什么問題。如果遇到問題歡迎反饋。
比較后附上常用匹配全部內(nèi)容的表達式:
(.*?) ([\w\W]*?) ([\s\S]*?)
文件信息
文件大。1113672 字節(jié)
文件說明:善肯網(wǎng)頁TXT采集器
文件版本:1.0.0.0
MD5:763833633E6F0E5AECF65FF3D063911D
SHA1:456FD87DEAF197BB0CE5F2FCB56E152A0DBD74EF
CRC32:C581EF9F