火車頭采集器免費版
v10.2 官方正式版- 軟件大?。?span itemprop="fileSize">47.51 MB
- 軟件語言:中文
- 軟件類型:國產軟件 / 網絡輔助
- 軟件授權: 免費軟件
- 更新時間:2022-11-01 18:09:23
- 軟件等級:
- 軟件廠商: -
- 應用平臺:WinAll, WinXP
- 軟件官網: http://www.locoy.com/download
相關軟件
CreAiTv1.5.5安卓版
46.04 MB/中文/10.0
外業(yè)采集軟件v1.01.3安卓版
131.90 MB/中文/10.0
數道云調研系統(tǒng)v5.2.7.3 安卓版
23.57 MB/中文/5.0
標貝易采app手機版v1.3.9.3 安卓版
19.77 MB/中文/10.0
DocShotLite官方版v3.15.1 安卓版
123.20 MB/中文/10.0
軟件介紹人氣軟件精品推薦相關文章網友評論下載地址
火車頭采集器免費版是一款功能強大的網絡數據信息挖掘工具,具有批量采集網頁、論壇內容等功能,你可以使用它采集各大主流網站文章系統(tǒng),論壇系統(tǒng)等,速度高速下載穩(wěn)定,需要的朋友快來IT貓撲下載吧!
軟件功能
支持最新的Win10系統(tǒng)中運行。
支持SSH(Sftp文件)上傳。
任務運行合并到統(tǒng)一界面,添加“實時數據”查看和“任務詳情”統(tǒng)計。
列表頁,分頁,多頁自定義任意Header請求頭等功能。
批量修改任務規(guī)則細節(jié)參數,批量修改Web發(fā)布配置。
起始網址批量網址的地址格式可添加多個地址參數,支持自定義列表參數。
標簽數據來源更細致化,可設置從默認頁,分頁,多頁的源碼,URL地址及返回頭信息中提取。
標簽數據處理新增統(tǒng)計標簽字符串長度、批量替換功能。
火車頭采集器免費版特色
1、擴展性強、適用范圍廣
自定義web發(fā)布,自定義主流的數據庫的保存和發(fā)布,自定義本地php及.net外部編程接口處理數據,讓數據都能為你所用。
2、穩(wěn)定、高效
七年磨一劍,軟件不斷更新進步,采集速度快,性能穩(wěn)定,占用資源少。
3、通用性強
無論新聞、論壇、視頻、黃頁、圖片、下載類網站,只要通過瀏覽器能看到的結構化的內容,通過指定匹配規(guī)則,都能采集到您所需要的內容。
火車頭采集器采集文章使用教程實例
任務:
采集某一個指定頁面的文章包括(標題、圖片、描述、內容)導入到自己網站數據庫對應欄目(欄目id為57),數據庫字段分別(title,thumb,descrption,content)。
頁面里面第一張圖作為文章縮略圖,這邊一個獲取縮略圖名稱并添加上對應網站路徑放入數據庫thumb字段,另一個是下載下本地,統(tǒng)一上傳到指定文件夾,(當然看軟件可以直接ftp,目前還沒弄,后期弄了會補充)
1、新建分組--新建任務
?
2、添加網址+ 編輯獲取網址的規(guī)則
選擇范圍在 ul 里面的 li 里面的鏈接,注意排除重復地址,可以點擊下面測試網址采集獲取。
可以看到有采集到的文章鏈接了。
?
3、采集內容規(guī)則
我這邊需要采集下面圖上展示數據(catid是欄目id,可以將采集到的數據放入對應欄目,設置固定值就好)
著重說下內容和圖片的采集,標題和描述同理內容采集
?內容采集:
打開一個采集的文章頁面,查看源代碼(禁了右鍵的f11 或者在網址前面加上 view-source:?一樣可以查看):
選中文章開頭一個位置,截取一段在ctrl+f 搜下是否唯一一段,若是就可以放在位置下圖1處,結尾同開頭一樣。
我截取內容不想里面還帶有鏈接圖片可以數據處理,添加--html標簽排除--選好確定--確定
?
還有需要下載頁面圖片,勾選和填寫下面選項
?
圖片采集:
(1)選中范圍和內容一樣(文章內圖片)
(2)數據處理選 提取第一張圖片 ?內容是:http://www.xxx.com/2017/33/aa.jpg
(3)只要aa.jpg,正則過濾,獲取內容:aa.jpg
(4)數據庫存儲有前綴,添加上, upload/xxxxx/
找一個頁面測試一下,可以看到對應項目都獲取到了。
?
4、發(fā)布內容設置,這里以方式三發(fā)布到數據庫為例子,編輯后回到這邊勾選剛定義的模塊就好:
?
?5、我需要保存圖片到本地,要設置下保存文件的路徑(ftp后續(xù)會試著使用)。
?
6、保存,查看剛新建的任務,右鍵 開始任務運行,這邊就可以看到文字和圖片都下載下來了,數據庫里面也可以看到了。
更新日志
火車采集器V10.2版
1.新增:User-Agent支持從文本讀取并隨機切換。教程:http://faq.locoy.com/q-1348.html。
2.新增:自動識別手機號功能支持14、15、16、17、19開頭的新號段。
3.優(yōu)化:文件下載完畢插件接口優(yōu)化。
4.優(yōu)化:探測文件下載時正式下載文件,提升下載速度。
5.修復:http請求頭“Header或設置名”以數字開頭的名稱報錯的問題修復。
6.修復:發(fā)布到word文檔,如果數據包含特殊字符或本地圖片異常會導致發(fā)布失敗問題修復。
7.修復:拷貝任務時,任務備注未拷貝問題修復。
8.修復:標簽引用支持調用“列表頁”標簽。
9.修復:json提取時如果json對象的“鍵”是整型導致提取有誤。
10.優(yōu)化:網址解析替換html問題。
11.修復:get、post分頁問題處理。
12.修復:生成固定格式的數據中“系統(tǒng)時間”選中“06-16”生成時間格式“yyyy-MM”
13.新增:數據庫發(fā)布模塊支持replace into語句。
火車采集器V9.10版
1.二級代理重大修改并增加了商業(yè)代理支持
2.post獲取網址POST頁碼增加遞增數值
3.修復php和python插件不支持cookie的問題
4.當成功失敗標識都為空時認為是發(fā)布成功
5.調整發(fā)布和入庫模塊界面大小和操作bug
6.修復web發(fā)布不登錄時不發(fā)UA的問題
7.修復web發(fā)布測試時超時不起效的問題
8.修復Web發(fā)布時特殊情況下死循環(huán)問題
更多>> 軟件截圖
推薦應用
純真ip數據庫 4.64 MB
下載/中文/5.0 v2022.04.20 中文最新版百度網盤極速上傳控件 440.00 KB
下載/中文/8.0 v2.0.0.3 正式版Proxifier(socks5客戶端) 3.47 MB
下載/中文/5.0 v3.42 漢化優(yōu)化安裝版世紀前線測速(Avltool網速測試) 537.00 KB
下載/中文/10.0 v3.00 綠色版逆火網站日志分析器破解版 127.00 MB
下載/中文/0.0 v4.18 企業(yè)版傲杰關鍵字排名查詢系統(tǒng)百度專版 3.00 MB
下載/中文/0.0 v3.0 官方版P2P后臺終結者 4.91 MB
下載/中文/10.0 v2.4 官方簡體中文版華為stb管理工具密碼 692.00 KB
下載/中文/10.0 v4.03 中文版
其他版本下載
精品推薦 采集器
- 更多 (53個) >> 采集器 采集器一般指是采集網頁數據的智能軟件,數據采集系統(tǒng)以完全自主研發(fā)的分布式云計算平臺為核心,可以在很短的時間內,輕松從各種不同的網站或者網頁獲取大量的規(guī)范化數據,幫助任何需要從網頁獲取信息的客戶實現數據自動化采集,編輯,規(guī)范化,擺脫對人工搜索及收集數據的依賴,降低獲取信息的成本,提
火車采集器v9破解版 20.48 MB
/中文/0.0淘金閣視頻采集器 294.00 KB
/中文/7.0火車頭采集器免費版 47.51 MB
/中文/0.0飛訊QQ采集器 6.38 MB
/中文/10.0京東商品圖片采集器 1.22 MB
/中文/10.0條碼采集器 2.38 MB
/中文/10.0caipda條碼采集器 17.62 MB
/中文/10.0火車頭采集器v8免費版 33.13 MB
/中文/2.0
相關文章
下載地址
火車頭采集器免費版 v10.2 官方正式版
查看所有評論>> 網友評論
更多>> 猜你喜歡