火車頭采集器電腦版免費下載 最新更新|軟件分類|軟件專題|手機版|論壇轉貼|軟件發(fā)布

您當前所在位置: 首頁網絡軟件網絡輔助 → 火車頭采集器免費版 v10.2 官方正式版

火車頭采集器免費版

v10.2 官方正式版

火車頭采集器免費版下載
  • 軟件大?。?span itemprop="fileSize">47.51 MB
  • 軟件語言:中文
  • 軟件類型:國產軟件 / 網絡輔助
  • 軟件授權: 免費軟件
  • 更新時間:2022-11-01 18:09:23
  • 軟件等級:4星
  • 軟件廠商: -
  • 應用平臺:WinAll, WinXP
  • 軟件官網:

ITMOP本地下載文件大?。?7.51 MB

點贊 好評 0%(0) 差評 差評 0%(0)

軟件介紹人氣軟件精品推薦相關文章網友評論下載地址

小編為您推薦: 火車頭采集器 數據采集

火車頭采集器免費版是一款功能強大的網絡數據信息挖掘工具,具有批量采集網頁、論壇內容等功能,你可以使用它采集各大主流網站文章系統(tǒng),論壇系統(tǒng)等,速度高速下載穩(wěn)定,需要的朋友快來IT貓撲下載吧!

軟件功能

支持最新的Win10系統(tǒng)中運行。

支持SSH(Sftp文件)上傳。

任務運行合并到統(tǒng)一界面,添加“實時數據”查看和“任務詳情”統(tǒng)計。

列表頁,分頁,多頁自定義任意Header請求頭等功能。

批量修改任務規(guī)則細節(jié)參數,批量修改Web發(fā)布配置。

起始網址批量網址的地址格式可添加多個地址參數,支持自定義列表參數。

標簽數據來源更細致化,可設置從默認頁,分頁,多頁的源碼,URL地址及返回頭信息中提取。

標簽數據處理新增統(tǒng)計標簽字符串長度、批量替換功能。

火車頭采集器

火車頭采集器免費版特色

1、擴展性強、適用范圍廣

自定義web發(fā)布,自定義主流的數據庫的保存和發(fā)布,自定義本地php及.net外部編程接口處理數據,讓數據都能為你所用。

2、穩(wěn)定、高效

七年磨一劍,軟件不斷更新進步,采集速度快,性能穩(wěn)定,占用資源少。

3、通用性強

無論新聞、論壇、視頻、黃頁、圖片、下載類網站,只要通過瀏覽器能看到的結構化的內容,通過指定匹配規(guī)則,都能采集到您所需要的內容。

火車頭采集器采集文章使用教程實例

任務:

采集某一個指定頁面的文章包括(標題、圖片、描述、內容)導入到自己網站數據庫對應欄目(欄目id為57),數據庫字段分別(title,thumb,descrption,content)。

頁面里面第一張圖作為文章縮略圖,這邊一個獲取縮略圖名稱并添加上對應網站路徑放入數據庫thumb字段,另一個是下載下本地,統(tǒng)一上傳到指定文件夾,(當然看軟件可以直接ftp,目前還沒弄,后期弄了會補充)

1、新建分組--新建任務

火車頭采集器免費版

?

2、添加網址+ 編輯獲取網址的規(guī)則

火車頭采集器免費版

選擇范圍在 ul 里面的 li 里面的鏈接,注意排除重復地址,可以點擊下面測試網址采集獲取。

火車頭采集器免費版

可以看到有采集到的文章鏈接了。

火車頭采集器免費版

?

3、采集內容規(guī)則

我這邊需要采集下面圖上展示數據(catid是欄目id,可以將采集到的數據放入對應欄目,設置固定值就好)

火車頭采集器免費版

著重說下內容和圖片的采集,標題和描述同理內容采集

火車頭采集器電腦版

?內容采集:

打開一個采集的文章頁面,查看源代碼(禁了右鍵的f11 或者在網址前面加上 view-source:?一樣可以查看):

選中文章開頭一個位置,截取一段在ctrl+f 搜下是否唯一一段,若是就可以放在位置下圖1處,結尾同開頭一樣。

我截取內容不想里面還帶有鏈接圖片可以數據處理,添加--html標簽排除--選好確定--確定

?火車頭采集器電腦版

還有需要下載頁面圖片,勾選和填寫下面選項

火車頭采集器電腦版

?

圖片采集:

(1)選中范圍和內容一樣(文章內圖片)

(2)數據處理選 提取第一張圖片 ?內容是:http://www.xxx.com/2017/33/aa.jpg

(3)只要aa.jpg,正則過濾,獲取內容:aa.jpg  

火車頭采集器電腦版

(4)數據庫存儲有前綴,添加上, upload/xxxxx/

火車頭采集器電腦版

找一個頁面測試一下,可以看到對應項目都獲取到了。

?

4、發(fā)布內容設置,這里以方式三發(fā)布到數據庫為例子,編輯后回到這邊勾選剛定義的模塊就好:

火車頭采集器電腦版

火車頭采集器電腦版

?

?5、我需要保存圖片到本地,要設置下保存文件的路徑(ftp后續(xù)會試著使用)。

火車頭采集器電腦版

?

6、保存,查看剛新建的任務,右鍵 開始任務運行,這邊就可以看到文字和圖片都下載下來了,數據庫里面也可以看到了。

火車頭采集器電腦版

更新日志

火車采集器V10.2版

1.新增:User-Agent支持從文本讀取并隨機切換。教程:http://faq.locoy.com/q-1348.html。

2.新增:自動識別手機號功能支持14、15、16、17、19開頭的新號段。

3.優(yōu)化:文件下載完畢插件接口優(yōu)化。

4.優(yōu)化:探測文件下載時正式下載文件,提升下載速度。

5.修復:http請求頭“Header或設置名”以數字開頭的名稱報錯的問題修復。

6.修復:發(fā)布到word文檔,如果數據包含特殊字符或本地圖片異常會導致發(fā)布失敗問題修復。

7.修復:拷貝任務時,任務備注未拷貝問題修復。

8.修復:標簽引用支持調用“列表頁”標簽。

9.修復:json提取時如果json對象的“鍵”是整型導致提取有誤。

10.優(yōu)化:網址解析替換html問題。

11.修復:get、post分頁問題處理。

12.修復:生成固定格式的數據中“系統(tǒng)時間”選中“06-16”生成時間格式“yyyy-MM”

13.新增:數據庫發(fā)布模塊支持replace into語句。

火車采集器V9.10版

1.二級代理重大修改并增加了商業(yè)代理支持

2.post獲取網址POST頁碼增加遞增數值

3.修復php和python插件不支持cookie的問題

4.當成功失敗標識都為空時認為是發(fā)布成功

5.調整發(fā)布和入庫模塊界面大小和操作bug

6.修復web發(fā)布不登錄時不發(fā)UA的問題

7.修復web發(fā)布測試時超時不起效的問題

8.修復Web發(fā)布時特殊情況下死循環(huán)問題

更多>> 軟件截圖

推薦應用

其他版本下載

    精品推薦 采集器

    采集器
    更多 (53個) >> 采集器 采集器一般指是采集網頁數據的智能軟件,數據采集系統(tǒng)以完全自主研發(fā)的分布式云計算平臺為核心,可以在很短的時間內,輕松從各種不同的網站或者網頁獲取大量的規(guī)范化數據,幫助任何需要從網頁獲取信息的客戶實現數據自動化采集,編輯,規(guī)范化,擺脫對人工搜索及收集數據的依賴,降低獲取信息的成本,提

    相關文章

      下載地址

      • 火車頭采集器免費版 v10.2 官方正式版

      查看所有評論>> 網友評論

      發(fā)表評論

      (您的評論需要經過審核才能顯示) 網友粉絲QQ群號:374962675

      查看所有 0條 評論>>

      更多>> 猜你喜歡