ET采集
3.4.5 官方版- 軟件大小:18.32 MB
- 更新日期:2019-06-20
- 軟件語言:簡體中文
- 軟件類別:下載工具
- 軟件授權(quán):免費(fèi)軟件
- 軟件官網(wǎng):未知
- 適用平臺:WinXP, Win7, Win8, Win10, WinAll
- 軟件廠商:
軟件介紹精品推薦人氣軟件相關(guān)文章網(wǎng)友評論下載地址
EditorTools是一款功能強(qiáng)大的自動采集軟件,該軟件主要的功能就是幫助用戶采集網(wǎng)絡(luò)中的資源,您可以使用它采集網(wǎng)站中的應(yīng)用、文章、圖片、視頻,并將采集的信息全部顯示在軟件中,支持一鍵下載采集的資源,他與一般的資源自動搜索軟件不一樣,在提供資源收集以外,還能自動連接到迅雷、快車、旋風(fēng)等鏈接文件,從網(wǎng)址中訪問下載站的資源,處理新浪、DZX等假地址圖片等,功能非常豐富,讓您徹底解放雙手,讓軟件幫助您搜索網(wǎng)頁上的各類資源,極大的節(jié)約了時間。
軟件功能
設(shè)置劫持特征代碼;
很多地區(qū)的電信寬帶用戶在上網(wǎng)時,會被強(qiáng)行在訪問信息中,用一些代碼替換訪問信息,讓用戶只能通過代碼中的框架查看原本要訪問的網(wǎng)頁,這通常用來顯示電信的廣告或進(jìn)行其他隱秘的動作,這種行為被稱為劫持瀏覽器;當(dāng)出現(xiàn)這種情況時,ET所采集的源碼也只能得到這些劫持代碼,而不是要采集的網(wǎng)頁源碼
設(shè)置UserAgent;
網(wǎng)站通過userAgent來判斷當(dāng)前用戶使用的是什么瀏覽器,并根據(jù)這個瀏覽器能夠支持的情況提供相應(yīng)的功能。瀏覽器在訪問一個網(wǎng)頁時通常會傳送一個識別字串告訴網(wǎng)站它是什么瀏覽器軟件,我們訪問的部分網(wǎng)站會對UserAgent進(jìn)行限制,我們可以在基本設(shè)置中修改UserAgent,也可以點(diǎn)擊'獲取本機(jī)UserAgent'按鈕獲得本機(jī)的IE默認(rèn)UserAgent
設(shè)置支持語言;
采集某些網(wǎng)頁時,網(wǎng)站可能會檢查支持的語言,用戶可以在此調(diào)整。
鎖定設(shè)置
此功能用于設(shè)置打開各個配置窗口時的密碼,當(dāng)設(shè)置了鎖定密碼后,使用 菜單-鎖定 功能,即可在用戶離開電腦后,防止他人訪問操作各項(xiàng)配置。
數(shù)據(jù)項(xiàng)設(shè)置
數(shù)據(jù)項(xiàng)用于定義從采集頁面獲取的各項(xiàng)信息,除[標(biāo)題]、[縮略圖]、[文章網(wǎng)址](即發(fā)布規(guī)則中的[文章網(wǎng)址])這三項(xiàng)數(shù)據(jù)可在列表設(shè)置頁獲取外
數(shù)據(jù)項(xiàng)屬性編輯區(qū)
[縮略圖]、[標(biāo)題]、[正文]、[文章網(wǎng)址]四個基本數(shù)據(jù)項(xiàng)的名稱不能修改。
其中[文章網(wǎng)址]數(shù)據(jù)項(xiàng)的取值為列表規(guī)則中文章網(wǎng)址合成的結(jié)果。
[標(biāo)題]數(shù)據(jù)項(xiàng)對應(yīng)列表分析中的[文章標(biāo)題]標(biāo)記,默認(rèn)取值為列表分析獲取的文章標(biāo)題。
[縮略圖]數(shù)據(jù)項(xiàng)對應(yīng)列表分析中的[縮略圖]標(biāo)記,默認(rèn)取值為列表分析獲取的縮略圖。
軟件特色
1、開機(jī)自動運(yùn)行ET:啟動電腦進(jìn)入系統(tǒng)后,自動運(yùn)行ET程序;
2、ET啟動后自動工作:ET啟動運(yùn)行后,自動執(zhí)行上一次使用ET時勾選的工作方案,只有啟用本項(xiàng),才會自動保存當(dāng)前勾選的工作方案;
3、啟動后最小化:ET啟動后,隱藏主窗口,只顯示托盤圖標(biāo);
4、忽略規(guī)則首尾空白:啟用本項(xiàng)后,采集配置中的各個規(guī)則將自動去除首尾的空格、回車、換行等空白字符,以避免用戶多輸入空格或換行導(dǎo)致規(guī)則分析失??;如果用戶需要利用空格或換行來確定規(guī)則的首尾邊界,則請取消勾選;
5、方案執(zhí)行間隔時間:在進(jìn)行自動工作、選擇多個方案時,一個方案的當(dāng)前列表采集完后,間隔多久更換采集下一個方案;
6、訪問網(wǎng)絡(luò)超時時間:設(shè)定在訪問網(wǎng)絡(luò)時超過多久無響應(yīng)則強(qiáng)制斷開;
7、訪問網(wǎng)絡(luò)重試次數(shù):設(shè)定在訪問網(wǎng)絡(luò)時遇到失敗的自動重試次數(shù),例如采集網(wǎng)頁、下載文件、ftp上傳等,這是2.2版中新增功能;
8、訪問網(wǎng)頁失敗后自動重啟ET:設(shè)定在訪問網(wǎng)頁失敗一定次數(shù)后自動重啟ET,以解決一些可能出現(xiàn)網(wǎng)絡(luò)阻塞導(dǎo)致無法繼續(xù)正常工作的問題;本功能僅在自動工作時生效,停止自動工作將重置失敗計數(shù),重試訪問不計數(shù);這是2.3.7版中新增功能;
使用方法
我們經(jīng)常需要把采集目標(biāo)的圖片、軟件、視頻等各種類型文件下載到自己的網(wǎng)站中,在ET中,無論文件類型是什么,設(shè)置方法都一樣。
第一步、設(shè)置數(shù)據(jù)項(xiàng)
在數(shù)據(jù)項(xiàng)屬性中有“包含文件”和“作為文件網(wǎng)址”兩個相關(guān)選項(xiàng),如圖所示:
如果文件是以HTML代碼的形式包含在數(shù)據(jù)項(xiàng)內(nèi)容里,那么就選擇“包含文件”,例如Img圖片代碼、A鏈接代碼、Embed媒體代碼;
如果數(shù)據(jù)項(xiàng)的內(nèi)容就是文件的網(wǎng)址,那么就選擇“作為文件網(wǎng)址”;
注意:正文數(shù)據(jù)項(xiàng)不能“作為文件網(wǎng)址”,如果要單獨(dú)采集文件網(wǎng)址,請新建數(shù)據(jù)項(xiàng)采集。
第二步、設(shè)置文件下載
首先勾選采集配置-文件下載中的“啟用下載”,并做相關(guān)設(shè)置告訴ET哪些網(wǎng)址是需要下載的文件,如圖:
第三步、參數(shù)設(shè)置
如果我們使用的不是正文數(shù)據(jù)項(xiàng)來采集文件,那么這個數(shù)據(jù)項(xiàng)必須在發(fā)布配置-發(fā)布項(xiàng)中被使用,否則它不會被采集。
這里我們假設(shè)該數(shù)據(jù)項(xiàng)名稱為“文件網(wǎng)址”來舉例說明。
1、發(fā)布的網(wǎng)站有該數(shù)據(jù)項(xiàng)對應(yīng)的參數(shù)時,設(shè)置如圖:
2、發(fā)布的網(wǎng)站沒有該數(shù)據(jù)項(xiàng)對應(yīng)的參數(shù)時,我們要將文件網(wǎng)址合并到正文里發(fā)布,設(shè)置如圖:
第四步、設(shè)置文件顯示
發(fā)布配置-基本設(shè)置中可以設(shè)置文件的子目錄和顯示URL,具體參數(shù)請參考接口說明書,如圖:
第五步、設(shè)置文件上傳
如果ET和網(wǎng)站不在同一電腦中,那么需要設(shè)置發(fā)布配置-文件上傳將下載的文件上傳到網(wǎng)站中;如果ET和網(wǎng)站在同一電腦中,可以跳過此步,如圖:
第六步、設(shè)置本地下載位置
通常我們不用設(shè)置文件下載到本地的什么位置,但如果ET和網(wǎng)站在同一電腦上運(yùn)行時,我們可以直接下載文件到網(wǎng)站中而不需要設(shè)置文件上傳,這時需要指定文件的下載位置,該設(shè)置在制訂方案中,如圖:
主要優(yōu)勢
1、工作記錄:
該欄記錄ET的每一步工作過程及狀態(tài),包括目錄采集和文章處理兩大部分,我們通過工作記錄可以了解該次采集執(zhí)行是否正確完成,或是出現(xiàn)了什么問題;當(dāng)出現(xiàn)問題時,可以根據(jù)提示、結(jié)合信息欄的其他反饋內(nèi)容,用戶可以迅速準(zhǔn)確地找到故障原因并予解決。
2、采集源碼:
此欄顯示執(zhí)行過程中所采集的文章列表頁、文章頁面、文章分頁等的網(wǎng)頁源代碼,利用此欄源代碼,可以方便的進(jìn)行規(guī)則測試、提供規(guī)則定制依據(jù)。
注意,某些網(wǎng)站會根據(jù)不同來訪瀏覽器而顯示不同的源代碼,所以,ET的采集規(guī)則定制時,應(yīng)以此欄的源代碼為準(zhǔn),例如采集規(guī)則范例中的‘SMF 1.1.5‘,其網(wǎng)站通過IE訪問和ET采集獲取到的源碼就有區(qū)別。
3、分析數(shù)據(jù):
此欄顯示文章處理過程中的各個數(shù)據(jù)項(xiàng)信息,從分析到的原始代碼,到整理后的代碼,再到經(jīng)過URL修正后的代碼,用戶通過查看此欄,可以了解設(shè)置的數(shù)據(jù)項(xiàng)分析規(guī)則是否準(zhǔn)確、整理組規(guī)則是否完善、最終的信息是否符合自己的要求。
例如:當(dāng)工作記錄欄提示錯誤‘正文字?jǐn)?shù)大于或小于發(fā)布設(shè)置‘時,我們可以查看本欄的‘正文‘?dāng)?shù)據(jù)項(xiàng),了解具體是大于還是小于發(fā)布設(shè)置,原因是正常還是因?yàn)檎斫M設(shè)置不當(dāng),從而調(diào)整各個設(shè)置。
4、發(fā)送代碼:
此欄顯示ET向發(fā)布網(wǎng)站發(fā)送的數(shù)據(jù),包括文章檢查部分和文章發(fā)布部分;
用戶可以通過此欄信息了解通過一系列分析、整理操作,最終向發(fā)布網(wǎng)站提交的數(shù)據(jù),用以檢查自己的采集規(guī)則數(shù)據(jù)項(xiàng)、發(fā)布規(guī)則的參數(shù)設(shè)置等是否正確、完整。
5、返回信息:
此欄顯示ET向發(fā)布網(wǎng)站發(fā)送數(shù)據(jù)后發(fā)布網(wǎng)站的反饋,包括文章檢查反饋和文章發(fā)布反饋;
通過查看此欄,我們可以清晰的了解當(dāng)采集過程出現(xiàn)問題時的大部分原因。
一些接口在返回錯誤信息時,信息可能是HTML代碼,不熟悉HTML代碼的用戶閱讀比較吃力,點(diǎn)擊WEB瀏覽按鈕,可以在操作系統(tǒng)默認(rèn)瀏覽器中方便的查看它們
使用說明
提示庫未注冊或無法打開MDB文件的解決辦法
運(yùn)行ET時出現(xiàn)“庫沒有注冊”的錯誤提示,通常是因?yàn)槟挠嬎銠C(jī)系統(tǒng)有重要DLL文件注冊丟失,需要重新注冊。
解決方法如下:
一、
在 開始菜單-運(yùn)行 中 依次輸入并運(yùn)行以下命令:
regsvr32 scrrun.dll
regsvr32 jscript.dll
regsvr32 vbscript.dll
二、
若使用上步后,仍有問題,因?yàn)闊o法判斷具體是哪一個文件未注冊,所以可以將system32下所有DLL文件重新注冊一遍,操作如下:
在 開始菜單-運(yùn)行 中輸入命令 cmd,然后在CMD窗口的命令提示符下輸入下列命令后運(yùn)行即可。
for %1 in (%windir%system32*.dll) do regsvr32.exe /s %1
注:
請在運(yùn)行此命令的時候關(guān)閉其他程序。尤其是殺毒軟件的監(jiān)控。如果內(nèi)存比較大。速度將很快!
在CMD窗口中粘貼的技巧:右擊CMD窗口在彈出的菜單中選擇編輯 - 粘貼。剛才復(fù)制的命令內(nèi)容就已經(jīng)粘貼到命令行中了。直接回車就開始運(yùn)行命令了!
三、
若以上2個方法都不能解決,那么您很可能是mdac被損壞,請下載mdac 2.8以上版本重新安裝;
如果是XP系統(tǒng)修復(fù)安裝,方法是在 c:windowsinf 下(c:windows是一般系統(tǒng)目錄,操作時按您實(shí)際的系統(tǒng)目錄)找出mdac.inf 然后點(diǎn)右鍵->安裝。在彈出提示路徑選取 c:windowsservicepackfilesi386,再提示需要XP CD的時候放入cd就可以了。
三、非簡體中文Windows操作系統(tǒng)下ET不能正常顯示界面的解決辦法
ET是專為中國用戶提供服務(wù)的軟件,目前僅發(fā)布了簡體中文版本,支持在簡體中文windows系列操作系統(tǒng)上使用;
當(dāng)在其他語言的windows操作系統(tǒng)上運(yùn)行時,可能出現(xiàn)軟件界面上的文字顯示為問號亂碼的問題,這是因?yàn)樵摬僮飨到y(tǒng)缺少ET所使用的微軟標(biāo)準(zhǔn)簡體宋體字庫文件,這時請安裝該字庫即可解決問題,該字庫文件名 simsun.ttc ,請從微軟簡體中文windows安裝光盤獲??;
四、UserAgent的說明及在ET中的設(shè)置
系統(tǒng)環(huán)境
1、EditorTools 適用于WINDOWS系列簡體中文版操作系統(tǒng);
包括 windows xp簡體中文版、windows 2000簡體中文版、windows 2003簡體中文版、windows vista簡體中文版;
對于其他語言環(huán)境的windows系統(tǒng),部分可以使用,用戶可自行嘗試,開發(fā)方不提供對應(yīng)技術(shù)支持。
2、EditorTools 需要計算機(jī)上裝有如下軟件:
mdac 2.8或以上版本 (最新ADO數(shù)據(jù)庫驅(qū)動)
已注冊的scrrun.dll (用于閱讀和編寫腳本和文本文件)
已注冊的vbscript.dll (VBScript腳本相關(guān)支持文件)
以上軟件均為windows系統(tǒng)內(nèi)置的免費(fèi)軟件,但可能在使用中被損壞或禁用。
常見問題
1、什么是UserAgent?
是指網(wǎng)站網(wǎng)頁通過userAgent來判斷當(dāng)前用戶使用的是什么瀏覽器,并根據(jù)這個瀏覽器能夠支持的情況提供相應(yīng)的功能。瀏覽器在訪問一個網(wǎng)頁時通常會傳送一個識別字串告訴網(wǎng)站它是什么瀏覽器軟件。很多統(tǒng)計網(wǎng)站使用它來了解有多少用戶使用什么版本的瀏覽器。
2、UserAgent在ET中有什么用?
某些網(wǎng)站會對來訪瀏覽器進(jìn)行限制,諸如防止搜索引擎爬蟲、廣告群發(fā)、機(jī)器人軟件、或者其他非法訪問等各種原因,導(dǎo)致采集失敗,此時,需要對UserAgent進(jìn)行設(shè)置,可以用識別字串冒充其他瀏覽器,例如:
QQ的USERAGENT:
Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)
FIREFOX3的USERAGENT:
Mozilla/5.0 (Windows; U; Windows NT 5.2; zh-CN; rv:1.9) Gecko/2008052906 Firefox/3.0
其他常用USERAGENT:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.590; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
3、設(shè)置Useragent
在ET中設(shè)置UserAgent請參見 使用篇-操作第一步-設(shè)置UserAgent ;
五、DEDE發(fā)布提示“首頁文件路徑錯誤,無法創(chuàng)建文件”的解決辦法
方法一、修改您的首頁生成HTML路徑,注意相對路徑的區(qū)別;
方法二、 改接口,找到dede接口文件etpost.php中以下代碼:
if($cfg_makeindex=='是'){
$pv = new PartView();
$row = $pv->dsql->GetOne("Select * From #@__homepageset");
$templet = str_replace("{style}",$cfg_df_style,$row['templet']);
//$homeFile = dirname(__FILE__)."/".$row['position'];
$homeFile = dirname(__FILE__)."/../".$row['position'];
$homeFile = str_replace("","/",$homeFile);
$homeFile = str_replace("http://","/",$homeFile);
$fp = fopen($homeFile,"w") or die("首頁文件路徑錯誤,無法創(chuàng)建文件");
fclose($fp);
$pv->SetTemplet($cfg_basedir.$cfg_templets_dir."/".$templet);
$pv->SaveToHtml($homeFile);
$pv->Close();
}
$arc->Close();
return $reurl;
把代碼
$homeFile = dirname(__FILE__)."/../".$row['position'];
替換為
$homeFile = dirname(__FILE__)."/".$row['position'];
即可。
六、如何獲得網(wǎng)站完整的Cookies
一些網(wǎng)站使用了限制訪問Cookies的技術(shù),導(dǎo)致在ET中使用 登錄獲取Cookies 時,無法獲取到完整的Cookies,因?yàn)?登錄采集 或 模擬發(fā)布 不能成功。
當(dāng)我們遇到此類問題時,可以使用第三方抓包軟件(如Http Analyzer)來獲取完整Cookies,然后拷貝到“發(fā)布配置-模擬發(fā)布-發(fā)布Cookies” 或 “采集配置-登錄設(shè)置-當(dāng)前cookies” 欄中,如下圖:
如果是Phpwind論壇一類的網(wǎng)站,則還需要獲得與Cookies匹配的Useragent,將復(fù)制的Useragent粘貼到系統(tǒng)菜單-基本設(shè)置窗中的Useragent欄即可,如下圖:
更新日志
1、修正:方案每日執(zhí)行次數(shù)不準(zhǔn)確的問題。
2、優(yōu)化:數(shù)據(jù)提取準(zhǔn)確性、兼容性提高。
3、優(yōu)化:SFTP兼容性提高。
下載地址
-
ET采集 3.4.5 官方版
其他版本下載
- 查看詳情Photon(磁力鏈下載工具) 0.4.2 官方版37.91 MB簡體中文19-09-27
- 查看詳情速盤(百度網(wǎng)盤搜索下載神器) 2.3.7 免費(fèi)版19.0 MB簡體中文19-11-05
- 查看詳情teleport ultra中文簡體破解版(整站下載器) 1.65 無限制注冊版1013 KB簡體中文17-04-28
- 查看詳情pan download 52破解(百度網(wǎng)盤不限速工具) 2017 v5.6.0 無限加速版420 KB簡體中文17-06-22
- 查看詳情嗶哩嗶哩唧唧客戶端下載(bilibili唧唧) 1.224.0 pc版703 KB簡體中文20-05-14
- 查看詳情Usbeam Hosts Editor(附使用方法) 3.50 免費(fèi)版1.49 MB簡體中文20-03-11
- 查看詳情fdm下載器(多功能的下載和管理工具FDM) 5.1.32 最新免費(fèi)版48.7 MB簡體中文17-08-17
- 查看詳情Pan Download 2.1.3 綠色免費(fèi)版5.07 MB簡體中文19-08-23
- 查看詳情單頁模板扒手(整站下載工具) 4.6 最新版1013 KB簡體中文17-02-18
- 查看詳情唧唧down電腦客戶端(b站視頻下載工具) 1.203 官方版14.1 MB簡體中文18-01-22
人氣軟件
百度云無限試用加速下載14.43 MB
/簡體中文PDown下載器(第三方百度網(wǎng)盤)10.9 MB
/簡體中文迅雷104.28 MB
/簡體中文唧唧down電腦客戶端(b站視頻下載工具)14.1 MB
/簡體中文文件傳輸助手10.5 MB
/簡體中文SpeedkoalaBD云加速53.3 MB
/簡體中文迅雷9破解版無限期高速通道加速40.44 MB
/簡體中文ae particular插件(附安裝使用教程)16 MB
/多國語言廣聯(lián)達(dá)g工作臺gws(廣聯(lián)達(dá)g+)下載55.96 MB
/簡體中文Internet Download Manager(IDM)下載7.87 MB
/簡體中文
相關(guān)文章
查看所有評論>>網(wǎng)友評論共0條
精彩評論
- 最新評論