免费黄色视频在线观看不卡无码国产一区二区三区_亚洲中文字幕无码中文字 _亚洲 国产专区 校园 欧美_国内自拍真实伦在线视频_国产精品成人观看视频免费

河?xùn)|軟件園:綠色免費(fèi)的軟件下載站! 最新軟件|軟件分類|軟件專題|軟件發(fā)布

所在位置:首頁 > 網(wǎng)絡(luò)軟件 > 下載工具 > ET采集 3.4.5 官方版

ET采集

 3.4.5 官方版

前往專題

  • 軟件大小:18.32 MB
  • 更新日期:2019-06-20
  • 軟件語言:簡體中文
  • 軟件類別:下載工具
  • 軟件授權(quán):免費(fèi)軟件
  • 軟件官網(wǎng):
  • 適用平臺:WinXP, Win7, Win8, Win10, WinAll
  • 軟件廠商:

8.9
軟件評分

本地下載文件大?。?8.32 MB 高速下載需下載高速下載器,提速50%

軟件介紹精品推薦人氣軟件相關(guān)文章網(wǎng)友評論下載地址

為您推薦:下載工具數(shù)據(jù)采集軟件

  EditorTools是一款功能強(qiáng)大的自動采集軟件,該軟件主要的功能就是幫助用戶采集網(wǎng)絡(luò)中的資源,您可以使用它采集網(wǎng)站中的應(yīng)用、文章、圖片、視頻,并將采集的信息全部顯示在軟件中,支持一鍵下載采集的資源,他與一般的資源自動搜索軟件不一樣,在提供資源收集以外,還能自動連接到迅雷、快車、旋風(fēng)等鏈接文件,從網(wǎng)址中訪問下載站的資源,處理新浪、DZX等假地址圖片等,功能非常豐富,讓您徹底解放雙手,讓軟件幫助您搜索網(wǎng)頁上的各類資源,極大的節(jié)約了時間。

ET采集 3.4.5 官方版

軟件功能

  設(shè)置劫持特征代碼;

  很多地區(qū)的電信寬帶用戶在上網(wǎng)時,會被強(qiáng)行在訪問信息中,用一些代碼替換訪問信息,讓用戶只能通過代碼中的框架查看原本要訪問的網(wǎng)頁,這通常用來顯示電信的廣告或進(jìn)行其他隱秘的動作,這種行為被稱為劫持瀏覽器;當(dāng)出現(xiàn)這種情況時,ET所采集的源碼也只能得到這些劫持代碼,而不是要采集的網(wǎng)頁源碼

  設(shè)置UserAgent;

  網(wǎng)站通過userAgent來判斷當(dāng)前用戶使用的是什么瀏覽器,并根據(jù)這個瀏覽器能夠支持的情況提供相應(yīng)的功能。瀏覽器在訪問一個網(wǎng)頁時通常會傳送一個識別字串告訴網(wǎng)站它是什么瀏覽器軟件,我們訪問的部分網(wǎng)站會對UserAgent進(jìn)行限制,我們可以在基本設(shè)置中修改UserAgent,也可以點(diǎn)擊'獲取本機(jī)UserAgent'按鈕獲得本機(jī)的IE默認(rèn)UserAgent

  設(shè)置支持語言;

  采集某些網(wǎng)頁時,網(wǎng)站可能會檢查支持的語言,用戶可以在此調(diào)整。

  鎖定設(shè)置

  此功能用于設(shè)置打開各個配置窗口時的密碼,當(dāng)設(shè)置了鎖定密碼后,使用 菜單-鎖定 功能,即可在用戶離開電腦后,防止他人訪問操作各項(xiàng)配置。

  數(shù)據(jù)項(xiàng)設(shè)置

  數(shù)據(jù)項(xiàng)用于定義從采集頁面獲取的各項(xiàng)信息,除[標(biāo)題]、[縮略圖]、[文章網(wǎng)址](即發(fā)布規(guī)則中的[文章網(wǎng)址])這三項(xiàng)數(shù)據(jù)可在列表設(shè)置頁獲取外

  數(shù)據(jù)項(xiàng)屬性編輯區(qū)

  [縮略圖]、[標(biāo)題]、[正文]、[文章網(wǎng)址]四個基本數(shù)據(jù)項(xiàng)的名稱不能修改。

  其中[文章網(wǎng)址]數(shù)據(jù)項(xiàng)的取值為列表規(guī)則中文章網(wǎng)址合成的結(jié)果。

  [標(biāo)題]數(shù)據(jù)項(xiàng)對應(yīng)列表分析中的[文章標(biāo)題]標(biāo)記,默認(rèn)取值為列表分析獲取的文章標(biāo)題。

  [縮略圖]數(shù)據(jù)項(xiàng)對應(yīng)列表分析中的[縮略圖]標(biāo)記,默認(rèn)取值為列表分析獲取的縮略圖。

軟件特色

  1、開機(jī)自動運(yùn)行ET:啟動電腦進(jìn)入系統(tǒng)后,自動運(yùn)行ET程序;

  2、ET啟動后自動工作:ET啟動運(yùn)行后,自動執(zhí)行上一次使用ET時勾選的工作方案,只有啟用本項(xiàng),才會自動保存當(dāng)前勾選的工作方案;

  3、啟動后最小化:ET啟動后,隱藏主窗口,只顯示托盤圖標(biāo);

  4、忽略規(guī)則首尾空白:啟用本項(xiàng)后,采集配置中的各個規(guī)則將自動去除首尾的空格、回車、換行等空白字符,以避免用戶多輸入空格或換行導(dǎo)致規(guī)則分析失??;如果用戶需要利用空格或換行來確定規(guī)則的首尾邊界,則請取消勾選;

  5、方案執(zhí)行間隔時間:在進(jìn)行自動工作、選擇多個方案時,一個方案的當(dāng)前列表采集完后,間隔多久更換采集下一個方案;

  6、訪問網(wǎng)絡(luò)超時時間:設(shè)定在訪問網(wǎng)絡(luò)時超過多久無響應(yīng)則強(qiáng)制斷開;

  7、訪問網(wǎng)絡(luò)重試次數(shù):設(shè)定在訪問網(wǎng)絡(luò)時遇到失敗的自動重試次數(shù),例如采集網(wǎng)頁、下載文件、ftp上傳等,這是2.2版中新增功能;

  8、訪問網(wǎng)頁失敗后自動重啟ET:設(shè)定在訪問網(wǎng)頁失敗一定次數(shù)后自動重啟ET,以解決一些可能出現(xiàn)網(wǎng)絡(luò)阻塞導(dǎo)致無法繼續(xù)正常工作的問題;本功能僅在自動工作時生效,停止自動工作將重置失敗計數(shù),重試訪問不計數(shù);這是2.3.7版中新增功能;

使用方法

  我們經(jīng)常需要把采集目標(biāo)的圖片、軟件、視頻等各種類型文件下載到自己的網(wǎng)站中,在ET中,無論文件類型是什么,設(shè)置方法都一樣。

  第一步、設(shè)置數(shù)據(jù)項(xiàng)

  在數(shù)據(jù)項(xiàng)屬性中有“包含文件”和“作為文件網(wǎng)址”兩個相關(guān)選項(xiàng),如圖所示:

ET采集 3.4.5 官方版

  如果文件是以HTML代碼的形式包含在數(shù)據(jù)項(xiàng)內(nèi)容里,那么就選擇“包含文件”,例如Img圖片代碼、A鏈接代碼、Embed媒體代碼;

  如果數(shù)據(jù)項(xiàng)的內(nèi)容就是文件的網(wǎng)址,那么就選擇“作為文件網(wǎng)址”;

  注意:正文數(shù)據(jù)項(xiàng)不能“作為文件網(wǎng)址”,如果要單獨(dú)采集文件網(wǎng)址,請新建數(shù)據(jù)項(xiàng)采集。

  第二步、設(shè)置文件下載

  首先勾選采集配置-文件下載中的“啟用下載”,并做相關(guān)設(shè)置告訴ET哪些網(wǎng)址是需要下載的文件,如圖:

ET采集 3.4.5 官方版

  第三步、參數(shù)設(shè)置

  如果我們使用的不是正文數(shù)據(jù)項(xiàng)來采集文件,那么這個數(shù)據(jù)項(xiàng)必須在發(fā)布配置-發(fā)布項(xiàng)中被使用,否則它不會被采集。

  這里我們假設(shè)該數(shù)據(jù)項(xiàng)名稱為“文件網(wǎng)址”來舉例說明。

  1、發(fā)布的網(wǎng)站有該數(shù)據(jù)項(xiàng)對應(yīng)的參數(shù)時,設(shè)置如圖:

ET采集 3.4.5 官方版

  2、發(fā)布的網(wǎng)站沒有該數(shù)據(jù)項(xiàng)對應(yīng)的參數(shù)時,我們要將文件網(wǎng)址合并到正文里發(fā)布,設(shè)置如圖:

ET采集 3.4.5 官方版

  第四步、設(shè)置文件顯示

  發(fā)布配置-基本設(shè)置中可以設(shè)置文件的子目錄和顯示URL,具體參數(shù)請參考接口說明書,如圖:

ET采集 3.4.5 官方版

  第五步、設(shè)置文件上傳

  如果ET和網(wǎng)站不在同一電腦中,那么需要設(shè)置發(fā)布配置-文件上傳將下載的文件上傳到網(wǎng)站中;如果ET和網(wǎng)站在同一電腦中,可以跳過此步,如圖:

ET采集 3.4.5 官方版

  第六步、設(shè)置本地下載位置

  通常我們不用設(shè)置文件下載到本地的什么位置,但如果ET和網(wǎng)站在同一電腦上運(yùn)行時,我們可以直接下載文件到網(wǎng)站中而不需要設(shè)置文件上傳,這時需要指定文件的下載位置,該設(shè)置在制訂方案中,如圖:

ET采集 3.4.5 官方版

主要優(yōu)勢

  1、工作記錄:

  該欄記錄ET的每一步工作過程及狀態(tài),包括目錄采集和文章處理兩大部分,我們通過工作記錄可以了解該次采集執(zhí)行是否正確完成,或是出現(xiàn)了什么問題;當(dāng)出現(xiàn)問題時,可以根據(jù)提示、結(jié)合信息欄的其他反饋內(nèi)容,用戶可以迅速準(zhǔn)確地找到故障原因并予解決。

  2、采集源碼:

  此欄顯示執(zhí)行過程中所采集的文章列表頁、文章頁面、文章分頁等的網(wǎng)頁源代碼,利用此欄源代碼,可以方便的進(jìn)行規(guī)則測試、提供規(guī)則定制依據(jù)。

  注意,某些網(wǎng)站會根據(jù)不同來訪瀏覽器而顯示不同的源代碼,所以,ET的采集規(guī)則定制時,應(yīng)以此欄的源代碼為準(zhǔn),例如采集規(guī)則范例中的‘SMF 1.1.5‘,其網(wǎng)站通過IE訪問和ET采集獲取到的源碼就有區(qū)別。

  3、分析數(shù)據(jù):

  此欄顯示文章處理過程中的各個數(shù)據(jù)項(xiàng)信息,從分析到的原始代碼,到整理后的代碼,再到經(jīng)過URL修正后的代碼,用戶通過查看此欄,可以了解設(shè)置的數(shù)據(jù)項(xiàng)分析規(guī)則是否準(zhǔn)確、整理組規(guī)則是否完善、最終的信息是否符合自己的要求。

  例如:當(dāng)工作記錄欄提示錯誤‘正文字?jǐn)?shù)大于或小于發(fā)布設(shè)置‘時,我們可以查看本欄的‘正文‘?dāng)?shù)據(jù)項(xiàng),了解具體是大于還是小于發(fā)布設(shè)置,原因是正常還是因?yàn)檎斫M設(shè)置不當(dāng),從而調(diào)整各個設(shè)置。

  4、發(fā)送代碼:

  此欄顯示ET向發(fā)布網(wǎng)站發(fā)送的數(shù)據(jù),包括文章檢查部分和文章發(fā)布部分;

  用戶可以通過此欄信息了解通過一系列分析、整理操作,最終向發(fā)布網(wǎng)站提交的數(shù)據(jù),用以檢查自己的采集規(guī)則數(shù)據(jù)項(xiàng)、發(fā)布規(guī)則的參數(shù)設(shè)置等是否正確、完整。

  5、返回信息:

  此欄顯示ET向發(fā)布網(wǎng)站發(fā)送數(shù)據(jù)后發(fā)布網(wǎng)站的反饋,包括文章檢查反饋和文章發(fā)布反饋;

  通過查看此欄,我們可以清晰的了解當(dāng)采集過程出現(xiàn)問題時的大部分原因。

  一些接口在返回錯誤信息時,信息可能是HTML代碼,不熟悉HTML代碼的用戶閱讀比較吃力,點(diǎn)擊WEB瀏覽按鈕,可以在操作系統(tǒng)默認(rèn)瀏覽器中方便的查看它們

使用說明

  提示庫未注冊或無法打開MDB文件的解決辦法

  運(yùn)行ET時出現(xiàn)“庫沒有注冊”的錯誤提示,通常是因?yàn)槟挠嬎銠C(jī)系統(tǒng)有重要DLL文件注冊丟失,需要重新注冊。

  解決方法如下:

  一、

  在 開始菜單-運(yùn)行 中 依次輸入并運(yùn)行以下命令:

  regsvr32 scrrun.dll

  regsvr32 jscript.dll

  regsvr32 vbscript.dll

  二、

  若使用上步后,仍有問題,因?yàn)闊o法判斷具體是哪一個文件未注冊,所以可以將system32下所有DLL文件重新注冊一遍,操作如下:

  在 開始菜單-運(yùn)行 中輸入命令 cmd,然后在CMD窗口的命令提示符下輸入下列命令后運(yùn)行即可。

  for %1 in (%windir%system32*.dll) do regsvr32.exe /s %1

  注:

  請在運(yùn)行此命令的時候關(guān)閉其他程序。尤其是殺毒軟件的監(jiān)控。如果內(nèi)存比較大。速度將很快!

  在CMD窗口中粘貼的技巧:右擊CMD窗口在彈出的菜單中選擇編輯 - 粘貼。剛才復(fù)制的命令內(nèi)容就已經(jīng)粘貼到命令行中了。直接回車就開始運(yùn)行命令了!

  三、

  若以上2個方法都不能解決,那么您很可能是mdac被損壞,請下載mdac 2.8以上版本重新安裝;

  如果是XP系統(tǒng)修復(fù)安裝,方法是在 c:windowsinf 下(c:windows是一般系統(tǒng)目錄,操作時按您實(shí)際的系統(tǒng)目錄)找出mdac.inf 然后點(diǎn)右鍵->安裝。在彈出提示路徑選取 c:windowsservicepackfilesi386,再提示需要XP CD的時候放入cd就可以了。

  三、非簡體中文Windows操作系統(tǒng)下ET不能正常顯示界面的解決辦法

  ET是專為中國用戶提供服務(wù)的軟件,目前僅發(fā)布了簡體中文版本,支持在簡體中文windows系列操作系統(tǒng)上使用;

  當(dāng)在其他語言的windows操作系統(tǒng)上運(yùn)行時,可能出現(xiàn)軟件界面上的文字顯示為問號亂碼的問題,這是因?yàn)樵摬僮飨到y(tǒng)缺少ET所使用的微軟標(biāo)準(zhǔn)簡體宋體字庫文件,這時請安裝該字庫即可解決問題,該字庫文件名 simsun.ttc ,請從微軟簡體中文windows安裝光盤獲??;

  四、UserAgent的說明及在ET中的設(shè)置

系統(tǒng)環(huán)境

  1、EditorTools 適用于WINDOWS系列簡體中文版操作系統(tǒng);

  包括 windows xp簡體中文版、windows 2000簡體中文版、windows 2003簡體中文版、windows vista簡體中文版;

  對于其他語言環(huán)境的windows系統(tǒng),部分可以使用,用戶可自行嘗試,開發(fā)方不提供對應(yīng)技術(shù)支持。

  2、EditorTools 需要計算機(jī)上裝有如下軟件:

  mdac 2.8或以上版本 (最新ADO數(shù)據(jù)庫驅(qū)動)

  已注冊的scrrun.dll (用于閱讀和編寫腳本和文本文件)

  已注冊的vbscript.dll (VBScript腳本相關(guān)支持文件)

  以上軟件均為windows系統(tǒng)內(nèi)置的免費(fèi)軟件,但可能在使用中被損壞或禁用。

常見問題

  1、什么是UserAgent?

  是指網(wǎng)站網(wǎng)頁通過userAgent來判斷當(dāng)前用戶使用的是什么瀏覽器,并根據(jù)這個瀏覽器能夠支持的情況提供相應(yīng)的功能。瀏覽器在訪問一個網(wǎng)頁時通常會傳送一個識別字串告訴網(wǎng)站它是什么瀏覽器軟件。很多統(tǒng)計網(wǎng)站使用它來了解有多少用戶使用什么版本的瀏覽器。

  2、UserAgent在ET中有什么用?

  某些網(wǎng)站會對來訪瀏覽器進(jìn)行限制,諸如防止搜索引擎爬蟲、廣告群發(fā)、機(jī)器人軟件、或者其他非法訪問等各種原因,導(dǎo)致采集失敗,此時,需要對UserAgent進(jìn)行設(shè)置,可以用識別字串冒充其他瀏覽器,例如:

  QQ的USERAGENT:

  Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)

  FIREFOX3的USERAGENT:

  Mozilla/5.0 (Windows; U; Windows NT 5.2; zh-CN; rv:1.9) Gecko/2008052906 Firefox/3.0

  其他常用USERAGENT:

  Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)

  Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.590; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)

  3、設(shè)置Useragent

  在ET中設(shè)置UserAgent請參見 使用篇-操作第一步-設(shè)置UserAgent ;

  五、DEDE發(fā)布提示“首頁文件路徑錯誤,無法創(chuàng)建文件”的解決辦法

  方法一、修改您的首頁生成HTML路徑,注意相對路徑的區(qū)別;

  方法二、 改接口,找到dede接口文件etpost.php中以下代碼:

  if($cfg_makeindex=='是'){

  $pv = new PartView();

  $row = $pv->dsql->GetOne("Select * From #@__homepageset");

  $templet = str_replace("{style}",$cfg_df_style,$row['templet']);

  //$homeFile = dirname(__FILE__)."/".$row['position'];

  $homeFile = dirname(__FILE__)."/../".$row['position'];

  $homeFile = str_replace("","/",$homeFile);

  $homeFile = str_replace("http://","/",$homeFile);

  $fp = fopen($homeFile,"w") or die("首頁文件路徑錯誤,無法創(chuàng)建文件");

  fclose($fp);

  $pv->SetTemplet($cfg_basedir.$cfg_templets_dir."/".$templet);

  $pv->SaveToHtml($homeFile);

  $pv->Close();

  }

  $arc->Close();

  return $reurl;

  把代碼

  $homeFile = dirname(__FILE__)."/../".$row['position'];

  替換為

  $homeFile = dirname(__FILE__)."/".$row['position'];

  即可。

  六、如何獲得網(wǎng)站完整的Cookies

  一些網(wǎng)站使用了限制訪問Cookies的技術(shù),導(dǎo)致在ET中使用 登錄獲取Cookies 時,無法獲取到完整的Cookies,因?yàn)?登錄采集 或 模擬發(fā)布 不能成功。

  當(dāng)我們遇到此類問題時,可以使用第三方抓包軟件(如Http Analyzer)來獲取完整Cookies,然后拷貝到“發(fā)布配置-模擬發(fā)布-發(fā)布Cookies” 或 “采集配置-登錄設(shè)置-當(dāng)前cookies” 欄中,如下圖:

ET采集 3.4.5 官方版

  如果是Phpwind論壇一類的網(wǎng)站,則還需要獲得與Cookies匹配的Useragent,將復(fù)制的Useragent粘貼到系統(tǒng)菜單-基本設(shè)置窗中的Useragent欄即可,如下圖:

ET采集 3.4.5 官方版

更新日志

  1、修正:方案每日執(zhí)行次數(shù)不準(zhǔn)確的問題。

  2、優(yōu)化:數(shù)據(jù)提取準(zhǔn)確性、兼容性提高。

  3、優(yōu)化:SFTP兼容性提高。

下載地址

人氣軟件

查看所有評論>>網(wǎng)友評論0

發(fā)表評論

您的評論需要經(jīng)過審核才能顯示

精彩評論

最新評論

蓋樓回復(fù)X

(您的評論需要經(jīng)過審核才能顯示)