




已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
制作游戲輔助教材推薦:抓取網(wǎng)頁(yè)指定內(nèi)容(資料),獲取網(wǎng)頁(yè)里的圖片來(lái)源:按鍵學(xué)院 【按鍵精靈】 最近有遇到同學(xué)反饋,網(wǎng)頁(yè)里的那些沒(méi)有特征值的文本元素不知道怎么獲取。以及,不知道怎么獲取保存網(wǎng)頁(yè)里出現(xiàn)的圖片。獲取網(wǎng)頁(yè)指定文字:目前按鍵支持的元素特征值有這些: frame(框架) 、id(唯一標(biāo)識(shí)) 、tag(標(biāo)簽) 、type(類(lèi)型)、txt(文本) 、value(特征) 、index(索引) 、name(名字) 擁有這些特征值的元素才能直接使用HtmlGet命令來(lái)獲取元素文本信息。命令名稱(chēng):HtmlGet 獲取網(wǎng)頁(yè)元素的信息命令功能: 獲取網(wǎng)頁(yè)元素指定屬性的信息命令參數(shù): 參數(shù)1:字符串型,網(wǎng)頁(yè)元素屬性類(lèi)型:text、html、 outerHtml、value、src、href、 offset 參數(shù)2:字符串型,網(wǎng)頁(yè)元素特征字符串 例如下面的例子,按鍵精靈論壇搜索框,它有type、name、id這三個(gè)特征值。 我們?nèi)∷黫d特征值帶入到HtmlGet 命令來(lái)查看下結(jié)果:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)/要提取信息的網(wǎng)站Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt成功獲取到了搜索框的value值。我們現(xiàn)在想要取下面紅色區(qū)域塊的帖子標(biāo)題,想要把一個(gè)頁(yè)面中的這些帖子名稱(chēng)都取出來(lái)。該怎么辦? 這些文字,都沒(méi)有特征值的。我們不能使用特征值的方式去找他們。 我們可以這樣獲取到整個(gè)網(wǎng)頁(yè)的文本之后,去找我們要取的標(biāo)題,前后不變的字符。 大家會(huì)發(fā)現(xiàn),這個(gè)頁(yè)面中,帖子標(biāo)題前后不便的字符是:“ 和 “果果?!?那我們就將”“字符前面的文本都過(guò)濾掉,“果果。“后面的文本也過(guò)率掉,這樣就能得到我們所需要的文本。首先,我們需要復(fù)習(xí)下幾個(gè)函數(shù):InStr函數(shù)描述start可選的。規(guī)定每次搜索的起始位置。默認(rèn)是搜索起始位置是第一個(gè)字符。如果已規(guī)定 compare 參數(shù),則必須有此參數(shù)。string1必需的。需要被搜索的字符串。string2必需的。需搜索的字符串。compare必需的。規(guī)定要使用的字符串比較類(lèi)型。默認(rèn)是 0 。可采用下列值: 0= vbBinaryCompare - 執(zhí)行二進(jìn)制比較。 1 = vbTextCompare - 執(zhí)行文本比較。 Mid函數(shù)描述string必需的。從其中返回字符的字符串表達(dá)式。如果字符串包含 Null,則返回 Null。start必需的。規(guī)定起始位置。如果設(shè)置為大于字符串中的字符數(shù)目,則返回空字符串()。length可選的。要返回的字符數(shù)目。如果省略或 length 超過(guò)文本的字符數(shù),將返回字符串中從 start 到字符串結(jié)束的所有字符。Len函數(shù)描述string任意有效的字符串表達(dá)式。如果 string 參數(shù)包含Null,則返回 Null。varname任意有效的變量名。如果 varname 參數(shù)包含 Null,則返回 Null。腳本過(guò)程:1. 先打開(kāi)一個(gè)要提取信息的網(wǎng)站。2. 用HtmlGet 命令 獲取整個(gè)網(wǎng)頁(yè)的文本信息,存到Txt變量里面3. 過(guò)濾符號(hào)前面的文本4. 從文本里的符號(hào)后面的位置開(kāi)始取字符串,這里取了一百個(gè)字符放到命名為cc的變量里。如下圖,也可以設(shè)置取80個(gè)字符,60個(gè)字符,但是長(zhǎng)度一定要把“果果?!?給截進(jìn)來(lái),因?yàn)楹竺嫖覀円ㄟ^(guò)“果果。”作為基準(zhǔn),去過(guò)濾掉不要的文字。2014-9-12 19:22 上傳下載附件 (65.96 KB) 5. 在cc變量里,找果果。出現(xiàn)的位置,找到之后,截取“果果。”之前的文本,也就是我們需要接取的地方。6. 最后,設(shè)置疊加的變量x,把每次找到的 這個(gè)符號(hào)的位置放到變量x里進(jìn)行累加,累加之后第二次循環(huán),就會(huì)跳過(guò)之前找過(guò)的內(nèi)容,進(jìn)行新的內(nèi)容的尋找。源碼:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)/要提取信息的網(wǎng)站Delay 1000 / 如果網(wǎng)頁(yè)打開(kāi)速度慢,可適當(dāng)添加延遲Txt =Plugin.Web.HtmlGet(text,)/獲取網(wǎng)頁(yè)的文本 x=1Do aa = /過(guò)濾符號(hào)前面的文本 bb = InStr(x, Txt, aa) / 返回aa變量里的這個(gè)字符 在整個(gè)網(wǎng)頁(yè)文本txt里的位置 cc = Mid(Txt, bb + Len(aa), 100)/從文本里的符號(hào)后面的位置開(kāi)始取字符串,這里取了一百個(gè)字符 dd = InStr(1, cc, 果果。)/找cc字符串里,果果。出現(xiàn)的位置,果果。的位置就是我們要接取的字符串的長(zhǎng)度 ee = Mid(cc, 1, dd)/從文本里cc里第一個(gè)字符開(kāi)始,取到果果。文字出現(xiàn)的位置 If Len(ee) 0 Then /判斷有沒(méi)有取到匹配的字符 pp = Left(ee, Len(ee)-1)/如果有取到,我們還要做下處理,因?yàn)榍懊鎒e字符串是取到了果果。出現(xiàn)的位置,所以果字也被取了,我們這里長(zhǎng)度-1,去掉果字 TracePrint pp x = InStr(x, Txt, pp) /這里做個(gè)記號(hào),把每次找到的 這個(gè)符號(hào)的位置進(jìn)行累加,累加之后第二次循環(huán),就會(huì)跳過(guò)之前找過(guò)的內(nèi)容,進(jìn)行新的內(nèi)容的尋找。 Else Exit Do /如果沒(méi)有找到匹配的 就退出 End IfLoop 最終效果:2014-9-12 19:23 上傳下載附件 (170.42 KB) 標(biāo)題后面的?234這樣的字符是帖子總回帖的頁(yè)數(shù)獲取網(wǎng)頁(yè)圖片 我們截圖按鍵精靈官網(wǎng)的圖標(biāo): 2014-9-12 19:25 上傳下載附件 (9.33 KB) 2014-9-12 19:26 上傳下載附件 (173.2 KB) 我們可以查看圖片的具體地址代碼如下:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.Go() /打開(kāi)按鍵官網(wǎng)地址Call Plugin.Web.Save(/images/logo.gif, d:123.gif)Delay 3000RunApp mspaint.exe& d:123.gif /打開(kāi)畫(huà)圖工具,看看保存的圖片的效果命令名稱(chēng):Save 保存網(wǎng)頁(yè)或圖片命令功能:保存指定URL的文件到本地磁盤(pán) 命令參數(shù):參數(shù)1:字符串型,需要保存的目標(biāo)Url 參數(shù)2:字符串型,本地文件名最終效果:2014-9-12 19:30 上傳下載附件 (150.99 KB) 大家有沒(méi)有注意到,這里的按鍵精靈官網(wǎng)圖標(biāo),是gif格式的,可以保存。如果是一個(gè)鏈接呢?例如,騰訊QQ注冊(cè)頁(yè)面里的這種驗(yàn)證圖片:2014-9-12 19:30 上傳下載附件 (154.34 KB) 大家看,它的圖片是保存在一個(gè)鏈接里的,這樣就無(wú)法獲取。2014-9-12 19:30 上傳下載附件 (58.92 KB) 地址是沒(méi)有變化的,但是點(diǎn)擊進(jìn)去之后,生成的就是另一張驗(yàn)證圖片了。2014-9-12 19:30 上傳下載附件 (23.81 KB) 所以,遇到這種鏈接方式的圖片,大家還是使用查找圖片的區(qū)域坐標(biāo),然后用屏幕范圍截圖命令來(lái)截圖保存:/下面這句在屏幕區(qū)域范圍內(nèi)截圖保存到(內(nèi)存)里,以備后面調(diào)用。Call Plugin.ColorEx.PrintScreen(0, 0, 1024, 768)/下面這句在屏幕區(qū)域范圍內(nèi)按方式0,查找顏色,返回左上角第一點(diǎn)顏色位置坐標(biāo) XY = Plugin.ColorEx.FindColor(0, 0, 1024
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小紅書(shū)店鋪運(yùn)營(yíng)團(tuán)隊(duì)培訓(xùn)與績(jī)效管理服務(wù)合同
- 產(chǎn)業(yè)地產(chǎn)項(xiàng)目招商運(yùn)營(yíng)代理合作協(xié)議
- 綠色環(huán)保裝配式建筑構(gòu)件生產(chǎn)與建筑廢棄物資源化利用合同
- 城市綠地物業(yè)公司綠化員派遣與城市綠化合同
- 大型影視作品特效化妝假體租賃與技術(shù)支持合同
- 影視虛擬場(chǎng)景租賃與影視特效設(shè)計(jì)服務(wù)協(xié)議
- 電商綠色能源設(shè)備采購(gòu)與技術(shù)支持合作協(xié)議
- 工業(yè)廢氣在線(xiàn)監(jiān)測(cè)系統(tǒng)租賃與能源審計(jì)服務(wù)協(xié)議
- 《5G技術(shù)介紹》課件
- 《產(chǎn)品開(kāi)發(fā)成本分析》課件
- 村干部測(cè)試試題及答案
- 康復(fù)醫(yī)學(xué)教學(xué)課件 - 基礎(chǔ)醫(yī)學(xué) - 醫(yī)藥衛(wèi)生 - 專(zhuān)業(yè)資料
- 《現(xiàn)代西方女性主義》課件
- 2024年南京市建鄴區(qū)平安聯(lián)盟工作輔助人員招聘筆試真題
- 殯葬人員勞務(wù)合同協(xié)議
- 國(guó)內(nèi)外著名幼兒教育家及其教育理念
- 2024年生物醫(yī)學(xué)工程試題及答案
- 6.3 國(guó)家行政機(jī)關(guān)-八年級(jí)《道德與法治》下冊(cè)教學(xué)設(shè)計(jì)(統(tǒng)編版)
- 浙江省寧波市2024學(xué)年第二學(xué)期高考與選考模擬考試化學(xué)試卷及答案(寧波二模)
- 2025年江蘇省新高考高三聯(lián)考數(shù)學(xué)試卷試題(含答案詳解)
- 造價(jià)咨詢(xún)進(jìn)度管理制度
評(píng)論
0/150
提交評(píng)論