Python爬蟲與網(wǎng)頁設(shè)計(jì)實(shí)踐報(bào)告_第1頁
Python爬蟲與網(wǎng)頁設(shè)計(jì)實(shí)踐報(bào)告_第2頁
Python爬蟲與網(wǎng)頁設(shè)計(jì)實(shí)踐報(bào)告_第3頁
Python爬蟲與網(wǎng)頁設(shè)計(jì)實(shí)踐報(bào)告_第4頁
Python爬蟲與網(wǎng)頁設(shè)計(jì)實(shí)踐報(bào)告_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)踐報(bào)告Python爬蟲與網(wǎng)頁設(shè)計(jì)成果名稱:Python爬蟲與網(wǎng)頁設(shè)計(jì)-23-實(shí)踐活動(dòng)題目校內(nèi)華為大數(shù)據(jù)項(xiàng)目實(shí)訓(xùn)一、實(shí)踐目的1.了解并掌握Python語言的基本語法,并會(huì)自己用Python語言寫一些簡(jiǎn)單的程序代碼;2.熟悉前端特性css、html、js3.學(xué)會(huì)用html創(chuàng)建各式各樣的網(wǎng)頁,例如:人人網(wǎng)登錄界面,京東界面,淘寶界面,QQ登錄界面;二、實(shí)踐內(nèi)容1.基本語法(1)小心引用?。?)2和3的常見差異(3)print數(shù)據(jù)類型統(tǒng)一,取消unicode和longutf8:3.x代碼默認(rèn)utf-82.顯示保留字顯示結(jié)果:3.標(biāo)識(shí)符基本規(guī)則:由字母,下劃線和數(shù)字組成,并且第一個(gè)字符不能是數(shù)字,可以使用的標(biāo)識(shí)符字符有:a-z,A-Z,0-9,“_”如:USERID,book,user_id,myclass,book01注意事項(xiàng):(1)不能是Python的保留字(2)不能包含空格,@,%,$(3)可以中文,但是我們不建議使用中文(4)嚴(yán)格區(qū)分大小寫4.數(shù)據(jù)類型(1)數(shù)值類型分為:整數(shù)和小數(shù)整數(shù)包括正整數(shù),負(fù)整數(shù),0,并且它的位數(shù)是任意的浮點(diǎn)數(shù)由整數(shù)部分和小數(shù)部分組成,主要用于處理包括小數(shù)的數(shù)。(2)字符串類型字符串就是連續(xù)的字符序列,可以是計(jì)算機(jī)所能表示的一切字符集合。字符串屬于不可變序列,通常使用單引號(hào)‘’或者雙引號(hào)“”或者三引號(hào)‘’‘’‘’或“”“”“”括起來,這三種引號(hào)形式再語義上沒有差別,只是再形式上有差別。其中單引號(hào)和雙引號(hào)的字符串序列必須再一行上,而三引號(hào)內(nèi)的字符序列可以分布再連續(xù)的多行上。(3)布爾類型布爾類型主要用來表示真或者假的值。標(biāo)識(shí)符True和False被解釋為布爾值。布爾值可以轉(zhuǎn)化為數(shù)值,其中True表示1,而False表示0用Python進(jìn)行網(wǎng)絡(luò)爬蟲:步驟一:python的下載(1)首先,進(jìn)入到python官網(wǎng),你可以直接輸入python主頁,也可以從百度搜索框進(jìn)入到python的主頁,這里方法很多,我不在一一例舉了,然后在主頁上面可以看見Downloads字樣,點(diǎn)擊下載,然后跳轉(zhuǎn)出下載界面。下載界面選擇版本(3)安裝好后,按windows鍵加R鍵,彈出運(yùn)行窗口,在運(yùn)行窗口輸入cms進(jìn)入到命令行界面,然后輸入python,如果安裝成功,即可進(jìn)入到python交互界面,如果沒有則表示python沒有安裝成功。步驟二:爬蟲準(zhǔn)備(1)爬蟲首先需要做的事情就是要確定好你想要爬取數(shù)據(jù)的對(duì)象.百度界面(2)首先,是打開百度主頁界面,然后把鼠標(biāo)移動(dòng)到主頁界面的百度logo圖標(biāo)上面,點(diǎn)擊鼠標(biāo)右鍵,然后點(diǎn)擊審查元素,即可打開開發(fā)者界面。(3然后再下面的界面里面,可以看到該logo圖標(biāo)在HTML里面的排版模式,<imghidefocus="true"src="http://baidu/img/bd_logo1.png"width="270"height="129">開發(fā)者界面步驟三:開始爬蟲(1)首先,我們進(jìn)行頁面獲取,python爬蟲的話很多模塊包提供給開發(fā)者直接抓取網(wǎng)頁,urllib,urllib2,requests(urllib3)等等,這里我們使用urllib2進(jìn)行網(wǎng)站頁面的獲??;首先導(dǎo)入urllib2模塊包(該包是默認(rèn)安裝的):importurllib2;導(dǎo)入urllib2模塊包(2)導(dǎo)入模塊包之后,然后調(diào)用urllib2中的urlopen方法鏈接網(wǎng)站,代碼如下repr=urllib2.urlopen("XXXXXX"),XXXXXX代表的是網(wǎng)站名稱;(3)得到網(wǎng)站的響應(yīng)之后,然后就是將頁面的源代碼讀取出來,調(diào)用read方法,html=repr.read();調(diào)用read(4)獲取到頁面的源代碼之后,然后接下來的工作就是將自己想要的數(shù)據(jù)從html界面源代碼中解析出來,解析界面的模塊包有很多,原始的re,好用的BeautifulSoup,以及l(fā)xml等等,這里用re介紹介紹,首先導(dǎo)入re模塊包:importre;(5)然后進(jìn)行利用re進(jìn)行搜索;re搜索(6)然后就實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的爬蟲流程,打印url,可以看見剛好就是之前看見的百度主頁logo的地址。源代碼:importurllib2repr=urllib2.urlopen("URL")html=repr.read()importre省略一行代碼printurl。用html設(shè)計(jì)網(wǎng)頁認(rèn)識(shí)網(wǎng)頁網(wǎng)頁主要由文字,和超鏈接等元素構(gòu)成,當(dāng)然除了這些元素,網(wǎng)頁中還包含音頻,視頻以及Flash等。HTML初識(shí)超文本標(biāo)HTML是一種用于創(chuàng)建網(wǎng)頁的標(biāo)準(zhǔn)標(biāo)記語言。網(wǎng)頁文件的后綴是以.html。網(wǎng)頁的形成前端程序員面寫的→瀏覽器的渲染→客戶眼中的美麗頁面4.HTML骨架格式HTML有自己的語言語法骨架格式。<html><head> <title></title></head><body></body></html>5.開發(fā)工具的使用編寫我們的第一個(gè)HTML頁面?。?)打開HBuilderX新建一個(gè)項(xiàng)目;(2)打開index.html;(3)在<body></body>中間寫入:給自己定一個(gè)小目標(biāo),經(jīng)過5個(gè)月的努力,實(shí)現(xiàn)月薪過萬(4)保存之后;(5)用瀏覽器打開文件。.6.HTML常用標(biāo)簽(1)段落標(biāo)簽:<p>...(2)水平線標(biāo)簽:<hr/>(3)換行標(biāo)簽:<br/>(4)<b></b>或者<strong></strong>字體加粗(5)<i></i>或者<em></em>斜體字(6)<s></s>或者<del></del>字體加刪除線(7)<u></u>或者<ins></ins>字體加下劃線7.圖像標(biāo)簽img單詞縮寫:

image圖像

HTML網(wǎng)頁中任何元素的實(shí)現(xiàn)都要依靠HTML標(biāo)簽,要想在網(wǎng)頁中顯示圖像就需要使用圖像標(biāo)簽.

該語法中src屬性用于指定圖像文件的路徑和文件名,他是img標(biāo)簽的必需屬性。

<img

src="圖像URL"

/>8.<input>標(biāo)簽<input屬性/>一個(gè)重要的表單元素9.<input>標(biāo)簽的type屬性type屬性:text,password,checkbox,radio,button,submit,reset,image,file<inputreadonly/>控件只讀<inputdisabled/>控件不可用<inputplaceholder=“請(qǐng)輸入姓名"/>都是控件的屬性html5支持10.表單域form<formaction=“提交表單的地址”method=“提交方式”>表單域中的表單元素</form>說明:action的值是一個(gè)提交表單的URL地址,method的值分別是get、post兩種方式11.<label>標(biāo)簽(理解)<labelfor=“id名”>姓名</label>用于綁定一個(gè)表單元素,當(dāng)點(diǎn)擊label標(biāo)簽時(shí)會(huì)獲得該表單的焦點(diǎn)我們通過for來綁定表單元素12.下拉菜單<selectname=“菜單名”> <optionvalue=“值”>顯示值</option> <optionvalue=“值”>顯示值</option> <optionvalue=“值”>顯示值</option></select>13.文本域控件<textarea></textarea>文本域如果需要輸入大量信息,就可以通過文本域輕松實(shí)現(xiàn)。cols屬性:每行中的字符數(shù)rows屬性:顯示的行數(shù)14.H5酷炫表單元素<inputtype=“color”>調(diào)色板<inputtype=“date”>生日框<inputtype=“number”>數(shù)量欄14.鏈接標(biāo)簽<a><ahref=“目標(biāo)鏈接”>...</a>超鏈接想去哪里點(diǎn)一下錨點(diǎn)定位:<ahref=“#id名”>...</a>跳轉(zhuǎn)到錨點(diǎn)<h3id=“id名”></h3>錨點(diǎn)15.表格表格頭:表頭使用<th></th>代替原來的<td></td>表格標(biāo)題:標(biāo)題使用<caption>標(biāo)題名稱</caption>單元格合并:合并單元格屬性:rowspan豎向跨單元格,colspan橫向跨單元格用html進(jìn)行完整的網(wǎng)頁設(shè)計(jì):1.確定網(wǎng)站主題(1)分析網(wǎng)站的功能,講網(wǎng)站所有的功能再文檔中體現(xiàn);(2)?分析網(wǎng)站的主題,選擇符合網(wǎng)站主題的方案。2.搜集材料(1)通過和與網(wǎng)站相關(guān)人員的接觸、交流確定網(wǎng)站需要的模塊,并將這些模塊再文檔中體現(xiàn);(2)收集相關(guān)圖片、文字、視頻等資料;(3)將圖片、文字和視頻等資料使用相應(yīng)的軟件進(jìn)行編輯備用(必須做);(4)對(duì)圖片、文字和視頻等資料分別分類整理;(5)所有素材的文件名都必須是非中文字符,并且要做到看到文件名就知道是哪張圖片。網(wǎng)頁設(shè)計(jì)實(shí)例:人人網(wǎng)登錄界面:<!DOCTYPEhtml><htmllang="en"><head> <metacharset="UTF-8"> <title>人人網(wǎng)注冊(cè)</title> </head> <body> <imgsrc="renren_titile.gif"alt=""/><br/> <p>人人網(wǎng),中國<strong>最真實(shí)、最有效</strong>的社會(huì)平臺(tái),加入人人網(wǎng),找回老朋友,結(jié)交新朋友。</p> 電子郵箱:<inputtype="email"/> <inputtype="submit"value="提交"/><br/><br/> 設(shè)置密碼:<inputtype="password"size="30"maxlength="10"/><br/><br/> 真實(shí)姓名:<inputtype="text"size="30"maxlength="10"/><br/><br/> 性別:<inputtype="radio"name="sex"value="男"checked/>男<inputtype="radio"name="sex"value="女"/>女<br/><br/> 生日:<select> <optionvalue="1990">1990</option> <optionvalue="1991">1991</option> <optionvalue="1992">1992</option> <optionvalue="1993">1993</option> <optionvalue="1994">1994</option> <optionvalue="1995">1995</option> <optionvalue="1996">1996</option> <optionvalue="1997">1997</option> <optionvalue="1998">1998</option> <optionvalue="1999">1999</option> </select>年份 <select> <optionvalue="一月">一月</option> <optionvalue="二月">二月</option> <optionvalue="三月">三月</option> <optionvalue="四月">四月</option> <optionvalue="五月">五月</option> <optionvalue="六月">六月</option> <optionvalue="七月">七月</option> <optionvalue="八月">八月</option> <optionvalue="九月">九月</option> <optionvalue="十月">十月</option> <optionvalue="十一月">十一月</option> <optionvalue="十二月">十二月</option> <select/>月份<br/> <p>為什么要填寫我的生日?<p/> 我現(xiàn)在<select> <optionvalue="請(qǐng)選擇身份"cheched>請(qǐng)選擇身份</option> <optionvalue="醫(yī)生">醫(yī)生</option> <optionvalue="教師">教師</option> <optionvalue="自由職業(yè)">自由職業(yè)</option> <select/>(非常重要)<br/><br/> <imgsrc="renren_code.gif"alt=""/> <ahref="#">看不清,換一張</a><br/><br/> 驗(yàn)證碼:<inputtype="text"size="30"maxlength="10"/><br/><br/> <imgsrc="renren.gif"alt=""/> </body> </html>2.QQ會(huì)員<!DOCTYPEhtml><html> <head> <metacharset="utf-8"> <title></title> <styletype="text/css"> #main{ height:100px; background-color:#666666; padding-left:80px; padding-top:10px; } #mainimg{ width:120px; } #mainimg,div{ vertical-align:middle; } #caidan{ display:inline-block; } #caidanul,li{ list-style:none; float:left; margin:8px; margin-right:20px; color:#FFFFFF; } #caidanullia{ text-decoration:none; } #caidanullia:link{ color:#FFFFFF; } #caidanullia:visited{ color:#FFFFFF; } #caidanullia:hover{ color:orange; } #anniu{ display:inline-block; margin:30px; } #anniu#denglu{ display:inline-block; border:1px#E1D5A5solid; width:70px; height:30px; color:#E1D5A5; border-radius:30px; text-align:center; line-height:30px; } #anniu#denglu:hover{ color:black; background:#E1D5A5; } #anniu#huiyuan{ display:inline-block; border:1px#FFA500solid; height:30px; width:120px; text-align:center; line-height:30px; border-radius:40px; color:#8F6809; background:#E1D5A5; margin-left:10px; } </style> </head> <body> <divid="main"> <imgsrc="img/logo.png">; <divid="caidan"> <ul> <li><ahref="#">超級(jí)會(huì)員</a></li> <li><ahref="#">年費(fèi)專區(qū)</a></li> <li><ahref="#">成長體系</a></li> <li><ahref="#">會(huì)員活動(dòng)</a></li> <li><ahref="#">生活特權(quán)</a></li> <li><ahref="#">游戲特權(quán)</a></li> <li><ahref="#">功能特權(quán)</a></li> </ul> </div> <divid="anniu"> <divid="denglu"> 登陸 </div> <divid="huiyuan"> 開通超級(jí)會(huì)員 </div> </div> </div> </body></html>3.當(dāng)當(dāng)網(wǎng)<!DOCTYPEhtml><html><headlang="en"><metacharset="UTF-8"><title>完善當(dāng)當(dāng)購物車頁面</title><linktype="text/css"rel="stylesheet"href="css/cartStyle.css"/></head><body><divclass="content"><divclass="logo"><imgsrc="images/dd_logo.jpg"><spanonclick="close_plan();">關(guān)閉</span></div><divclass="cartList"><ul><li>¥<inputtype="text"name="price"value="21.90"></li><li><inputtype="button"name="minus"value="-"onclick="minus(0);"><inputtype="text"name="amount"value="1"><inputtype="button"name="plus"value="+"onclick="plus(0);"></li><liid="price0">¥21.90</li><li><ponclick="collection();">移入收藏</p><ponclick="del();">刪除</p></li></ul><ul><li>¥<inputtype="text"name="price"value="24.00"></li><li><inputtype="button"name="minus"value="-"onclick="minus(1);"><inputtype="text"name="amount"value="1"><inputtype="button"name="plus"value="+"onclick="plus(1);"></li><liid="price1">¥24.00</li><li><ponclick="collection();">移入收藏</p><ponclick="del();">刪除</p></li></ul><ol><liid="totalPrice"> </li><li><spanonclick="accounts();">結(jié)算</span></li></ol></div></div><scripttype="text/javascript"src="js/shopping.js"></script></body></html>三、實(shí)踐過程第一周實(shí)訓(xùn)老師帶我們學(xué)習(xí)了Python語言,并且由淺入深,最后帶領(lǐng)我們學(xué)習(xí)了用Python進(jìn)行網(wǎng)絡(luò)爬蟲,第一周我感覺得非常困難,但是我不斷的搜索資料,不斷的問彭翔老師,再加上自己的練習(xí),讓我更加熟練的運(yùn)用python,老師帶領(lǐng)我們完成了許多有趣的作業(yè),我對(duì)python產(chǎn)生了濃厚的興趣。第二周開始進(jìn)行html網(wǎng)頁設(shè)計(jì)的講解,開始先講了許多做基本的步驟和設(shè)計(jì)網(wǎng)頁時(shí)的基本語句,方便后面的學(xué)習(xí)與設(shè)計(jì)。后來,由易到難,從最開始的簡(jiǎn)單的網(wǎng)頁,到后來的人人網(wǎng)登錄界面設(shè)計(jì)、當(dāng)當(dāng)書城頁面設(shè)計(jì)、QQ會(huì)員界面設(shè)計(jì)。本周的學(xué)習(xí)比第一周知識(shí)點(diǎn)更加抽象,學(xué)起來也比較枯燥,但我沒有放棄,晚上回去繼續(xù)研究老師上課的PPT,完成老師上課布置的相關(guān)作業(yè),遇到問題時(shí)問問班中的大佬,做到不恥下問,讓我對(duì)抽象的知識(shí)更加了解,此次的html有更強(qiáng)的實(shí)用性,讓我了解到實(shí)踐的重要性,html確實(shí)在人人網(wǎng)登錄界面設(shè)計(jì)、當(dāng)當(dāng)書城頁面設(shè)計(jì)、QQ會(huì)員界面設(shè)計(jì)有著較強(qiáng)的應(yīng)用,彭翔老師說學(xué)好html會(huì)對(duì)今后的求職方面有很大幫助,因此要下苦功夫,更加努力,為以后的求職道路打下堅(jiān)實(shí)的基礎(chǔ);第三周講解了MySQL語句和相關(guān)代碼,也是實(shí)訓(xùn)過程中最難得一部分,用了大量的時(shí)間進(jìn)行講解,也是與網(wǎng)頁設(shè)計(jì)相掛鉤的,此次的mysql學(xué)習(xí)中跟我們?cè)谡n堂上學(xué)的更具有實(shí)踐性,在課堂上比較熟練地掌握了mysql相關(guān)語句和相關(guān)代碼,但是沒能很好的掌握mysql的實(shí)用性,在第三周的相關(guān)知識(shí)和相關(guān)練習(xí)以后,自己也能很好靈活運(yùn)用mysql,彭翔老師也給我們灌輸了有關(guān)相關(guān)專業(yè)的必備證書,考一個(gè)數(shù)據(jù)庫管理員,在以后的就職方面能有一個(gè)理想的薪資,我想今后能在這方面下苦功夫,為以后的工作打下堅(jiān)實(shí)的基礎(chǔ)。第四周

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論