租房爬蟲報告_第1頁
租房爬蟲報告_第2頁
租房爬蟲報告_第3頁
租房爬蟲報告_第4頁
租房爬蟲報告_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

租房爬蟲爬蟲技術關鍵代碼數(shù)據(jù)分析運行結果01.02.03.04.

目錄01爬蟲技術01爬蟲技術123request.get(url,params=None,**kwargs)其中,url為獲取頁面的鏈接,params為額外參數(shù),字典或者字節(jié)流格式,其為可選。**kwargs為12個控制訪問的參數(shù)。BeautifulSoup提供一些簡單的、python式的函數(shù)用來處理導航、搜索、修改分析樹等功能。pyecharts是一款將python與echarts結合的強大的數(shù)據(jù)可視化工具。請求庫:requests

HTML解析:BeautifulSoup數(shù)據(jù)可視化:pyecharts爬蟲技術01導入相關包importreimportrequestsimportrandomimporttimefrombs4importBeautifulSoupfrompyecharts.chartsimportBar,Line,Page,Piefrompyechartsimportoptionsasopts爬蟲技術01請求頭user_agent_list=["Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.1(KHTML,likeGecko)Chrome/22.0.1207.1Safari/537.1","Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/536.6(KHTML,likeGecko)Chrome/20.0.1092.0Safari/536.6","Mozilla/5.0(WindowsNT6.2;WOW64)AppleWebKit/537.1(KHTML,likeGecko)Chrome/Safari/537.1",]UA=random.choice(user_agent_list)headers={'User-Agent':UA}爬蟲技術01目標網址url='/zufang/pg'02關鍵代碼02關鍵代碼#目標網址url='/zufang/pg'#要獲取的信息title_list=[]#標題price_list=[]#租金position_list=[]#地理位置size_list=[]#房子面積02關鍵代碼#標題title=li_quick.find('a',class_='twoline').get_text().strip()#租金price=li_quick.find('span',class_='content__list--item-price').find('em').get_text().strip()#位置信息position=li_quick.find('p',class_='content__list--item--des').find('a').get_text().strip()#面積size=re.findall(r'\d+㎡',temp_size)02關鍵代碼<aclass="twoline"target="_blank"href="/zufang/XZ2795760721969807360.html">整租·綠地國際花都1室1廳南</a>爬蟲技術01數(shù)據(jù)存儲df=pd.DataFrame({'標題':title_list,'租金':price_list,'位置':position_list,'面積':size_list})df.to_excel("zufang.xlsx",index=False)數(shù)據(jù)分析0303數(shù)據(jù)分析defarea_house_num()->Bar:c=(Bar(init_opts=opts.InitOpts(width="600px",height="300px")).add_xaxis(list(area_num_dict.keys())).add_yaxis("數(shù)量",list(area_num_dict.values())).set_global_opts(title_opts=opts.TitleOpts(title="房源數(shù)量",subtitle="各地區(qū)房源數(shù)量"),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=30))))returnc各區(qū)房源數(shù)量柱狀圖03數(shù)據(jù)分析defarea_house_average_price()->Line:c=(Line(init_opts=opts.InitOpts(width="600px",height="300px")).add_xaxis(list(average_price_dict.keys())).add_yaxis("平均價",list(average_price_dict.values())).set_global_opts(title_opts=opts.TitleOpts(title="房源平均價",subtitle="各地區(qū)房源平均價"),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=30))))returnc各區(qū)租房均價折線圖03數(shù)據(jù)分析defarea_house_type_num()->Bar:c=(Bar(init_opts=opts.InitOpts(width="600px",height="300px")).add_xaxis(list(area_room_type_dict.keys())).add_yaxis("數(shù)量",list(area_room_type_dict.values())).reversal_axis().set_series_opts(label_opts=opts.LabelOpts(position="right")).set_global_opts(title_opts=opts.TitleOpts(title="房源戶型數(shù)量",subtitle="各地區(qū)房源戶型數(shù)量"),))returnc各區(qū)域房源數(shù)量柱狀圖03數(shù)據(jù)分析defarea_room_size()->Pie:c=(Pie(init_opts=opts.InitOpts(width="600px",height="335px")).add("",[list(z)forzinzip(area_room_size_dict.keys(),area_room_size_dict.values())]).set_global_opts(title_opts=o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論