《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的收集_第1頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的收集_第2頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的收集_第3頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的收集_第4頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的收集_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)是開(kāi)展數(shù)據(jù)分析的前提,新媒體運(yùn)營(yíng)者只有收集到足夠多的有價(jià)值的數(shù)據(jù)才能進(jìn)一步建立數(shù)據(jù)分析模型,再通過(guò)分析數(shù)據(jù)發(fā)現(xiàn)數(shù)據(jù)背后隱藏的規(guī)律,從而得出有價(jià)值的分析結(jié)果來(lái)指導(dǎo)新媒體的運(yùn)營(yíng)。本章將詳細(xì)介紹收集新媒體數(shù)據(jù)的流程與方式,以及如何使用網(wǎng)絡(luò)爬蟲(chóng)工具采集數(shù)據(jù)。新媒體數(shù)據(jù)的收集初識(shí)新媒體數(shù)據(jù)收集2.1目錄CONTENTS使用網(wǎng)絡(luò)爬蟲(chóng)工具采集數(shù)據(jù)2.2初識(shí)新媒體數(shù)據(jù)收集2.1數(shù)據(jù)收集,即根據(jù)數(shù)據(jù)分析的需要收集相關(guān)的數(shù)據(jù),它是新媒體運(yùn)營(yíng)者開(kāi)展數(shù)據(jù)分析的一個(gè)必要環(huán)節(jié),也是做好數(shù)據(jù)分析的基本保障工作。2.1.1新媒體數(shù)據(jù)收集的基本流程1明確信息需求(1)明確核心指標(biāo)(2)根據(jù)核心指標(biāo)構(gòu)建數(shù)據(jù)分析指標(biāo)體系(3)根據(jù)數(shù)據(jù)分析指標(biāo)體系有針對(duì)性地采集數(shù)據(jù)2按需求采集數(shù)據(jù)(1)運(yùn)營(yíng)者要整理出數(shù)據(jù)指標(biāo)(2)根據(jù)數(shù)據(jù)指標(biāo)和數(shù)據(jù)分析目的采集數(shù)據(jù)2.1.2新媒體數(shù)據(jù)可用性的判斷數(shù)據(jù)來(lái)源數(shù)據(jù)細(xì)節(jié)數(shù)據(jù)真實(shí)性

的判斷檢查數(shù)據(jù)記錄和字段是否完整數(shù)據(jù)完整性的判斷數(shù)據(jù)的時(shí)效性數(shù)據(jù)的支持性數(shù)據(jù)的全面性數(shù)據(jù)價(jià)值性的判斷2.1.3新媒體數(shù)據(jù)收集的方式從新媒體賬號(hào)后臺(tái)獲取數(shù)據(jù)某公眾號(hào)“昨日關(guān)鍵指標(biāo)”分析2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)微熱點(diǎn)(微輿情)熱點(diǎn)分析2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)微熱點(diǎn)(微輿情)“大數(shù)據(jù)報(bào)告”板塊發(fā)布的熱點(diǎn)解讀報(bào)告2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)微熱點(diǎn)(微輿情)分析工具2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)百度指數(shù)關(guān)鍵詞“直播帶貨”的搜索指數(shù)趨勢(shì)2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)新榜新視指數(shù)榜單中“美妝”類視頻號(hào)的日榜2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)新榜新抖抖音號(hào)搜索的相關(guān)數(shù)據(jù)2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)新榜新快新快直播電商下的“銷售額排行”頁(yè)面2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)新榜新站新站UP主搜索頁(yè)面2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)飛瓜數(shù)據(jù)飛瓜數(shù)據(jù)抖音版工作臺(tái)2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)卡思數(shù)據(jù)卡思數(shù)據(jù)“數(shù)據(jù)報(bào)告”板塊2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)卡思數(shù)據(jù)卡思數(shù)據(jù)嗶哩嗶哩平臺(tái)版的“達(dá)人查找”頁(yè)面2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)卡思數(shù)據(jù)達(dá)人詳情頁(yè)2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)蟬媽媽抖音商品銷量榜2.1.3新媒體數(shù)據(jù)收集的方式使用第三方數(shù)據(jù)分析工具收集數(shù)據(jù)蟬媽媽商品詳情分析頁(yè)2.1.3新媒體數(shù)據(jù)收集的方式使用網(wǎng)絡(luò)爬蟲(chóng)工具采集數(shù)據(jù)八爪魚(yú)采集器八爪魚(yú)采集器首頁(yè)2.1.3新媒體數(shù)據(jù)收集的方式使用網(wǎng)絡(luò)爬蟲(chóng)工具采集數(shù)據(jù)爬山虎采集器爬山虎采集器的主界面工具欄任務(wù)列表起始頁(yè)使用網(wǎng)絡(luò)爬蟲(chóng)工具

采集數(shù)據(jù)2.2對(duì)于新媒體運(yùn)營(yíng)者來(lái)說(shuō),使用網(wǎng)絡(luò)爬蟲(chóng)工具采集數(shù)據(jù)既簡(jiǎn)單又便捷。下面以八爪魚(yú)采集器為例,介紹使用網(wǎng)絡(luò)爬蟲(chóng)工具采集數(shù)據(jù)的方法。八爪魚(yú)采集器提供了模板采集、自定義采集、云采集等多種采集模式,新媒體運(yùn)營(yíng)者可以根據(jù)自己的需求選擇合適的采集模式來(lái)采集數(shù)據(jù)。2.2.1模板采集模板采集就是使用由八爪魚(yú)采集器提供的采集模板進(jìn)行數(shù)據(jù)采集。目前,八爪魚(yú)提供的采集模板超過(guò)200個(gè),涵蓋各主流網(wǎng)站的采集場(chǎng)景。模板采集模式簡(jiǎn)單易操作,新媒體運(yùn)營(yíng)者在采集數(shù)據(jù)時(shí)只需輸入網(wǎng)址、關(guān)鍵詞、頁(yè)數(shù)等參數(shù),就能快速獲得目標(biāo)網(wǎng)站的數(shù)據(jù)。使用八爪魚(yú)采集器中的模板采集模式采集數(shù)據(jù)的操作步驟如下。2.2.2自定義采集新媒體運(yùn)營(yíng)者使用智能識(shí)別模式采集數(shù)據(jù)時(shí),只需輸入要采集數(shù)據(jù)的目標(biāo)網(wǎng)址即可,八爪魚(yú)采集器能夠自動(dòng)智能識(shí)別網(wǎng)頁(yè)數(shù)據(jù)。使用八爪魚(yú)采集器智能識(shí)別模式采集數(shù)據(jù)的操作步驟如下。使用智能識(shí)別模式采集數(shù)據(jù)2.2.2自定義采集采集流程(也叫采集任務(wù)、采集規(guī)則)是指從特定網(wǎng)頁(yè)上提取數(shù)據(jù)的一系列步驟。自己手動(dòng)配置采集流程,可以靈活應(yīng)對(duì)各類采集場(chǎng)景,包括翻頁(yè)、滾動(dòng)、登錄等。由于每個(gè)網(wǎng)站的頁(yè)面布局是不同的,因此采集流程不能通用。通常來(lái)說(shuō),一個(gè)網(wǎng)站需要配置一個(gè)采集流程。自己手動(dòng)配置采集流程采集數(shù)據(jù)采集流程2.2.2自定義采集自己手動(dòng)配置采集流程采集數(shù)據(jù)單個(gè)數(shù)據(jù)的采集以在京東商城商品詳情頁(yè)上采集商品數(shù)據(jù)為例,使用八爪魚(yú)采集器手動(dòng)配置采集流程進(jìn)行單個(gè)數(shù)據(jù)采集的操作步驟如下。2.2.2自定義采集自己手動(dòng)配置采集流程采集數(shù)據(jù)從列表進(jìn)入詳情頁(yè)采集數(shù)據(jù)頭條號(hào)文章列表文章詳情頁(yè)2.2.2自定義采集自己手動(dòng)配置采集流程采集數(shù)據(jù)從列表進(jìn)入詳情頁(yè)采集數(shù)據(jù)下面以采集頭條號(hào)文章的數(shù)據(jù)信息為例,介紹如何使用八爪魚(yú)采集器自定義采集模式從列表進(jìn)入詳情頁(yè)采集數(shù)據(jù),操作步驟如下。2.2.2自定義采集自己手動(dòng)配置采集流程采集數(shù)據(jù)多頁(yè)數(shù)據(jù)的采集單擊“下一頁(yè)”按鈕實(shí)現(xiàn)翻頁(yè)2.2.2自定義采集自己手動(dòng)配置采集流程采集數(shù)據(jù)多頁(yè)數(shù)據(jù)的采集下面以在嗶哩嗶哩平臺(tái)上按類目標(biāo)簽采集視頻數(shù)據(jù)為例,介紹使用八爪魚(yú)采集器采集通過(guò)單擊“下一頁(yè)”按鈕實(shí)現(xiàn)翻頁(yè)的網(wǎng)站的數(shù)據(jù)的方法,操作步驟如下。2.2.3云采集云采集是指使用由八爪魚(yú)采集器提供的云服務(wù)集群進(jìn)行數(shù)據(jù)采集。在云采集模式下,新媒體運(yùn)營(yíng)者可以實(shí)現(xiàn)7×24小時(shí)不間斷采集數(shù)據(jù)。新媒體運(yùn)營(yíng)者可以在本地計(jì)算機(jī)上完成采集流程的配置,測(cè)試采集流程沒(méi)有問(wèn)題以后,便可啟動(dòng)云采集,由八爪魚(yú)采集器的云服務(wù)集群采集數(shù)據(jù)。2.2.3云采集啟動(dòng)云采集單擊“啟動(dòng)云采集”按鈕2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論