微博輿情研究在大數(shù)據(jù)檢索分析中的缺陷研究,新聞傳播學(xué)論文_第1頁
微博輿情研究在大數(shù)據(jù)檢索分析中的缺陷研究,新聞傳播學(xué)論文_第2頁
微博輿情研究在大數(shù)據(jù)檢索分析中的缺陷研究,新聞傳播學(xué)論文_第3頁
微博輿情研究在大數(shù)據(jù)檢索分析中的缺陷研究,新聞傳播學(xué)論文_第4頁
微博輿情研究在大數(shù)據(jù)檢索分析中的缺陷研究,新聞傳播學(xué)論文_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

微博輿情研究在大數(shù)據(jù)檢索分析中的缺陷研究,新聞傳播學(xué)論文在美國,研究者主要利用微博大數(shù)據(jù)了解現(xiàn)代媒介生態(tài)中社交媒介的功能,專注于以興趣與問題為基礎(chǔ)的公眾構(gòu)成與動態(tài)。包括微博大數(shù)據(jù)的挖掘與分析,用以理解當(dāng)下的傳播危機(jī),選舉中社交媒介所扮演的角色,現(xiàn)代受眾介入電視娛樂節(jié)目及新媒介的特征等[1]1.同國外不同,中國微博大數(shù)據(jù)運用當(dāng)前主要表如今商業(yè)領(lǐng)域及輿情評測方面。尤其在輿論研究中,大數(shù)據(jù)熱不斷攀升,成為新聞傳播界令人矚目的現(xiàn)象。中國人民大學(xué)傳播學(xué)者喻國明教授在(傳播學(xué)研究:大數(shù)據(jù)時代的新范式〕一文中,對大數(shù)據(jù)在輿情研究中的作用充分肯定,他以為大數(shù)據(jù)視域下,輿情研究重點已由輿情監(jiān)測轉(zhuǎn)向為輿情預(yù)警乃至預(yù)測,從單向度的危機(jī)應(yīng)對、品牌營銷轉(zhuǎn)向各領(lǐng)域的綜合信息服務(wù)[2].另一位學(xué)者李彪在(大數(shù)據(jù)視域下社會輿情研究的新境界〕中,也以為大數(shù)據(jù)能夠解決當(dāng)前輿情研究的尷尬,已經(jīng)成為輿情研究的利器,為輿情研究創(chuàng)造了新的機(jī)遇[3].除此之外,很多計算科學(xué)領(lǐng)域?qū)W者也從微觀角度,分別對微博輿情大數(shù)據(jù)研究,在技術(shù)角度和研究方式方法層面做了細(xì)致分析。然而,凡事皆有兩面,假如拋開慣常的認(rèn)知與思維,在微博大數(shù)據(jù)熱研究伊始即關(guān)注微博大數(shù)據(jù)研究的負(fù)面風(fēng)險與挑戰(zhàn),對微博輿情研究沿正向前進(jìn)不無助益。正如利維施特勞斯所指出的那樣:我們是我們本身的工具.當(dāng)我們利用這種工具的時候,我們應(yīng)該考慮它是怎樣介入共享這個世界的。大數(shù)據(jù)領(lǐng)域已經(jīng)開場,我們質(zhì)疑其假設(shè)、價值與這種研究新浪潮中的偏見,這顯得非常重要。作為對知識生產(chǎn)感興趣的學(xué)者,這種審問是我們所做研究中一個必不可少的部分[4].一、大數(shù)據(jù)運用的工具依靠與技術(shù)挑戰(zhàn)微博輿情研究中,通過大數(shù)據(jù)挖掘,如跟蹤微博趨勢主題標(biāo)簽,研究者能夠大規(guī)模搜集在線集體行為,進(jìn)而看到某個熱門事件的影響形式與傳播峰期與峰值??的螤柎髮W(xué)教授喬恩克萊因伯格講:我用大數(shù)據(jù)尋找熱門,我用大數(shù)據(jù)理解行為的爆發(fā)。這些事情你只能通過大數(shù)據(jù)來做。[5]顯然在以喬恩克萊因伯格教授為代表的數(shù)據(jù)技術(shù)派看來,大數(shù)據(jù)已成為研究微博輿情的在線魚缸〔on-lineaquarium〕,網(wǎng)民所有實時行為都能夠通過這個窗口呈現(xiàn)出來。問題是,web2.0時代以來,基于云端的大數(shù)據(jù)技術(shù)固然迅速崛起,但技術(shù)仍不成熟,難以完全知足微博輿情研究的大數(shù)據(jù)檢測與分析要求。1.大數(shù)據(jù)存儲與檢索系統(tǒng)存在技術(shù)缺陷微博上各種熱門事件的輿情可測,就在于新的大數(shù)據(jù)存儲系統(tǒng)為各種輿論行為的構(gòu)造化數(shù)據(jù),如二維表等關(guān)系型數(shù)據(jù);半構(gòu)造化數(shù)據(jù),如博客的〔HyperTextMark-upLan-guage〕文檔等;非構(gòu)造化數(shù)據(jù),如博客帖子、圖片、圖像與音頻、視頻等,提供了TB〔1TB=1024GB〕級甚至是PB〔1PB=1024TB〕級的數(shù)據(jù)規(guī)模。而傳統(tǒng)關(guān)系數(shù)據(jù)庫RDBMS〔RelationalDatabaseManagementSystem,即關(guān)系數(shù)據(jù)庫管理系統(tǒng),是將數(shù)據(jù)組織為相關(guān)的行和列的系統(tǒng)〕由于數(shù)據(jù)一致性的約束,在管理大規(guī)模數(shù)據(jù)集存儲條件下,在數(shù)據(jù)更新、局部數(shù)據(jù)失效處理以及系統(tǒng)擴(kuò)展性等方面工作效率低下[5].在應(yīng)付SNS類型的微博動態(tài)網(wǎng)站方面疲態(tài)盡顯。當(dāng)前微博輿情所依靠的大數(shù)據(jù)存儲檢索系統(tǒng)主要有兩種,即No-SQL〔即NotOnlySQL,是對不同于傳統(tǒng)的關(guān)系數(shù)據(jù)庫的數(shù)據(jù)庫管理系統(tǒng)的統(tǒng)稱,泛指為了解決大規(guī)模數(shù)據(jù)集合多重數(shù)據(jù)種類帶來的挑戰(zhàn),尤其是大數(shù)據(jù)應(yīng)用難題的非關(guān)系型的數(shù)據(jù)庫〕數(shù)據(jù)庫與Hadoop〔Ha-doop是Apache軟件基金會發(fā)起的一個分布式系統(tǒng)基礎(chǔ)架構(gòu),是一種開源的合適大數(shù)據(jù)的分布式存儲和處理平臺〕.No-SQL數(shù)據(jù)庫在響應(yīng)速度與后端處理大量數(shù)據(jù)能力上優(yōu)勢宏大,但在多列查詢上支持較弱,在數(shù)值統(tǒng)計分析等復(fù)雜處理上表現(xiàn)一般。因而在進(jìn)行微博輿論行為方面帖子搜集時,其跟隨列表經(jīng)常會感遭到數(shù)據(jù)的延遲,并經(jīng)常碰到不知數(shù)據(jù)詳細(xì)存在何處及很多時候數(shù)據(jù)總是不可用的境地。除此之外No-SQL數(shù)據(jù)存儲系統(tǒng)并未構(gòu)成統(tǒng)一標(biāo)準(zhǔn),也缺乏商業(yè)上的普遍支持。這在微博輿情檢索時,也為數(shù)據(jù)搜索的混亂與錯誤過失留下了端口。另一種大數(shù)據(jù)管理工具是Hadoop〔其典型應(yīng)用有facebook等〕,它利用MapReduce〔一種編程模型,用于大規(guī)模數(shù)據(jù)集的并行運算〕加速檢索實現(xiàn),能夠輕松處理海量數(shù)據(jù)。國外很多微博利用他來進(jìn)行巨量數(shù)據(jù)分析,它使得微博上的構(gòu)造化數(shù)據(jù)文件能夠映射成為一張數(shù)據(jù)庫表,并提供完好的數(shù)據(jù)查詢功能。但在現(xiàn)實微博輿情檢索經(jīng)過中,由于該系統(tǒng)不支持?jǐn)?shù)據(jù)流的高速加載與查詢,因而會導(dǎo)致整個系統(tǒng)在微博輿情檢索時,經(jīng)過繁瑣與效率低下。除此之外微博大數(shù)據(jù)檢索系統(tǒng)中所建構(gòu)的查詢與文檔也并不穩(wěn)定,系統(tǒng)與系統(tǒng)之間的匹配原則與結(jié)果呈現(xiàn)技術(shù)也有所不同〔也許一個系統(tǒng)返回Twitter帖子的分級列表,而另一個呈現(xiàn)的則是詞云〕[6].2.大數(shù)據(jù)的信息獲取權(quán)限需要指出的是,盡管存在眾多工具軟件與搜索手段,當(dāng)前微博輿情在檢索上仍主要依靠微博API〔ApplicationProgrammingInterface,即應(yīng)用程序編程接口,它是一些預(yù)先定義的函數(shù),目的是提供給用程序與開發(fā)人員基于某軟件或硬件得以訪問一組例程的能力,而又無需訪問源碼,或理解內(nèi)部工作機(jī)制的細(xì)節(jié)〕技術(shù)規(guī)則,換句話講,微博輿情研究所需的大數(shù)據(jù)集仍然牢牢控制在微博媒介所有者手中,其可得性需要看微博媒介擁有者的心情與臉色吃飯.事實上,實現(xiàn)API開放的微博媒介大數(shù)據(jù)集并非詳盡的集納了所有公開發(fā)布的博客帖子,也不會為輿情研究者提供所有的帖子以供索引查詢,它們需要過濾與壓縮垃圾帖子以增加相關(guān)性。由于容量限制,一般微博,如Twitter等,僅能提供近一周的微博數(shù)據(jù)以供索引[1]7,8.除此之外,作為大數(shù)據(jù)宿主,微博媒介平臺提供API的內(nèi)在驅(qū)力并非輿情研究,而是創(chuàng)造商對商關(guān)系,其目的是具有一系列潛在價值的特殊終端用戶,如2020年Twitter與NBC聯(lián)合直播倫敦奧運盛況,便是為了尋求與大企業(yè)、打廣告主合作,以便獲得宏大的經(jīng)濟(jì)效益。微博運營商的這種商業(yè)至上邏輯,也為輿情檢索帶來了一定困難。如著名的微博Twitter公司,前段時間為了商業(yè)利益,在數(shù)據(jù)訪問與控制上所做的規(guī)定便引發(fā)了廣泛爭議。為保障本身商業(yè)利益,Twitter公司直接從其公共信息流出口〔fire-hose〕鎖定開發(fā)者與研究者對Twitter信息的訪問權(quán)限,削減其自由和公開的微博信息歸檔服務(wù),同時同Gnip〔一家向客戶收取高容量APITwitter帖子訪問費用以獲取商業(yè)利潤的公司〕建立壟斷性的內(nèi)容許可協(xié)議。2020年8月,為響應(yīng)最新發(fā)布的API規(guī)則,Twitter公司進(jìn)一步發(fā)布在一定條件下API使用與可用性的顯著限制[1]6.在中國,由于技術(shù)原因,新浪微博API則經(jīng)常處在測試階段,不但提供開放的大數(shù)據(jù)內(nèi)容不全面,而且在輿情檢測時,由于查詢結(jié)果在返回的最大數(shù)量及調(diào)用頻率等方面的眾多限制,難以為輿情研究提供全面、完好與系統(tǒng)、可靠的大數(shù)據(jù)。3.微博輿情檢索工具缺乏在微博輿情搜集方面,國外已經(jīng)出現(xiàn)像Gnip這樣專門針對Twitter大數(shù)據(jù)搜集的公司與機(jī)構(gòu),在中國當(dāng)前專門針對微博搜集的商業(yè)機(jī)構(gòu)尚不多見。國外微博輿情搜索與分析系統(tǒng)工具一般為研究者自行研究設(shè)計而成,如OpinionFinderlexicon、Twitinfo等。很多工具性能優(yōu)越,技術(shù)先進(jìn)。國內(nèi)微博輿情大數(shù)據(jù)研究系統(tǒng)工具有See、Scool等。由于從事微博輿情研究人員當(dāng)前多為人文學(xué)科或媒體從業(yè)人員,很少缺計算機(jī)與信息學(xué)科的專業(yè)人士,因而很難針對微博輿情研究,設(shè)計出適用的工具軟件。從大數(shù)據(jù)存儲檢索系統(tǒng)缺陷到微博大數(shù)據(jù)訪問權(quán)限,再到輿情檢索的工具限制能夠看出,當(dāng)下微博輿情研究在大數(shù)據(jù)檢索、分析方面并不能伸縮如意,某種程度上,大數(shù)據(jù)提供的是一種烏托邦式的工具依靠與技術(shù)夢幻想象。二、大數(shù)據(jù)檢索中的數(shù)據(jù)鴻溝與分析裂痕大數(shù)據(jù)的龐雜和混亂、獲取與分享權(quán)限,加劇了微博輿情使用的技術(shù)鴻溝。1.大數(shù)據(jù)增加錯誤發(fā)現(xiàn)的風(fēng)險統(tǒng)計學(xué)家與計算機(jī)學(xué)者指出,憑借龐大的數(shù)據(jù)集與細(xì)?;瘻y量,大數(shù)據(jù)正不斷增加錯誤發(fā)現(xiàn)的風(fēng)險。斯坦福大學(xué)著名統(tǒng)計學(xué)教授黑斯蒂〔TrevorHastie〕講,假如在大規(guī)模數(shù)據(jù)稻草堆中尋找一根有意義的針,其問題是稻草堆中有過多稻草像針一樣[7].除檢索外,微博輿論中各種帖子、表情符號、圖片等半構(gòu)造、非構(gòu)造數(shù)據(jù)的增加,在累積各種信息指標(biāo)同時也會導(dǎo)致錯誤信息增加。除此之外輿論事件中,大數(shù)據(jù)信息的增加,也增添了特定主題帖子的挖掘難度與分析的不確定程度。由于對某個熱門事件輿情信息挖掘、分析、預(yù)判,通常會使用計算機(jī)與數(shù)學(xué)模型,然而,這些模型所提供的總體性分析就像文學(xué)中的隱喻,是對微博輿論事件解釋的簡化與簡版。這種模型或許能夠點出微博輿論中用戶之間的互相關(guān)系,并在大數(shù)據(jù)解析基礎(chǔ)上得出相應(yīng)推論,但這種推論往往會有失真實與偏頗。2.信息孤島導(dǎo)致數(shù)據(jù)分析鴻溝微博輿情研究的最大誘惑是全數(shù)據(jù)視角,但現(xiàn)實中,人為因素與技術(shù)限制,讓這種誘因成為畫餅。處于技術(shù)嗜好與利益考慮,每個微博API平臺資料開放都有限度,作為外部輿情研究者,除非能克制經(jīng)濟(jì)壓力完成所有的數(shù)據(jù)購買,否則很難完全訪問微博平臺所有原始數(shù)據(jù)。即使有微博API宣稱公開開放所有數(shù)據(jù),也不能肯定它們所謂的所有數(shù)據(jù)包含了全部輿情信息。以著名微博公司Twitter為例,理論上看,Twitter的流信息庫〔firehose〕除了包含隱私以及受私人保衛(wèi)的微博之外,能提供所有公開發(fā)布的帖子,然而,事實上一些公開發(fā)布的帖子仍然遺漏在流信息庫之外。其原因就在于TwitterAPI對所有帖子采取的是任意數(shù)據(jù)抽樣,或從特定的網(wǎng)絡(luò)數(shù)據(jù)圖中每小時僅抽取開始的幾千個Twitter帖子作為樣本[8].中國的微博平臺在所公開的資料提取與供應(yīng)方面同樣如此,所以,對微博輿情研究者來講,很難斷定自個用于分析的微博大數(shù)據(jù)在質(zhì)量上能否可信與可靠。除此之外,很多微博媒介平臺限制數(shù)據(jù)集分享,也讓研究者很難將獲取的資料同其他研究團(tuán)隊做比照分析[1]7,8.從平臺角度看,當(dāng)下的微博輿情搜集僅聚焦于一些主要的微博社交平臺,國外主要是面薄〔facebook〕與Twitter〔Twitter〕,國內(nèi)則是新浪、騰訊、搜狐及網(wǎng)易。對于一些影響宏大、事關(guān)全國乃至世界性的熱門事件來講,即便每個微博平臺能提供千百萬的帖子量,其資料搜集范圍相對于整體媒介范圍來講仍然顯小。況且,不同的數(shù)據(jù)平臺經(jīng)常做人為的數(shù)據(jù)分割,如中國新浪、網(wǎng)易、騰訊、搜狐四家微博平臺的數(shù)據(jù)檢索各自為政,互不共享,從微博輿情研究看,這必然會構(gòu)成web2.0時代的大數(shù)據(jù)分析鴻溝.3.信息精度影響輿情分析和預(yù)測的準(zhǔn)確度微博輿情研究的另一個問題,也許同大數(shù)據(jù)數(shù)量無關(guān),而同大數(shù)據(jù)信息本身有關(guān)。首先,微博用戶與所有的社會不是等價物,微博輿論代表廣泛民意,但不等同與社會的全部民意。其次,微博賬戶也不等價于現(xiàn)實中的微博用戶,如有的單個微博用戶擁有多個賬戶,也有多個微博用戶共同擁有同一個賬戶。再次,那些沒有微博賬戶的人能夠通過網(wǎng)站訪問微博,并通過機(jī)器人〔bot〕將自個的帖子在微博平臺上群發(fā)。最后,微博平臺上的活潑踴躍用戶并非都是言論活潑踴躍分子,Twitter公司揭露有40%的活潑踴躍用戶登錄微博僅僅僅是為了收看??磥?,用戶、介入及活潑踴躍度三者之間的關(guān)系仍需要仔細(xì)研究[1]662-679.這講明,微博用戶的數(shù)量、帖子的多寡、言論的代表度,都只最大限度地呈現(xiàn)了輿情的局部真實,并不能代表社會的輿論全部。在微博輿情檢索方面,當(dāng)前也存在對大數(shù)據(jù)選擇性棄用現(xiàn)象。微博大數(shù)據(jù)中除文本信息之外,圖片、影像在輿論活動中的介入度正急劇上漲,無論是宜黃拆遷事件中當(dāng)事人鐘九如通過微博發(fā)布圖片影像維權(quán),還是楊達(dá)才表哥在交通事故處理中的微笑臉譜展示,再到雷政富不雅視頻事件在微博中的不脛而走,圖片與圖像在激發(fā)與助推輿論發(fā)展中,都是致命的大殺器.但在現(xiàn)實中,當(dāng)代大數(shù)據(jù)檢索與分析技術(shù),只注重分析哪些容易處理的文本信息,卻很難挖掘與處理這些圖片、影像乃至超鏈接等非構(gòu)造化數(shù)據(jù),因而在輿論研究中,這些非構(gòu)造化數(shù)據(jù)經(jīng)常遭到輿情大數(shù)據(jù)研究者的拋棄與輕視,進(jìn)而人為造成微博輿情研究中的選擇性使用與分析現(xiàn)象。三、大數(shù)據(jù)隱私與安全微博輿情研究中,大數(shù)據(jù)安全主要表如今輿論暴力、隱私侵權(quán)與數(shù)據(jù)壟斷三個層面。1.大數(shù)據(jù)使用存在泄露隱私隱患隨著人工智能與計算機(jī)技術(shù)發(fā)展,建立在云端基礎(chǔ)上的大數(shù)據(jù)挖掘與智能動態(tài)分析愈來愈強(qiáng)。但道高一尺、魔高一丈,任何技術(shù)的發(fā)展都無法完全彌補(bǔ)技術(shù)發(fā)展漏洞,微博API應(yīng)用接口的訪問密鑰限制,微博大數(shù)據(jù)在數(shù)據(jù)存儲與管理控制方面的缺陷與缺乏,經(jīng)常會導(dǎo)致信息的泄漏,十分是隱私信息。據(jù)IDC統(tǒng)計:2018年僅有不到1/3的數(shù)據(jù)需要保衛(wèi),到2020年這一比例將超過2/5;2020年的統(tǒng)計顯示,固然有35%的信息需要保衛(wèi),但實際得到保衛(wèi)的不到20%[9].數(shù)據(jù)安全缺失在微博輿情領(lǐng)域通常會導(dǎo)致侵犯別人隱私,甚至產(chǎn)生輿論暴力行為。人肉搜索濫用就是典型之一,很多微博輿論突發(fā)事件中當(dāng)事人〔十分是負(fù)面當(dāng)事人〕的信息成為人肉搜索的對象,如周久耕事件及陜西房姐事件等,當(dāng)事人隱私在人肉搜索面前暴露無遺。固然這些輿論事件中的當(dāng)事人存在負(fù)面形象,但輿論的結(jié)果正義不能掩蓋程序正義,對輿論中負(fù)面當(dāng)事人隱私信息的非法人肉獲取仍然值得整個社會的理性認(rèn)識與警醒。同樣,突發(fā)事件中微博輿論的一邊倒也不能昭示對輿論負(fù)面當(dāng)事人的隱私信息人肉獲取的合法。廣東房嬸事件就是反例,由于信息泄露,房嬸飽受輿論暴力蹂躪。好在司法機(jī)關(guān)最后證明輿論錯誤,還房嬸以清白,但輿論當(dāng)事人房嬸由于數(shù)據(jù)泄露,所導(dǎo)致的眾口鑠金、積毀銷骨之疼,恐難在短時間內(nèi)消退。2.大數(shù)據(jù)安全問題阻礙輿情信息獲取由于很難區(qū)分公眾信息與個人隱私信息邊界,大數(shù)據(jù)導(dǎo)致的信息泄漏很可能導(dǎo)致微博運營商由于擔(dān)憂隱私侵權(quán),在搜集和提供輿情大數(shù)據(jù)集時愈加慎重,在向輿情研究者甚至是輿情研究數(shù)據(jù)分享合作者提供大數(shù)據(jù)集時,更趨向小心與保守,這也必然會增加一般輿情研究者在微博輿情研究時輿情數(shù)據(jù)的獲取難度。除此之外計算機(jī)與人工智能先發(fā)優(yōu)勢,也導(dǎo)致社會法制管理總是相對滯后。針對大數(shù)據(jù)管理,歐盟在2020年1月對舊的數(shù)據(jù)保衛(wèi)條例進(jìn)行修改,并發(fā)布了新的數(shù)據(jù)搜集與保衛(wèi)條例,但大數(shù)據(jù)海嘯仍然讓這些新條例在管理方面難以為繼。美國也于2020年3月29日,推出了大數(shù)據(jù)研究與開發(fā)計劃,但大數(shù)據(jù)隱私與信息安全仍然是個難題。此前的維基解密事件與棱鏡門事件,就從某種角度講明了問題的嚴(yán)重性。大數(shù)據(jù)信息安全對微博輿情研究而言所產(chǎn)生的隱憂是:對大數(shù)據(jù)管理失效,很有可能導(dǎo)致矯枉過正,引發(fā)愈加嚴(yán)厲的言論與信息管理措施,這對微博輿論健康發(fā)展來講未必有益。3.大數(shù)據(jù)壟斷誤導(dǎo)輿論選擇以微博為主的社交媒介為研究人們?nèi)粘P袨樘峁┝舜髷?shù)據(jù)樣本,但對大數(shù)據(jù)樣本的使用權(quán)限和能力,不同的個人、群體和組織是不同的。大數(shù)據(jù)能夠為公眾謀福,可以能成為老大哥的另一版本,造成大數(shù)據(jù)使用與分析的壟斷?;ヂ?lián)網(wǎng)哲學(xué)家耶夫根尼莫洛佐夫警告講,大數(shù)據(jù)使用不當(dāng)會導(dǎo)致算法的專制,對于如今很多大數(shù)據(jù)應(yīng)用背后的理念,他持批評態(tài)度。微博輿情研究中,大數(shù)據(jù)帶來的好處是輿情信息的獲取愈加全面;壞處是大數(shù)據(jù)壟斷有可能讓某些信息壟斷者有時機(jī)對微博輿論帖子內(nèi)容進(jìn)行選擇性提供與使用,進(jìn)而導(dǎo)致輿情誤判。更有甚者,如立二拆四、秦火火之流,利用微博大數(shù)據(jù)技術(shù),傳播謠言,制造輿論假象,以謀取私利。凡此種種,講明大數(shù)據(jù)技術(shù)在輿情研究上帶來便利與革新的同時,也帶來了弊端與隱憂。四、微博輿情研究中的大數(shù)據(jù)反思大數(shù)據(jù)技術(shù)雖不成熟,在發(fā)展中存在眾多弊端,但畢竟為微博輿情研究領(lǐng)域帶來了重大思想啟蒙與影響。微博輿情研究中,不能由于擔(dān)憂它成為利維坦,就拒斥其在研究中所帶來的技術(shù)福音。理性的態(tài)度應(yīng)是:明辨其利弊,在使用的經(jīng)過中從各方面不斷完善與改良。首先,大數(shù)據(jù)技術(shù)的進(jìn)步與成熟需要國家社會政策扶持及全社會的高度重視。在美國,大數(shù)據(jù)技術(shù)早已上升為國家戰(zhàn)略,2020年美國發(fā)動了一場大數(shù)據(jù)發(fā)展的全民總發(fā)動,美國撥款2億美元啟動大數(shù)據(jù)研究和發(fā)展建議計劃。與此同時,美國國家科學(xué)基金會〔NSF〕等部門和機(jī)構(gòu)承諾,將投入超過2億美元資金用于研發(fā)從海量數(shù)據(jù)信息中獲取知識所必需的工具和技能.在美國的鼓勵下,美國企業(yè)與個人也爭先恐后投入大數(shù)據(jù)的開發(fā)與研究,讓大數(shù)據(jù)技術(shù)深耕于美國社會的各個層面。在中國,層面也比擬重視大數(shù)據(jù)技術(shù),如2020年以來,科技部、發(fā)改委、工信部等部委在研發(fā)、探尋求索和產(chǎn)業(yè)化專項上,陸續(xù)支持了一批大數(shù)據(jù)項目。上海有大數(shù)據(jù)研發(fā)三年行動計劃,廣東有大數(shù)據(jù)戰(zhàn)略工作方案,陜西有大數(shù)據(jù)科學(xué)園區(qū),中關(guān)村還有大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟.但總體看,中國大數(shù)據(jù)技術(shù)研發(fā)還缺乏國家層面的清楚明晰戰(zhàn)略規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論