第五章-新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析_第1頁
第五章-新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析_第2頁
第五章-新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析_第3頁
第五章-新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析_第4頁
第五章-新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C新媒體數(shù)據(jù)分析概述新媒體數(shù)據(jù)采集新媒體數(shù)據(jù)預處理新媒體數(shù)據(jù)分析之文本分析新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析新媒體數(shù)據(jù)可視化新媒體數(shù)據(jù)分析與應用實例目錄/Contentse7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C目錄/Contents5.新媒體數(shù)據(jù)分析概述5.1在線社交網(wǎng)絡分析概述5.1.1在線社交網(wǎng)絡分析的含義與特征5.1.2在線社交網(wǎng)絡分析的基本內(nèi)容5.2在線社交網(wǎng)絡結構特征與分析基礎5.2.1在線社交網(wǎng)絡的數(shù)學表達式5.2.2在線社交網(wǎng)絡的統(tǒng)計特性5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性5.3中心性分析5.3.1度中心性(DegreeCentrality)5.3.2中介中心度(Betweennesscentrality)5.3.3接近中心度(Closenesscentrality)5.4虛擬社區(qū)發(fā)現(xiàn)5.4.1在線社區(qū)5.4.2模塊度5.5個體影響力分析5.5.1基于網(wǎng)絡結構的個體影響力分析5.5.2基于行為的個體影響力分析5.5.3基于話題的個體影響力分析5.6SPSS社交網(wǎng)絡分析概述5.6.1GA(GroupAnalysis)5.6.2DA(DiffusionAnalysis)e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5Cxyma_mail@163.com新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析馬曉悅第五章e7d195523061f1c01da5a1f0837ac25283df40ff0a16bfd61AE6AB84AD7EB485CA8019BF267F2027DE2BF09650313B56A435BB3664F8B916CA3777391AC088C283181605E184D6D6879568EB73EB808A103F0784C8DFC3E9CDD14B61FDDA6A8A6237D2DFE3BBAEC8979D824A43E015648F6CB3D1F8D3E352A4BDC9925C075CFF312C4A0BE75FDF5C本章學習目標了解新媒體在線社交網(wǎng)絡分析的概念及其結構特征。了解新媒體在線社交網(wǎng)絡分析的方法。掌握新媒體在線社交網(wǎng)絡度量的指標。了解新媒體在線社交網(wǎng)絡中虛擬社區(qū)發(fā)現(xiàn)的相關算法。了解基于新媒體在線社交網(wǎng)絡分析的個體影響力度量方法。案例2019年1月,一篇發(fā)表在NatureHumanBehaviour上的論文發(fā)現(xiàn),僅僅通過分析線上好友的推文數(shù)據(jù),特別是其中的互動,就有可能預測一個人在社交媒體上未來的行為。論文作者Bagrow,Liu和Mitchell來自美國佛蒙特大學佛蒙特復雜系統(tǒng)中心。通過分析上萬名Twitter用戶及其好友的數(shù)據(jù),研究者發(fā)現(xiàn):對用戶行為的預測準確率存在上限(64%),不過僅僅利用好友們的推文數(shù)據(jù),就可以達到預測上限的95%。這意味著即使你從不發(fā)推文,但通過分析你的好友,就能預測出你是怎樣的人。而且如果朋友在推文中@了你,或者你在朋友推文下面有互動留言,那么預測會更準確!甚至,只需要使用9個好友的推文數(shù)據(jù)來做分析,對你下一條推文做預測,就比用你個人歷史推文數(shù)據(jù)來預測還要準確!5.1在線社交網(wǎng)絡分析概述在線社交研究的內(nèi)容是各種看上去互不相同的復雜網(wǎng)絡之間的共性和處理它們的普適方法。通過研究在線社交網(wǎng)絡能夠在學科、內(nèi)容之間架起溝通的橋梁,使得對某一個網(wǎng)絡的研究也有可能對另一種網(wǎng)絡的研究起到借鑒作用。隨著計算機技術和社交網(wǎng)絡的不斷發(fā)展,在線社交網(wǎng)絡已經(jīng)成為一把雙刃劍:一方面它為人類的生產(chǎn)生活帶來了極高的便利,極大地縮減了人類獲取信息、分享信息的成本;另一方面,它也為人類的生活帶來了負面沖擊,比如謠言傳播、不良信息傳播、個人隱私泄露等。因此,在線社交網(wǎng)絡的研究顯得尤為重要,這就要求相關從業(yè)者和相關學習人員需要對在線社交網(wǎng)絡這種復雜網(wǎng)絡有更好的認識和研究,去迎接未來更大的挑戰(zhàn)。5.1.1在線社交網(wǎng)絡分析含義與特征一個在線社交網(wǎng)絡就是一群人或者某些團體按照某種關系一起構成的一個系統(tǒng)。這種關系可以是多種多樣的,如主播與粉絲關系、相同影視愛好者關系、學生教師在線交流關系。提及在線社交網(wǎng)絡,首先要提及的是“復雜網(wǎng)絡”這一概念。錢學森對于復雜網(wǎng)絡的嚴格定義是:具有自組織、自相似、自吸引、小世界、無標度中部分或者全部性質的網(wǎng)絡。新媒體中的在線社交網(wǎng)絡是復雜網(wǎng)絡的一個子集。在線社交網(wǎng)絡分析(OnlineSocialNetworkAnalysis)涉及信息學、數(shù)學、社會學、心理學、管理學、計算機科學等多個學科的理論基礎與實踐方法,是為了理解新媒體中用戶社交關系的形成、分析用戶行為特點、追蹤新媒體中信息傳播規(guī)律的一種跨學科的科學方法。1在線社交網(wǎng)絡的含義5.1.1在線社交網(wǎng)絡分析含義與特征Facebook全球友誼圖5.1.1在線社交網(wǎng)絡分析含義與特征抽象來說,在線社交媒體是由作為節(jié)點的新媒體用戶和由這些用戶的在線社交關系所表示的邊所構成的集合。新媒體用戶是在線社交媒體中的節(jié)點,具有主觀性、能動性、復雜性等特征;新媒體用戶之間的在線社交關系是連接這些用戶的橋梁,其中用戶之間關系的差異可以由連接邊的權重進行辨析。5.1.1在線社交網(wǎng)絡分析含義與特征(1)迅捷性:依托于成熟的網(wǎng)絡設施及用戶對于訪問信息資源速度、相互溝通速度需求的提高,迅捷性是在線社交網(wǎng)絡最為顯著的特征。(2)平等性:新媒體時代是用戶自我產(chǎn)生內(nèi)容、消費內(nèi)容的時代,網(wǎng)絡“中心”這一角色被進一步弱化。在線社交媒體網(wǎng)絡中用戶之間的地位是平等的。(3)自組織性:在線社交媒體網(wǎng)絡中用戶通過興趣愛好、共同利益等需求聯(lián)合成為一個虛擬社區(qū)網(wǎng)絡,呈現(xiàn)出較強的自我組織特性。(4)結構復雜性:在線社交網(wǎng)絡在結構上錯綜復雜、極其混亂,而且其連接結構可能隨時間實時變換。(5)相互作用性:在線社交網(wǎng)絡的相互作用性體現(xiàn)在節(jié)點之間、網(wǎng)絡之間的相互影響。2在線社交網(wǎng)絡的特征5.1.2在線社交網(wǎng)絡分析的基本內(nèi)容在線社交網(wǎng)絡結構特征分析是指利用統(tǒng)計學變量及相關指標對于社交網(wǎng)絡的規(guī)模、特性、范圍等進行量化分析和計算。圖(Graph)提供了一種抽象的“點”和“邊”表示實際網(wǎng)絡的方法,且其方便于相關的數(shù)學運算,因此其成為目前研究復雜網(wǎng)絡乃至在線社交網(wǎng)絡的一種共同的語言。這種抽象表示的優(yōu)點在于通過圖的研究可以得到實際在線社交網(wǎng)絡的拓撲性質(Topologicalproperty)。1在線網(wǎng)絡結構特征與分析當歐拉在1736年訪問普魯士的哥尼斯堡(現(xiàn)俄羅斯加里寧格勒)時,他發(fā)現(xiàn)當?shù)氐氖忻裾龔氖乱豁椃浅S腥さ南不顒?。哥尼斯堡城中有一條名叫Pregel的河流橫穿而過,這項有趣的消遣活動是在星期六作一次走過所有七座橋的散步,每座橋只能經(jīng)過一次而且起點與終點必須是同一地點。5.1.2在線社交網(wǎng)絡分析的基本內(nèi)容中心性在在線社交網(wǎng)絡中的初衷是為了表示邊和點的重要度。在圖中,如果去除某個點使得這個圖由連通變得不連通,那么該店就稱為割點(Cut-Vertext),如果去抽某個邊使得圖由連通變?yōu)椴贿B通,那么這條邊就稱為橋(Bridge)。這些特性使得這些邊和點在圖中的重要性不言而喻,同樣的概念也適用于在線社交網(wǎng)絡,但是規(guī)模復雜的在線社交網(wǎng)絡因為其去中心化的特性,往往不能通過取消單個點對網(wǎng)絡的特性進行改變,所以在線社交網(wǎng)絡關注于去除點的比例、抑或度分布這樣的概念。2在線社交網(wǎng)絡中心性分析5.1.2在線社交網(wǎng)絡分析的基本內(nèi)容雖然在線社交網(wǎng)絡較之簡單的圖來說具有明顯的去中心化特征,但是網(wǎng)絡紅人、博主這類的巨大網(wǎng)絡節(jié)點同樣是存在的。這些“紅人節(jié)點”有的具有正面社會價值觀,贏得廣泛的用戶喜愛;有的因其爭議性行為引起社會的廣泛關注。不論如何,這些節(jié)點對于整個在線社交網(wǎng)絡的影響都是不可忽視的,小到電商廣告的推送、在線購物營銷,大到輿論傳播、謠言傳播都有這些節(jié)點的身影。因此如何度量一個節(jié)點的影響力就是在線社交網(wǎng)絡中至關重要、不可或缺的內(nèi)容之一。3在線社交網(wǎng)絡中的個體影響力分析5.2社交網(wǎng)絡結構特征與分析基礎在線社交網(wǎng)絡是由節(jié)點與節(jié)點之間的聯(lián)系——邊,構成的一種復雜網(wǎng)絡。對于在線社交網(wǎng)絡進行分析首先要考慮如何定義與表達網(wǎng)絡,其次則要考慮網(wǎng)絡基本的統(tǒng)計特性,最后則要從網(wǎng)絡的整體特性出發(fā)考慮如何量化分析網(wǎng)絡的網(wǎng)絡特性。5.2社交網(wǎng)絡結構特征與分析基礎研究圖的系列概念和方法被稱為圖論。圖論雖然已經(jīng)有很長的歷史,但是在學術界并沒有形成完全統(tǒng)一的概念及術語。目前普遍接受的關于圖的定義是:圖是物件與物件之間的關系表示的數(shù)學對象。一個具體的網(wǎng)絡可以將其抽象為一個由點V集合和邊E集合組成的圖G=(V,E),頂點的數(shù)量記作N,邊的數(shù)量記作M。其中,E中的每條邊都有V中的一對點與之對應。1圖及其定義5.2.1在線社交網(wǎng)絡的數(shù)學表達式按照圖中是否有方向和邊是否有權重可以將圖分為4種2圖的種類5.2.1在線社交網(wǎng)絡的數(shù)學表達式(1)加權有向圖中的邊是有權重的,點與點之間的關系具有方向,很多現(xiàn)實中的實際網(wǎng)絡都是加權有向圖,例如交通網(wǎng)絡,其方向是道路的實際方向,權重為道路負荷量。(2)加權無向圖是無方向但有權重的圖,可以將其理解為全是雙向車道公路,節(jié)點之間沒有方向關系,但是其邊的權重是已知的。無向圖可以按照實際需求直接構建,也可以由有向圖轉化得來。(3)無權有向圖顧名思義就是圖中只有點與點之間的指向關系,并不包括邊的權重。無權有向圖的另一種理解思路是認為圖中權重處處相等(可以假設其均為1)。5.2.1在線社交網(wǎng)絡的數(shù)學表達式無權有向圖可以由加權有向圖轉化而來,這是一種數(shù)據(jù)離散化常用的方法——設置閾值也叫賦閾值,即通過實際情況和研究需求對于邊之間的權重設置閾值。(3)無權有向圖顧名思義就是圖中只有點與點之間的指向關系,并不包括邊的權重。無權有向圖的另一種理解思路是認為圖中權重處處相等(可以假設其均為1)。5.2.1在線社交網(wǎng)絡的數(shù)學表達式除了上述圖的概念和分類外,另一個需要各位讀者注意的概念是完全圖Kn,簡單來說,完全圖的“完全”體現(xiàn)在所有點之間均有邊進行連接,所以其邊的數(shù)量為:N*(N-1)/2。(4)無權無向圖中,圖中邊的權,點之間的指向都不被包括。無權無向圖既可以通過無權有向圖進行對稱化得到,也可以通過加權無向圖進行賦閾值得到,方法與上述方法相同。5.2.1在線社交網(wǎng)絡的數(shù)學表達式在分析在線社交網(wǎng)絡時面臨的首要問題就是如何在計算機中表示一個網(wǎng)絡。最常用的基本方式就是鄰接矩陣。3鄰接矩陣鄰接矩陣分為有向圖鄰接矩陣和無向圖鄰接矩陣。對無向圖(無向簡單圖)而言,鄰接矩陣一定是對稱的,而且對角線一定為零,有向圖則不一定如此5.2.2在線社交網(wǎng)絡的統(tǒng)計特性在線社交網(wǎng)路網(wǎng)絡的統(tǒng)計特性包括其路徑的表征、網(wǎng)絡中的度分布、網(wǎng)絡的冪律分布1路徑有路徑連接才有網(wǎng)絡。因此對于一個網(wǎng)絡,最先吸引研究者注意的內(nèi)容就是該網(wǎng)絡的路徑連接情況:該網(wǎng)絡是否是一個整體?如何確定兩個網(wǎng)絡之間是否直接或者間接地相連?繼續(xù)采取前面的符號設定:網(wǎng)絡表示為G=(V,E)。5.2.2在線社交網(wǎng)絡的統(tǒng)計特性路徑可以被定義如下:(1)路徑:無向圖G中的一條路徑是指在一個特定的點系列P(v1,v2,v3,v4)中,其中每一對相鄰的點之間都有一條邊。P也成為從v1到v4的一條路徑,路徑的長度即為路徑所包含的邊的數(shù)目,如圖所示5.2.2在線社交網(wǎng)絡的統(tǒng)計特性(2)回路:起點與終點重合的路徑稱為回路。(3)簡單路徑:各個頂點都互不相同的路徑被稱為簡單路徑。(4)圈:將滿足如下定義的路徑稱為圈——①點數(shù)量K>2;②K-1個點互不相同;③起點與終點相同。5.2.2在線社交網(wǎng)絡的統(tǒng)計特性2度與度分布在線社交網(wǎng)絡中,與點連接的邊的個數(shù)稱為該點的度。網(wǎng)絡中所有節(jié)點的度的平均值,即網(wǎng)絡節(jié)點的平均度(k)把網(wǎng)絡中節(jié)點的度按從小到大排序,從而統(tǒng)計得到度為k的節(jié)點占整個網(wǎng)絡節(jié)點數(shù)的比例P(k)5.2.2在線社交網(wǎng)絡的統(tǒng)計特性無向網(wǎng)絡的度分布P(k)定義為網(wǎng)絡中一個隨機選擇的節(jié)點的度為k的概率。有向網(wǎng)絡的出度分布(Out-degreedistribution)P(kout)定義為網(wǎng)絡中隨機選的一個節(jié)點的出度為k的概率;入度分布(In-degreedistribution)P(kin)定義為網(wǎng)絡中隨機選取的一個節(jié)點的入度為k的概率3冪律分布服從正態(tài)分布的隨機變量具有一個明顯的特征標度——鐘形曲線的峰值(即隨機變量的均值)。以人的身高為例,假設全球成年男子的平均身高為1.75米,那么絕大多數(shù)成年男子的身高應該都與1.75米相差不遠,例如在1.65米到1.85米之間。我們從未在大街上見過身高低于50厘米的“小矮人”,或高于3米的“巨人”。因此,全球成年男子的身高分布具有鐘形曲線的形狀是合理的。5.2.2在線社交網(wǎng)絡的統(tǒng)計特性Barabasi小組1999年9月在《Nature》上發(fā)表了一篇文章,指出WWW的出度分布和入度分布都與正態(tài)分布有很大不同,而是服從冪律分布其中,γ為冪指數(shù),通常取值在2與3之間判斷一個網(wǎng)絡的度分布P(k)是否為冪律分布,有一個看上去很簡單的方法就是雙對數(shù)坐標系。直觀上,如果根據(jù)給定的數(shù)據(jù),在雙對數(shù)坐標系中看到近似有一條直線,那么就可以推斷所處理的數(shù)據(jù)近似符合冪律,并且可以從該直線的斜率得到對應的冪指數(shù)(為什么)5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性1.網(wǎng)絡連通性在線社交網(wǎng)絡的連通性一般包括三類:強連通、單向連通、弱連通(1)強連通:指一個有向圖G中任意兩點v1、v2間存在v1到v2的路徑及v2到v1的路徑。(2)單向連通:如果有向圖中,對于任意節(jié)點v1和v2,至少存在從v1到v2和從v2到v1的路徑中的一條,則原圖為單向連通圖。(3)弱連通:將有向圖的所有的有向邊替換為無向邊,所得到的圖稱為原圖的基圖。如果一個有向圖的基圖是連通圖,則有向圖是弱連通圖5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性1.網(wǎng)絡連通性實際上,大規(guī)模在線社交網(wǎng)絡(有向網(wǎng)絡)既不是強連通也不是弱連通的,而是由一個包含了網(wǎng)絡中相當部分節(jié)點的很大的弱連通片組成,稱為弱連通巨片5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性1.網(wǎng)絡連通性(1)強連通核(Stronglyconnectedcore,SCC):也稱為強連通巨片,位于網(wǎng)絡的中心。SCC中任意兩個節(jié)點之間都是強連通的,即存在從任一節(jié)點到另一節(jié)點的有向路徑。(2)入部(IN):包含那些可以通過有向路徑到達SCC但不能從SCC到達的節(jié)點。也就是說,一定存在從IN中任一節(jié)點到SCC中任一節(jié)點的有向路徑;反之,從SCC中任一節(jié)點出發(fā)沿著有向邊都無法到達IN中的一個節(jié)點。(3)出部(OUT):包含那些可以從SCC通過有向路徑到達但不能到達SCC的節(jié)點。也就是說,一定存在從SCC中任一節(jié)點到OUT中任一節(jié)點的有向路徑;反之,從OUT中任一節(jié)點出發(fā)沿著有向邊都無法到達SCC中的一個節(jié)點。從IN中任一節(jié)點到OUT中任一節(jié)點必然存在有向路徑,而且該路徑必經(jīng)過SCC中的某些節(jié)點。5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性1.網(wǎng)絡連通性(4)卷須(Tendrils):包含那些既無法到達SCC也無法從SCC到達的節(jié)點。對于掛在IN上的任一卷須節(jié)點,必至少存在一條從IN中某一節(jié)點到該節(jié)點的不需經(jīng)過SCC的有向路徑;對于掛在OUT上的任一卷須節(jié)點,必至少存在一條從該節(jié)點到OUT中某一節(jié)點的不需經(jīng)過SCC的有向路徑。此外,還有可能存在從掛在IN上的卷須節(jié)點到掛在OUT上的卷須節(jié)點的不經(jīng)過SCC的有向路徑,這些串在一起的卷須節(jié)點稱為管子(Tube)5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性2.網(wǎng)絡稀疏性在線社交網(wǎng)絡密度定義為該網(wǎng)絡中實際的變數(shù)與該節(jié)點下能夠連接的最大邊數(shù)的比值:一個包含N個節(jié)點的網(wǎng)絡的密度(Density)ρ定義為網(wǎng)絡中實際存在的邊數(shù)M與最大可能的邊數(shù)之比對應地,對于有向網(wǎng)絡密度只要取消上式分母中的1/2即可。實際的大規(guī)模網(wǎng)絡的一個通有特征就是稀疏性:網(wǎng)絡中實際存在的邊數(shù)要遠小于最大可能的邊數(shù)5.2.3在線社交網(wǎng)絡的網(wǎng)絡特性2.網(wǎng)絡稀疏性在分析網(wǎng)絡模型時,如果當N→∞時網(wǎng)絡密度趨于一個非零常數(shù),就表明網(wǎng)絡中實際存在的邊數(shù)是N2同階的,那么我們就可以認為該網(wǎng)絡是稠密的;此時,鄰接矩陣中非零元素的比例也會趨于一個常數(shù)。而如果當N→0時網(wǎng)絡密度趨于零或者網(wǎng)絡平均度趨于一個常數(shù),就表明網(wǎng)絡中實際存在的邊數(shù)是比N2低階的,那么該網(wǎng)絡就是稀疏的;此時,鄰接矩陣中非零元素的比例也會趨于零。5.3中心性分析節(jié)點和邊共同構成了社交網(wǎng)絡,相同數(shù)量的節(jié)點與邊能夠組合出的網(wǎng)絡是多種多樣的。因此簡單的依賴邊與節(jié)點數(shù)量這樣的統(tǒng)計量很難對于一個網(wǎng)絡中節(jié)點與邊的關系進行清晰的量化分析。同時,社交網(wǎng)絡中不同的節(jié)點往往存在著不同的功能與地位。以微博網(wǎng)絡舉例,其中一般包含中心“大V”用戶、普通用戶等。為了量化研究社交網(wǎng)絡的上述特征,中心性(Centrality)及其相關概念被提出5.3.1度中心性(DegreeCentrality)1定義度中心性又叫點度中心性、連接中心度,顧名思義是一種度量一個點與其他點直接連接的總和的指標,是一種基礎的衡量節(jié)點在網(wǎng)絡之中的中心性的指標我們可以從微博粉絲數(shù)量的視角對其進行簡單的理解,假設在某個話題下內(nèi)有A,B兩名用戶,其中A有50名粉絲,B僅有25名粉絲,那么在該話題下A顯然比B具有更大的社交圈子、更廣泛的影響力、更具有“中心性”。這也就是度中心性的核心思想5.3.1度中心性(DegreeCentrality)1計算方法關于點A的度中心度的定義如下:點i的中心度即在圖中與點i直接相連接的點的個數(shù)與該網(wǎng)絡總節(jié)點N-1之比值如果點N具有最高的度數(shù)中心性,則點N位居在線網(wǎng)絡的中心,很可能擁有最大的影響力。由于度數(shù)中心性測量的依據(jù)是與該點直接相連接的點的個數(shù),且忽略了與該點間接相連接的點,所以上述定義的點度中心性可以稱為“局部中心度(localcentrality)”5.3.2中介中心度中介中心度(Betweennesscentrality)1定義假設在一個點對(pairofpoints)X和Z之間存在n條捷徑。一個點Y相對于點對X和Z的中間度(betweenness)指的是該點處于此點對的捷徑上的能力。用中間性比例(betweennessproportion)來刻畫這種能力5.3.2中介中心度2計算方法計算經(jīng)過一個點的最短路徑的數(shù)量。經(jīng)過一個點的最短路徑的數(shù)量越多,就說明它的中介中心度越高其中,i表示最短路徑編號,j表示經(jīng)過的點,Eij表示該點經(jīng)過的最短路徑如果一個大的社交網(wǎng)絡中包含了幾個小組,那么中介中心度高的人就起到將這些小組連接起來的作用5.3.2中介中心度接近中心度(Closenesscentrality)1定義一個點的絕對接近中心度(closenesscentrality)是該點與圖中所有其他點的捷徑距離之和(sumofdistance)。接近中心度考慮的是行動者在多大程度上不受其他行動者的影響。如果網(wǎng)絡中的一個行動者較少依賴于他人,此人就具有較高的中心度。一個點越是與其他點接近,該點就越不依賴于他人。5.3.2中介中心度接近中心度(Closenesscentrality)2計算方法其中,CCi表示節(jié)點i的接近度中心性,d(i,j)表示點i到點j之間的距離,n表示網(wǎng)絡中全部點的數(shù)量。接近中心度體現(xiàn)的是一個點與其他點的近鄰程度,也就是說,接近中心性可以定義為距離的倒數(shù)5.4個體影響力分析隨著互聯(lián)網(wǎng)的發(fā)展和自媒體等平臺的興起,針對社交網(wǎng)絡的個體影響力相關研究引起了國內(nèi)外學者廣泛的關注。發(fā)現(xiàn)社交網(wǎng)絡中的有影響力的個體是社交網(wǎng)絡研究中非常重要的研究分支,而且其有著重要的應用價值。例如,點子營銷、謠言檢測、輿情管理等。個體的影響力包括多種計算方法,其中最為直觀的便是基于網(wǎng)絡結構的個體影響力分析。其次包括基于個體行為的影響力分析、基于話題的個體影響力分析5.5.1基于網(wǎng)絡結構的個體影響力基于上述內(nèi)容,我們可以直接根據(jù)社交網(wǎng)絡的圖結構特性,使用中心度指標來衡量網(wǎng)絡中節(jié)點的影響力量。1.基于傳統(tǒng)網(wǎng)絡結構的影響力指標度中心度(DegreeCentrality):度中心度是指與該節(jié)點直接相連的節(jié)點的數(shù)量。接近中心度(ClosenessCentrality):指某節(jié)點與網(wǎng)絡中所有其他節(jié)點的最短距離之和。介數(shù)(BetweennessCentrality):介數(shù)用來衡量某節(jié)點在社交網(wǎng)絡中中介作用大小5.5.1基于網(wǎng)絡結構的個體影響力2.基于k-殼分解法的影響力分析k-殼分解法可以簡單理解為“剝洋蔥”,我們假設網(wǎng)絡中不存在度值為0的孤立節(jié)點。從度中心性的定義來說,度為1的節(jié)點就是網(wǎng)絡中最不重要的節(jié)點然后,我們將所有度值為1的節(jié)點以及與這些節(jié)點相連的邊都去掉,這時網(wǎng)絡中又會出現(xiàn)一些新的度值為1的節(jié)點,我們再將這些節(jié)點及其相連的邊去掉,重復這種操作,直至網(wǎng)絡中不再有度值為1的節(jié)點為止這種操作相當于剝?nèi)チ司W(wǎng)絡的最外面一層殼,我們就把所有這些被去除的節(jié)點以及它們之間的連邊稱為網(wǎng)絡的1-殼(1-shell)。有時,網(wǎng)絡中度為0的孤立節(jié)點也稱為0-殼(0-shell)因此,在剝?nèi)チ?-殼后的新網(wǎng)絡中的每個節(jié)點的度值至少為2最終,網(wǎng)絡中的每一個節(jié)點最后都被劃分到相應的k-殼中,就得到了網(wǎng)絡的k-殼分解。網(wǎng)絡中的每一個節(jié)點對應唯一的k-殼指標ki,并且ki-殼中所包含的節(jié)點的度值必然滿足k=ki有了k-殼分解,我們就可以得到一種基于度中心性的節(jié)點重要性的粗粒度劃分方法,來對在線社交網(wǎng)絡中的用戶重要性等進行評估5.5.2基于行為的個體影響力分析社交網(wǎng)絡中用戶的行為決定用戶的影響力,以微博為例,用戶主要表現(xiàn)的行為是評論、轉發(fā)、回復、點贊、復制、閱讀等,基于這些行為特征構建多種網(wǎng)絡關系圖,可通過隨機游走等方法發(fā)現(xiàn)網(wǎng)絡中的影響力個體1HITS(Hyperlink-InducedTopicSearch)算法HITS算法是由康奈爾大學(CornellUniversity)的JonKleinberg博士于1997年首先提出的,為IBM公司阿爾馬登研究中心(IBMAlmadenResearchCenter)的名為“CLEVER”的研究項目中的一部分HITS算法最初被用來評估網(wǎng)頁的重要性,其基本思想是:每個網(wǎng)頁的重要性有兩種刻畫指標——權威性(Authority)和樞紐性(Hub)。例如,當你要搜索某個機構時,從內(nèi)容的權威性角度看,該機構的主頁應該是最重要的。但是另一方面,某黃頁類型的網(wǎng)站包含了該機構主頁——即該網(wǎng)頁的功能就是給出各種機構的導航信息。那么該網(wǎng)頁就具有相對高的樞紐值,也就是說從該網(wǎng)頁能夠到達一些重要的權威

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論