版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
微博傳播網(wǎng)絡(luò)度分布模型研究
1基于無標(biāo)度網(wǎng)絡(luò)的信息傳播模型復(fù)雜網(wǎng)絡(luò)是研究自然界復(fù)雜系統(tǒng)的新方法。研究的起源可以追溯到18世紀(jì)的哲學(xué)家eula(歐洲)在研究“七橋問題”時創(chuàng)造的一種新的繪畫科學(xué)。20世紀(jì)60年代,erdos和renyi引入了隨機(jī)圖論來描述復(fù)雜網(wǎng)絡(luò)。1999年,watts和strogatz提出了小世界網(wǎng)絡(luò)模型。1999年,barbaasi和al伯茨發(fā)現(xiàn),網(wǎng)絡(luò)p(k)k-u)的分布隨網(wǎng)絡(luò)k的梯度變化規(guī)律減小,即p(k)k-u。網(wǎng)絡(luò)中的一些節(jié)點(diǎn)有很多連接點(diǎn),但大多數(shù)節(jié)點(diǎn)只有少數(shù)連接點(diǎn)。由于節(jié)點(diǎn)的異質(zhì)性,網(wǎng)絡(luò)的功能模式消失。barbaasi和al伯茨認(rèn)為網(wǎng)絡(luò)是無標(biāo)量的網(wǎng)絡(luò)。在文獻(xiàn)中,通常由barbaasi和al伯茨提出的無標(biāo)量網(wǎng)絡(luò)模型稱為ba模型。BA模型認(rèn)為增長和擇優(yōu)是網(wǎng)絡(luò)演化的兩條重要機(jī)理,二者缺一不可,否則無法生成無標(biāo)度網(wǎng)絡(luò)隨后一些學(xué)者在BA模型的基礎(chǔ)上提出其他形式的無標(biāo)度網(wǎng)絡(luò)模型,如Dorogovtsev和Mendes提出一個新連線數(shù)按冪律加速增長的模型、Krapivsky和Redner根據(jù)文獻(xiàn)引用的情況提出復(fù)制模型,L和Chen根據(jù)局部擇優(yōu)和距離擇優(yōu)提出局域世界演化模型等.隨著復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)研究的迅速發(fā)展,人們逐漸發(fā)現(xiàn)真實(shí)網(wǎng)絡(luò)中一些有趣的傳播現(xiàn)象,如:瘧疾、天花、SARS、H1N9等疾病在人類社會網(wǎng)絡(luò)中的流行震蕩波、灰鴿子、熊貓燒香等計(jì)算機(jī)病毒在通信網(wǎng)絡(luò)中的擴(kuò)散;消息、謠言、產(chǎn)品廣告等在社交網(wǎng)絡(luò)中的蔓延;電力故障在電力網(wǎng)絡(luò)中的傳播;金融危機(jī)在經(jīng)濟(jì)貿(mào)易網(wǎng)絡(luò)的擴(kuò)散等成為人們越來越關(guān)注的主題.這些都可以看作是服從某種特征規(guī)律的事件(或事物)在復(fù)雜網(wǎng)絡(luò)上的傳播行為,如何去描述這些事件(或事物)的傳播過程,挖掘它們的傳播特性,是復(fù)雜網(wǎng)絡(luò)極具挑戰(zhàn)的研究課題.復(fù)雜網(wǎng)絡(luò)上傳播動力學(xué)的分析最早是從傳染病模型開始,在典型的SIR傳染病模型中,將人群中的個體定義成三種狀態(tài):易感狀態(tài)S(susceptible)、感染狀態(tài)I(infected)和恢復(fù)狀態(tài)R(recovered),建立三種狀態(tài)個體數(shù)量變化的微分方程.隨后發(fā)展出了SI,SIS,SIRS等模型,基于傳染病模型對信息傳播過程的研究是近年來一大熱門研究方向.Moreno等基于SIR模型將人們分為Ignorants,Spreaders和Stiflers三種狀態(tài),建立謠言傳播模型;Xiong等將Twitter網(wǎng)絡(luò)中的用戶分成Susceptible,Infected,Contacted和Refractory四種狀態(tài),建立SCIR模型;Liu等建立無標(biāo)度網(wǎng)絡(luò)上帶時滯的SIS模型;Chen和Sun提出一種異構(gòu)網(wǎng)絡(luò)上最優(yōu)控制的SIRS模型;Gong等建立含個體警惕性的SIR模型;Lu等建立無標(biāo)度網(wǎng)絡(luò)上具有預(yù)防接種的SIR模型;張彥超等考慮了節(jié)點(diǎn)度和傳播機(jī)理的影響,建立一個基于在線社交網(wǎng)絡(luò)的信息傳播模型;熊熙和胡勇對社交網(wǎng)絡(luò)上的觀點(diǎn)傳播動力學(xué)進(jìn)行了研究.本文通過對微博傳播網(wǎng)絡(luò)的結(jié)構(gòu)分析來探索微博傳播過程.利用新浪微博數(shù)據(jù),建立微博傳播網(wǎng)絡(luò),分析該網(wǎng)絡(luò)的生成機(jī)制,使用平均場論的方法,推導(dǎo)微博傳播網(wǎng)絡(luò)的度分布模型.深入挖掘微博傳播過程,對研究輿論、謠言、疾病等的傳播行為具有指導(dǎo)作用,進(jìn)而能夠?qū)@些傳播行為進(jìn)行有效的預(yù)防控制.2微博傳播規(guī)律的分析2.1微博轉(zhuǎn)發(fā)傳播微博消息的傳播是在微博用戶網(wǎng)絡(luò)上進(jìn)行的,如圖1(a)所示.微博上的注冊用戶A關(guān)注用戶B成為B的粉絲,D關(guān)注C,C和A相互關(guān)注,構(gòu)成一個用戶網(wǎng)絡(luò).當(dāng)用戶發(fā)布公開微博的時候,該消息會實(shí)時推送到其粉絲用戶的首頁,粉絲在閱讀到該消息后可以采取相應(yīng)的操作(評論、轉(zhuǎn)發(fā)或收藏).如果某個粉絲對該微博消息進(jìn)行了轉(zhuǎn)發(fā)操作,則該粉絲的粉絲用戶同樣也能實(shí)時接收到該轉(zhuǎn)發(fā)微博.這種轉(zhuǎn)發(fā)功能保留了原微博消息,防止消息在傳播過程中被篡改.從中我們可以看出,微博消息主要通過粉絲用戶的轉(zhuǎn)發(fā)行為在用戶網(wǎng)絡(luò)上進(jìn)行傳播.如在圖1(b)中,t1時刻用戶A發(fā)布一條公開微博Mes(令t1=0),t2時刻A的粉絲B,C對Me進(jìn)行轉(zhuǎn)發(fā),t3時刻D轉(zhuǎn)發(fā)C的微博,t4時刻C回復(fù)D.微博轉(zhuǎn)發(fā)過程中存在相互轉(zhuǎn)發(fā)(如用戶之間進(jìn)行短期交流,如C和D)及用戶可轉(zhuǎn)發(fā)多個不同用戶(如E在t5時刻從C轉(zhuǎn)發(fā),t6時刻再次從D轉(zhuǎn)發(fā))最終A發(fā)布的微博Mes被用戶B,C,D,E轉(zhuǎn)發(fā)傳播,依此構(gòu)成微博消息Mes的傳播網(wǎng)絡(luò).用G=(V,E,T,W)表示節(jié)點(diǎn)數(shù)為N、邊數(shù)為M的微博傳播網(wǎng)絡(luò),微博上N個不同用戶群體構(gòu)成網(wǎng)絡(luò)的節(jié)點(diǎn)集合V=(v1,v2,···,vN)用戶間的轉(zhuǎn)發(fā)關(guān)系構(gòu)成網(wǎng)絡(luò)的邊集E=(e1,e2,···,eM),其中任意一條邊對應(yīng)一對節(jié)點(diǎn)的二元組eij=(vi,vj),表示用戶vi轉(zhuǎn)發(fā)用戶vj;T=(t1,t2,···,tN)表示節(jié)點(diǎn)的創(chuàng)建時間W=(w1,w2,···,wM)表示邊的創(chuàng)建時間.一般地,一條微博在傳播過程中隨時間的推移,轉(zhuǎn)發(fā)量增加,轉(zhuǎn)發(fā)用戶增加.用Gt表示t時刻的傳播網(wǎng)絡(luò)G1→G2→···→Gt可以反映一條微博在不同時刻的傳播狀態(tài),刻畫了信息的傳播過程.在t時刻結(jié)束時,從網(wǎng)絡(luò)中隨機(jī)選擇一個節(jié)點(diǎn),其度數(shù)k的概率記為P(k,t),稱為t時網(wǎng)絡(luò)的瞬時度分布.隨著網(wǎng)絡(luò)的演化,如果極限存在,則稱P(k)為網(wǎng)絡(luò)的穩(wěn)態(tài)度分布.2.2節(jié)點(diǎn)時間相關(guān)系數(shù)一條微博是如何傳播的呢?微博傳播網(wǎng)絡(luò)G如何生成?本文利用爬蟲程序從新浪weibo.com上收集到338條微博轉(zhuǎn)發(fā)信息,其中包括這些微博的所有轉(zhuǎn)發(fā)用戶及用戶轉(zhuǎn)發(fā)微博的時間.對每條微博數(shù)據(jù)集進(jìn)行整理,構(gòu)建了338個微博傳播網(wǎng)絡(luò)作為實(shí)驗(yàn)的測試集S.對S上的所有傳播網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)N和邊數(shù)M畫圖分析,如圖2所示.圖2中每個點(diǎn)表示一條微博的傳播網(wǎng)絡(luò),橫坐標(biāo)對應(yīng)于該網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù),縱坐標(biāo)對應(yīng)于邊數(shù).用直線擬合得到M≈1.01N,表明節(jié)點(diǎn)數(shù)和邊數(shù)近似相等,網(wǎng)絡(luò)G每新增加一個節(jié)點(diǎn)就產(chǎn)生一條連邊,這也表明大部分微博用戶對感興趣的微博只轉(zhuǎn)發(fā)一次,只有極少用戶對一條微博多次轉(zhuǎn)發(fā).Barabási在文獻(xiàn)中提出,在一個復(fù)雜網(wǎng)絡(luò)中,當(dāng)一個新建的節(jié)點(diǎn)想加入到網(wǎng)絡(luò)中或者網(wǎng)絡(luò)中的節(jié)點(diǎn)想與其他節(jié)點(diǎn)相關(guān)聯(lián),它會傾向于和網(wǎng)絡(luò)中已存在的優(yōu)先級較高的節(jié)點(diǎn)相連接.那么在微博傳播網(wǎng)絡(luò)中,t時刻一個新增的節(jié)點(diǎn)vj傾向于和t-1時刻網(wǎng)絡(luò)Gt-1中哪個節(jié)點(diǎn)進(jìn)行連邊呢?t時刻用戶vj會從哪個關(guān)注用戶轉(zhuǎn)發(fā)微博Mes?2002年Newman在文獻(xiàn)[22,23]引入了相關(guān)系數(shù)作為研究度-度相關(guān)性的重要測量,定義如下:其中,ki表示節(jié)點(diǎn)vi的度,M是網(wǎng)絡(luò)的邊數(shù),eij=(vi,vj)表示節(jié)點(diǎn)vi和vj產(chǎn)生的連邊.顯然-1≤r≤1.Newman稱r<0的網(wǎng)絡(luò)為異配網(wǎng)絡(luò),r>0的網(wǎng)絡(luò)為同配網(wǎng)絡(luò),r=0的網(wǎng)絡(luò)為混配網(wǎng)絡(luò).一般地,同配就是指屬性相近的節(jié)點(diǎn)傾向于互相連接.(1)式定義的是節(jié)點(diǎn)度相關(guān)性,如果度大的節(jié)點(diǎn)傾向于連接度大的節(jié)點(diǎn),那么網(wǎng)絡(luò)是同配網(wǎng)絡(luò),如果度大的節(jié)點(diǎn)傾向于連接度小的節(jié)點(diǎn),那么網(wǎng)絡(luò)是異配網(wǎng)絡(luò).為了分析節(jié)點(diǎn)時間相關(guān)性,本文定義節(jié)點(diǎn)時間相關(guān)系數(shù)如下:其中,ti表示節(jié)點(diǎn)vi的創(chuàng)建時間,-1≤rt≤1.如果創(chuàng)建時間大的節(jié)點(diǎn)傾向于連接創(chuàng)建時間大的節(jié)點(diǎn),那么網(wǎng)絡(luò)是同配網(wǎng)絡(luò),這說明新建節(jié)點(diǎn)傾向于和最新節(jié)點(diǎn)進(jìn)行連接;如果創(chuàng)建時間大的節(jié)點(diǎn)傾向于連接創(chuàng)建時間小的節(jié)點(diǎn),那么網(wǎng)絡(luò)是異配網(wǎng)絡(luò)表明新建節(jié)點(diǎn)傾向于和“老”節(jié)點(diǎn)發(fā)生連接.計(jì)算測試集S上所有傳播網(wǎng)絡(luò)的r值和rt值發(fā)現(xiàn)r值都小于0,平均值為-0.068;rt值都大于0平均值為0.15.通過分析不同傳播網(wǎng)絡(luò)的規(guī)模N與r和rt的關(guān)系,得到如圖3所示的結(jié)果.圖3表明,傳播網(wǎng)絡(luò)中度小的節(jié)點(diǎn)傾向于和度大的節(jié)點(diǎn)連接,在節(jié)點(diǎn)度方面表現(xiàn)為異配性;創(chuàng)建時間相近的節(jié)點(diǎn)傾向于相互連接,說明在時間上表現(xiàn)為同配性.傳播網(wǎng)絡(luò)的度異配性說明微博用戶傾向于從轉(zhuǎn)發(fā)量大的用戶處轉(zhuǎn)發(fā)微博,傳播網(wǎng)絡(luò)的時間同配性是由于新浪微博的實(shí)時推送機(jī)制,微博用戶總是選擇當(dāng)前系統(tǒng)推送的最新微博進(jìn)行轉(zhuǎn)發(fā).3微博發(fā)布網(wǎng)絡(luò)模型3.1新節(jié)點(diǎn)傳播網(wǎng)絡(luò)的構(gòu)建平均場方法由Barabási和Albert提出,主要思想是建立t時刻節(jié)點(diǎn)i的度ki(t)滿足的動力學(xué)方程,求出P(k,t)并取極限得到P(k).利用平均場論的方法推導(dǎo)微博傳播網(wǎng)絡(luò)模型,詳細(xì)過程如下.1)初始:開始給定1個節(jié)點(diǎn).2)增長:t時刻增加mt=mtθ,θ>0個新節(jié)點(diǎn),每個新節(jié)點(diǎn)產(chǎn)生一條連邊.3)擇優(yōu):t時刻新建節(jié)點(diǎn)與l時刻創(chuàng)建的節(jié)點(diǎn)vi按擇優(yōu)概率Π(ki(l,t))建立連邊,不允許重復(fù)連線.其中,擇優(yōu)概率定義為t>l,ki(l,t)表示l時刻創(chuàng)建的節(jié)點(diǎn)vi在t時刻的度數(shù).假設(shè)t時刻隨機(jī)選擇l時刻的節(jié)點(diǎn)服從P(l)分布.步驟1)表示初始網(wǎng)絡(luò),一個微博傳播網(wǎng)絡(luò)由初始用戶發(fā)布微博消息Mes開始逐步構(gòu)建;步驟2)體現(xiàn)了在不同時刻t,微博Mes的轉(zhuǎn)發(fā)量為mt;步驟3)的擇優(yōu)概率Π(ki(l,t))描述的現(xiàn)象是用戶一般傾向于從轉(zhuǎn)發(fā)量大的用戶轉(zhuǎn)發(fā)Mes;P(l)表示用戶傾向于選擇當(dāng)前微博系統(tǒng)實(shí)時推送的最新Mes,例如,令P(l)=l/t,當(dāng)l越大時,P(l)越大,越新的微博被選擇的概率越大.根據(jù)連續(xù)性理論,把ki(l,t)看作連續(xù)動力學(xué)函數(shù),l時刻創(chuàng)建的節(jié)點(diǎn)vi在t時刻的度數(shù)ki(l,t)近似地滿足如下動力學(xué)方程:求得(3)式的解為3.2傳播網(wǎng)絡(luò)的長度分布假設(shè)P(l)服從均勻分布,即P(l)=l/t,由(3)式的解推導(dǎo)出網(wǎng)絡(luò)瞬時度分布如下:(5)式的結(jié)果表明傳播網(wǎng)絡(luò)瞬時度分布服從冪律分布,且獨(dú)立于時間.那么,真實(shí)的微博傳播網(wǎng)絡(luò)的瞬時度分布是否服從冪律分布,是否獨(dú)立于時間?本文選擇測試集S上的一條微博做實(shí)驗(yàn)分析.該微博是一名微博用戶(非加V用戶)2013年6月14日16:02發(fā)布的揭示食品安全的圖片長文微博,該微博截止2013年月03日17:37共有135810名用戶參與轉(zhuǎn)發(fā),轉(zhuǎn)發(fā)量為136524.結(jié)果如圖4所示.圖4(a)右上的矩形是對k∈[0,35]區(qū)域的放大.從圖4(a),(b)看出,微博傳播網(wǎng)絡(luò)的瞬時度分布服從冪律分布,具有長尾特征,大部分節(jié)點(diǎn)的度比較小,只有少數(shù)的度大節(jié)點(diǎn).對雙對數(shù)坐標(biāo)系下的瞬時度分布做曲線擬合,求出P(k)~k-4.074,冪指數(shù)γ=4.074.分析該條微博t=700,1100,3000時的傳播網(wǎng)絡(luò)G700,G1100,G3000,計(jì)算它們在雙對數(shù)坐標(biāo)系下的度分布,如圖5所示.顯然,微博傳播網(wǎng)絡(luò)的度分布是依賴于演化時間的,冪指數(shù)隨時間t緩慢遞減.3.3節(jié)點(diǎn)vj與a節(jié)點(diǎn)vi相連接文獻(xiàn)[24,25]中定義了鏈接的創(chuàng)建與節(jié)點(diǎn)的創(chuàng)建的時間關(guān)系計(jì)算公式.本文在此基礎(chǔ)上稍做改進(jìn),定義新節(jié)點(diǎn)的創(chuàng)建與舊節(jié)點(diǎn)的創(chuàng)建時間關(guān)系計(jì)算公式如下:其中,Page(a)表示新建一個節(jié)點(diǎn)vi時,vi和時間間隔為a的節(jié)點(diǎn)vj相連接的概率,eij(t)={vi(t),vj(t)}表示t時刻節(jié)點(diǎn)vi和節(jié)點(diǎn)vj相連的邊,ti表示節(jié)點(diǎn)vi的創(chuàng)建時間.統(tǒng)計(jì)Page(a)隨a的變化,如圖6所示.新建節(jié)點(diǎn)vj與時間間隔為a節(jié)點(diǎn)vi相連接的概率隨a冪律遞減,即P(a)~a-β,β>0.顯然,P(l)并不服從均勻分布,假設(shè)P(l)=(t-l)λ,λ<0,推導(dǎo)網(wǎng)絡(luò)瞬時度分布如下:(8)式也驗(yàn)證了微博傳播網(wǎng)絡(luò)的度分布是時間相依的,傳播網(wǎng)絡(luò)的瞬時度分布服從于冪律分布,不同時刻網(wǎng)絡(luò)的瞬時度分布不同,微博傳播網(wǎng)絡(luò)模型的度分布依賴于演化時間.3.4傳播網(wǎng)絡(luò)度分布一條微博傳播網(wǎng)絡(luò)是怎樣演化成冪律分布的呢?圖7給出了一條微博在t=5,10,60,120,600min時的度分布.圖7(a)—(e)表明,微博的傳播方式是典型的“蒲公英式”傳播,開始一段時間內(nèi),消息Mes從一個用戶發(fā)布,其他多個用戶轉(zhuǎn)發(fā),慢慢演化成以其他多個用戶為中心再次擴(kuò)散,隨著時間t增加,中心用戶數(shù)量逐漸增多,中心用戶的度數(shù)也逐漸增大,轉(zhuǎn)發(fā)微博的數(shù)量隨之增大,新增用戶量也增大微博傳播網(wǎng)絡(luò)度分布慢慢趨近于冪律分布.計(jì)算圖7(c),(d),(e)的冪指數(shù)分別為γc=4.16,γd=4.07,γe=3.92.由于微博“蒲公英式”的傳播方式,每條微博都有一個閾值時間tr,當(dāng)t≥tr時網(wǎng)絡(luò)的瞬時度分布服從于冪律分布;不同內(nèi)容的微博,它們的傳播過程不同,由于中心用戶轉(zhuǎn)發(fā)微博Mes的偶然性和傳播過程中中心用戶的數(shù)量及規(guī)模的影響,使得每條微博的tr不盡相同.最后,本文對測試集S上所有微博傳播網(wǎng)絡(luò)在不同時刻的度分布進(jìn)行驗(yàn)證,取t=72
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度智慧城市建設(shè)中的光纜鋪設(shè)分包合同2篇
- 二零二五年度充電樁智能監(jiān)控系統(tǒng)安裝合同4篇
- 二零二五版苗圃技術(shù)員智慧苗圃建設(shè)與運(yùn)營管理合同3篇
- 二零二五年度面包磚施工安全管理評估合同3篇
- 2025年度綠色能源項(xiàng)目投資與建設(shè)合同4篇
- 二零二五年度醫(yī)療健康A(chǔ)PP數(shù)據(jù)共享合同3篇
- 二零二五年度某三期護(hù)坡樁工程施工合同合同解除與終止合同4篇
- 二零二五年度房地產(chǎn)營銷推廣合同范本
- 二零二五版抵押貸款合同條款變更對借款合同影響評估3篇
- 二零二五年度農(nóng)產(chǎn)品市場拓展代理銷售合同
- 收納盒注塑模具設(shè)計(jì)(論文-任務(wù)書-開題報(bào)告-圖紙)
- 博弈論全套課件
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 腦電信號處理與特征提取
- 高中數(shù)學(xué)知識點(diǎn)全總結(jié)(電子版)
- GB/T 10322.7-2004鐵礦石粒度分布的篩分測定
- 2023新譯林版新教材高中英語必修一重點(diǎn)詞組歸納總結(jié)
- 蘇教版四年級數(shù)學(xué)下冊第3單元第2課時“常見的數(shù)量關(guān)系”教案
- 基于協(xié)同過濾算法的電影推薦系統(tǒng)設(shè)計(jì)
- 消防應(yīng)急預(yù)案流程圖
- 人教統(tǒng)編版高中語文必修下冊第六單元(單元總結(jié))
評論
0/150
提交評論