版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Python商業(yè)數(shù)據(jù)分析社會(huì)網(wǎng)絡(luò)分析學(xué)習(xí)目標(biāo)理解社會(huì)網(wǎng)絡(luò)基本概念掌握社會(huì)網(wǎng)絡(luò)中心性的計(jì)算方法掌握社會(huì)網(wǎng)絡(luò)鏈接分析方法掌握社區(qū)發(fā)現(xiàn)的常見方法12.1社會(huì)網(wǎng)絡(luò)基本概念
12.1社會(huì)網(wǎng)絡(luò)基本概念度節(jié)點(diǎn)與其他節(jié)點(diǎn)的關(guān)系數(shù)量就是度有向圖中根據(jù)關(guān)系的指向又可以分為入度和出度入度是指其他節(jié)點(diǎn)指向該節(jié)點(diǎn)的邊的數(shù)量出度則是該節(jié)點(diǎn)指向其他節(jié)點(diǎn)的邊的數(shù)量有向圖中根據(jù)關(guān)系的指向又可以分為入度和出度,入度是指其他節(jié)點(diǎn)指向該節(jié)點(diǎn)的邊的數(shù)量度分布(DegreeDistribution)類似于分布直方圖,能刻畫網(wǎng)絡(luò)的整體特征和節(jié)點(diǎn)的重要性12.1社會(huì)網(wǎng)絡(luò)基本概念最短路徑長(zhǎng)度網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)的通路往往有很多條,在所有通路中最短的稱為最短路徑節(jié)點(diǎn)3到節(jié)點(diǎn)6的不重復(fù)路徑中3-2-4-6的路徑最短,最短路徑長(zhǎng)度為3可以刻畫節(jié)點(diǎn)之間信息傳遞的速度平均路徑長(zhǎng)度(AverageShortestPathLength)網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)間最短路徑長(zhǎng)度的平均值在社交網(wǎng)絡(luò)中可以衡量用戶之間關(guān)系的緊密程度,代表用戶之間最短關(guān)系鏈中的朋友數(shù)量網(wǎng)絡(luò)直徑(Diameter):網(wǎng)絡(luò)中所有最短路徑中長(zhǎng)度最大的路徑長(zhǎng)度12.1社會(huì)網(wǎng)絡(luò)基本概念
12.1社會(huì)網(wǎng)絡(luò)基本概念Python中的NetworkX庫是圖論與復(fù)雜網(wǎng)絡(luò)的建模工具12.1社會(huì)網(wǎng)絡(luò)基本概念12.1社會(huì)網(wǎng)絡(luò)基本概念12.2社會(huì)網(wǎng)絡(luò)的中心性識(shí)別社會(huì)網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)一個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)有著廣泛的聯(lián)系,則重要程度要高于那些聯(lián)系比較少的節(jié)點(diǎn)度中心性(DegreeCentrality)貼近中心性(ClosenessCentrality)中介中心性(BetweennessCentrality)12.2社會(huì)網(wǎng)絡(luò)的中心性
12.2社會(huì)網(wǎng)絡(luò)的中心性
12.2社會(huì)網(wǎng)絡(luò)的中心性
12.2社會(huì)網(wǎng)絡(luò)的中心性12.2社會(huì)網(wǎng)絡(luò)的中心性Facebookegonets度中心性前50的節(jié)點(diǎn)處于密集的節(jié)點(diǎn)簇中心,而貼近中心性和中介中心性前50的節(jié)點(diǎn)大多位于連接節(jié)點(diǎn)簇的“橋梁”位置12.3社會(huì)網(wǎng)絡(luò)的鏈接分析——PageRank算法
12.3.1PageRank算法核心假設(shè)如果一個(gè)網(wǎng)頁有眾多鏈入鏈接,則其很可能是重要的如果一個(gè)網(wǎng)頁有重要的鏈入鏈接,即指向該網(wǎng)頁的網(wǎng)頁是重要的,則其很可能是重要的一個(gè)網(wǎng)頁的重要性被其鏈出鏈接均分。影響一個(gè)網(wǎng)頁重要性的因素包括網(wǎng)頁的鏈入鏈接數(shù)量鏈入網(wǎng)頁的重要性鏈入網(wǎng)頁的鏈出鏈接數(shù)12.3.1PageRank算法
12.3.1PageRank算法
12.3.1PageRank算法
12.3.1PageRank算法優(yōu)點(diǎn)防止作弊的發(fā)生一個(gè)頁面的權(quán)威和重要性是由指向它的頁面所決定的,也就是由該頁面的鏈入鏈接決定在用戶進(jìn)行檢索時(shí),搜索的效率就非常高每一個(gè)頁面的PageRank值不受查詢條件的影響,它只受全局的鏈接情況影響所有頁面的PageRank值都是在離線的情況下計(jì)算出來的,而不是在用戶查詢時(shí)計(jì)算的12.3.2HITS算法HITS算法是與查詢相關(guān)的權(quán)威等級(jí)與PageRank算法的思想類似,一個(gè)網(wǎng)頁的鏈入鏈接數(shù)量越多,權(quán)威等級(jí)越高權(quán)威等級(jí)高的網(wǎng)頁又稱為權(quán)威網(wǎng)頁,權(quán)威網(wǎng)頁往往含有權(quán)威信息而被其他網(wǎng)頁引用中心等級(jí)一個(gè)網(wǎng)頁的鏈出鏈接數(shù)量越多,該網(wǎng)頁的中心等級(jí)越高中心等級(jí)高的網(wǎng)頁也稱為中心網(wǎng)頁,中心網(wǎng)頁一般是某些話題的重要載體,通過這個(gè)“橋梁”網(wǎng)頁連接其他相關(guān)網(wǎng)頁HITS算法有效地利用權(quán)威網(wǎng)頁和中心網(wǎng)頁的相互促進(jìn)關(guān)系,即中心網(wǎng)頁一定有很多鏈出鏈接指向權(quán)威網(wǎng)頁,而權(quán)威網(wǎng)絡(luò)一定有很多由中心網(wǎng)頁指向的鏈入鏈接12.3.2HITS算法
12.3.2HITS算法
12.3鏈接分析代碼示例networkx中的pagerank()和hits()函數(shù)能快速實(shí)現(xiàn)這兩個(gè)算法12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)兩個(gè)算法能通過networkx庫中community模塊的kernighan_lin_bisection()和girvan_newman()函數(shù)實(shí)現(xiàn)12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)FN算法(FastNewmanAlgorithm)首先將每一個(gè)節(jié)點(diǎn)視為一個(gè)社區(qū),計(jì)算模塊度以模塊度增加最大的方式進(jìn)行社區(qū)合并,直至無法增加模塊度Louvain算法將網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)視為一個(gè)社區(qū),對(duì)于每個(gè)節(jié)點(diǎn),評(píng)估將其加入與之相連的鄰居節(jié)點(diǎn)中的模塊度增益,然后將其加入到使得模塊度增益最大的節(jié)點(diǎn)中,不斷迭代直至模塊度取得局部最大值,即單一節(jié)點(diǎn)的變動(dòng)無法使模塊度進(jìn)一步增加第二階段在第一階段結(jié)果的基礎(chǔ)上將所有社區(qū)轉(zhuǎn)變?yōu)橐粋€(gè)個(gè)“新”節(jié)點(diǎn),“新”節(jié)點(diǎn)之間邊的權(quán)重為兩個(gè)社區(qū)中原始節(jié)點(diǎn)之間邊的權(quán)重之和完成第二階段后再次應(yīng)用第一階段的方法,不斷迭代直至模塊度不再增加模塊度優(yōu)化算法能夠使得社區(qū)劃分結(jié)果的模塊度最大,但是由于優(yōu)化目標(biāo)是全局社區(qū)結(jié)構(gòu)質(zhì)量,因此無法挖掘網(wǎng)絡(luò)中較小的社區(qū)結(jié)構(gòu)12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)networkx庫中community模塊的greedy_modularity_communities()能實(shí)現(xiàn)FN算法12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)標(biāo)簽傳播算法通過已有社區(qū)標(biāo)簽的節(jié)點(diǎn)將標(biāo)簽逐步傳播給鄰近節(jié)點(diǎn)的社區(qū)發(fā)現(xiàn)方法給每個(gè)節(jié)點(diǎn)初始化一個(gè)不同的標(biāo)簽每個(gè)節(jié)點(diǎn)選擇與其直接相連的所有鄰居節(jié)點(diǎn)中出現(xiàn)次數(shù)最多的標(biāo)簽,若有多個(gè)出現(xiàn)次數(shù)相同的標(biāo)簽則進(jìn)行隨機(jī)選擇。不斷重復(fù)上述過程,直至每個(gè)節(jié)點(diǎn)的標(biāo)簽都是與其直接相連的所有鄰居節(jié)點(diǎn)中出現(xiàn)次數(shù)最多的標(biāo)簽連接緊密的節(jié)點(diǎn)有共同的標(biāo)簽,即屬于同一個(gè)社區(qū)標(biāo)簽傳播算法思路簡(jiǎn)單,適用于大型網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn),但由于算法中有隨機(jī)選擇的過程,劃分結(jié)果的穩(wěn)定性較弱12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)networkx庫中community模塊的asyn_lpa_communities()函數(shù)可實(shí)現(xiàn)LPA算法
12.4社會(huì)網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)LPA算法將Facebookegonets
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度新型環(huán)保技術(shù)合作承諾合同范本4篇
- 2025版智能社區(qū)門牌制作及管理系統(tǒng)集成合同4篇
- 二零二五版智能科技專利轉(zhuǎn)讓合同補(bǔ)充協(xié)議3篇
- 數(shù)據(jù)化辦公實(shí)驗(yàn)室數(shù)據(jù)的處理與應(yīng)用
- 2025年度個(gè)人教育培訓(xùn)分期付款合同8篇
- 2025版協(xié)議書范本合同(環(huán)保產(chǎn)業(yè))2篇
- 長(zhǎng)安大學(xué)《大學(xué)外語聽說》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024鐵路電氣化區(qū)段安全使用合同3篇
- 家用醫(yī)療設(shè)備為殘疾人提供個(gè)性化的康復(fù)方案
- 現(xiàn)代家庭的沖突解決與情緒管理策略
- 2025年度杭州市固廢處理與資源化利用合同3篇
- 2024年安徽省公務(wù)員錄用考試《行測(cè)》真題及答案解析
- 部編版二年級(jí)下冊(cè)《道德與法治》教案及反思(更新)
- 充電樁項(xiàng)目運(yùn)營方案
- 退休人員出國探親申請(qǐng)書
- 高中物理競(jìng)賽真題分類匯編 4 光學(xué) (學(xué)生版+解析版50題)
- 西方經(jīng)濟(jì)學(xué)-高鴻業(yè)-筆記
- 幼兒園美術(shù)教育研究策略國內(nèi)外
- 2024屆河南省五市高三第一次聯(lián)考英語試題及答案
- 孕婦學(xué)校品管圈課件
- 《愿望的實(shí)現(xiàn)》交流ppt課件2
評(píng)論
0/150
提交評(píng)論