版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
【營銷案例】微信:一億用戶背后架構(gòu)秘密
周顥,2001年畢業(yè)于華南理工大學(xué),計算機專業(yè)碩士。2005年加入騰訊廣州研發(fā)部,歷任QQ郵箱架構(gòu)師,廣研技術(shù)總監(jiān),T4技術(shù)專家,微信中心助理總經(jīng)理。周顥把微信的成功歸結(jié)于騰訊式的"三位一體"策略:即產(chǎn)品精準(zhǔn)、項目敏捷、技術(shù)支撐。微信的成功是在三個方面的結(jié)合比較好,能夠超出絕大多數(shù)同行或?qū)κ?,使得微信走到比較前的位置。所謂產(chǎn)品精準(zhǔn),通俗的講就是在恰當(dāng)?shù)臅r機做了恰當(dāng)?shù)氖?,推出了重量級功能,在合適的時間以最符合大家需求的方式推出去。他認(rèn)為在整個微信的成功中,產(chǎn)品精準(zhǔn)占了很大一部分權(quán)重。敏捷是一種態(tài)度敏捷就是試錯微信研發(fā)團隊里鼓勵一種試錯的信仰:他們堅信,在互聯(lián)網(wǎng)開發(fā)里,如果能夠有一個團隊在更短的時間內(nèi)嘗試了更多機會(并能改進過來),就能有(更多的)機會勝出。敏捷是一種態(tài)度,在軟件開發(fā)過程中,項目管理者都會非常忌諱"變更"這個詞,但是在微信的項目運作中是不可以的。因為微信必須要容忍說哪怕在發(fā)布前的十分鐘,也要允許他變更。這是非常大的挑戰(zhàn),因為打破了所有傳統(tǒng)項目開發(fā)的常識。所有人都說不可能做到的,但微信做到了。研發(fā)團隊所做的一切都是要給產(chǎn)品決策者有最大的自由度,而這個決策正是微信能夠勝出的關(guān)鍵。海量系統(tǒng)上的敏捷無異于懸崖邊的跳舞敏捷有很多困境,如果做一個單機版程序,是可以做到很敏捷的,但是騰訊正在運作的是一個海量系統(tǒng),有千萬級用戶同時在線,在一個單獨的功能上每天有百億級的訪問,同時還要保證99.95%的可用性。在海量系統(tǒng)上應(yīng)對項目開發(fā)會有很嚴(yán)謹(jǐn)?shù)囊?guī)范,都說要盡可能少的變化,因為90%-95%的錯誤都是在變更中產(chǎn)生的,如果系統(tǒng)一直不變更會獲得非常高的穩(wěn)定度,但是微信就是要在懸崖邊跳舞。微信的研發(fā)團隊要做一些事情,讓敏捷開發(fā)變得更簡單。如何做到這一切?周顥認(rèn)為,首先,必須建立起一種狂熱的技術(shù)信念,就是一定是可以做到的。然后,需要用一些穩(wěn)固的技術(shù)(理念)來支撐,例如大系統(tǒng)小做、讓一切可擴展、必須有基礎(chǔ)組件、輕松上線(灰度、灰度、再灰度;精細監(jiān)控;迅速響應(yīng))...等等來支撐。四大法器:大系統(tǒng)小做、讓一切可擴展、要有基礎(chǔ)組件、輕松上線大系統(tǒng)小做:當(dāng)設(shè)計龐大系統(tǒng)的時候,應(yīng)該盡量分割成更小的顆粒,使得項目之間的影響是最小的。一切可擴展:在高穩(wěn)定度、高性能的系統(tǒng)中間,為了穩(wěn)定性能把它設(shè)計成不變化的系統(tǒng),但為了支持敏捷需要讓一切的東西都要變得可以擴展。必須建立基礎(chǔ)組件:要解決復(fù)雜問題的時候,需要將已有的經(jīng)驗固化下來,固化下來的東西會成為系統(tǒng)中的一部分。輕松上線:當(dāng)做了變化并把它從開發(fā)環(huán)境中部署到現(xiàn)有的運營環(huán)境中去,在這個過程中,"灰度"這個詞非常關(guān)鍵,就是在黑和白之間的選擇,必須要變成一種小規(guī)模嘗試,再逐步擴展到海量過程中的一個問題。大系統(tǒng)小做僅僅把模塊變得更為清晰,這在海量系統(tǒng)設(shè)計開發(fā)中是不夠的,還需要在物理環(huán)境上進行分離部署,出現(xiàn)問題的時候可以快速發(fā)現(xiàn),并且在最快的情況下解決掉。大系統(tǒng)小做混搭模式將不同的應(yīng)用邏輯物理分割獨立出來,用戶注冊登錄、LBS邏輯、搖一搖邏輯、漂流瓶邏輯、消息邏輯獨立開來。把關(guān)鍵的邏輯混搭在一起,當(dāng)所有的邏輯部署在同一個服務(wù)器上,確實也會帶來很大敏捷上的好處,因為不需要額外的考慮部署和監(jiān)控的問題。在整個微信的邏輯中,可能現(xiàn)在已經(jīng)有上百種不同的邏輯,因為會在邏輯的分割上拆分成8-10種做分離部署。一切可擴展網(wǎng)絡(luò)協(xié)議可擴展、數(shù)據(jù)存儲可擴展擴展的關(guān)鍵點有兩塊。一個是網(wǎng)絡(luò)協(xié)議需要擴展,當(dāng)要升級一個新功能的時候,會有一些比較大的困難,所以所有協(xié)議設(shè)計都比較向前兼容,但是向前兼容還是不夠的,因為網(wǎng)絡(luò)協(xié)議設(shè)計本身有非常多的功能也會有比較大的字段,相關(guān)的代碼可能會有數(shù)千行,這一塊不能通過手寫方式完成??梢酝ㄟ^XML描述,再通過工具自動生成所有的代碼,這是微信獲得快速開發(fā)的一個重要的點。另外一塊就是在數(shù)據(jù)存儲方面是必須可擴展的。在2005年絕大多數(shù)海量系統(tǒng)的設(shè)計都是采用固定字段的存儲,但是在現(xiàn)代系統(tǒng)中會意識到這個問題,會采用KV或者TLV的方式,微信也做了不同的設(shè)計。把復(fù)雜邏輯都固化下來,成為基礎(chǔ)軟件。在微信后臺會有幾種不同的基礎(chǔ)組件。大致包括:SvrkitClient/Server自動代碼生成框架:10分鐘搭建內(nèi)部服務(wù)器LogicServer邏輯容器:隨時添加新邏輯OssAgent監(jiān)控/統(tǒng)計框架:所見即所得的監(jiān)控報表存儲組件屏蔽容災(zāi)/擴容等復(fù)雜問題灰度、灰度、再灰度在變更后的部署方式上,微信在一些規(guī)則會限定不能一次把所有的邏輯變更上去,每一次變更一小點觀察到每一個環(huán)節(jié)沒有問題的時候,才能布局到全網(wǎng)上去。微信后臺每一天可以支撐超過20個后臺變更,在業(yè)界來說,通常做到5個已經(jīng)是比較快了,但是微信可以做到快4倍。騰訊內(nèi)部的上線系統(tǒng)而所謂灰度發(fā)布,是指在黑與白之間,能夠平滑過渡的一種發(fā)布方式。ABtest就是一種灰度發(fā)布方式,讓一部用戶繼續(xù)用A,一部分用戶開始用B,如果用戶對B沒有什么反對意見,那么逐步擴大范圍,把所有用戶都遷移到B上面來?;叶劝l(fā)布可以保證整體系統(tǒng)的穩(wěn)定,在初始灰度的時候就可以發(fā)現(xiàn)、調(diào)整問題,以保證其影響度。(在騰訊,灰度發(fā)布是最常采用的發(fā)布方式之一)孫子兵法:古之所謂善戰(zhàn)者,勝于易勝者也常識上,解決一個復(fù)雜問題的時候,會用高明的技巧解決復(fù)雜的問題,這個不是微信團隊的目標(biāo),他們追求的要做到讓所有問題很自然和簡單的方式解決掉。在周顥看來,微信架構(gòu)的技術(shù)復(fù)雜點在四個要點:協(xié)議、容災(zāi)、輕重、監(jiān)控。微信架構(gòu)協(xié)議。手機終端跟后臺服務(wù)器之間的交互協(xié)議,這個協(xié)議的設(shè)計是整個系統(tǒng)的骨架,在這一點做好設(shè)計可以使得系統(tǒng)的復(fù)雜度大大降低。容災(zāi)。當(dāng)系統(tǒng)出現(xiàn)了若干服務(wù)器或若干支架(宕機的時候),仍然需要讓系統(tǒng)盡可能的提供正常的服務(wù)。輕重。如何在系統(tǒng)架構(gòu)中分布功能,在哪一個點實現(xiàn)哪一個功能,代表系統(tǒng)中間的功能配置。監(jiān)控。為系統(tǒng)提供一個智能儀表盤。在協(xié)議設(shè)計上,移動互聯(lián)網(wǎng)和常規(guī)互聯(lián)網(wǎng)有很大的區(qū)別。首先有CMWAP和CMNET的不同,在中國現(xiàn)在有相當(dāng)多的手機用戶使用WMWAP連接,還有就是在線和離線的概念,當(dāng)QQ下線的時候叫離線,當(dāng)你登錄的時候叫在線。但是在移動互聯(lián)網(wǎng)這兩個概念比較模糊。從微信的設(shè)計中,不管在線還是離線系統(tǒng)表現(xiàn)都應(yīng)該是一致的。還有一個是連接不穩(wěn)定的問題,由于手機信號強弱的變化,當(dāng)時信號很好,5秒鐘走到信號不好的地區(qū),連接就必須斷掉。這個中間帶來不穩(wěn)定的因素為協(xié)議設(shè)計帶來較大困難。此外就是資費敏感的問題,因為移動互聯(lián)網(wǎng)是按照流量計費的,這個計費會使得在協(xié)議設(shè)計中如何最小化傳輸?shù)膯栴}。最后就是高延遲的問題。對此,業(yè)界標(biāo)準(zhǔn)的解決方案:MessagingAndPresenceProtocol:1)XMPP;2)SIP/SIMPLE。它的優(yōu)點是簡單,大量開源實現(xiàn)。而缺點同樣明顯:1)流量大:狀態(tài)初始化;2)消息不可靠。微信在系統(tǒng)中做了特殊設(shè)計,叫SYNC協(xié)議,是參考Activesyec來實現(xiàn)的。特點首先是基于狀態(tài)同步的協(xié)議,假定說收發(fā)消息本身是狀態(tài)同步的過程,假定終端和服務(wù)器狀態(tài)已經(jīng)被遲了,在服務(wù)器端收到最新的消息,當(dāng)客戶端、終端向服務(wù)器對接的時候,收取消息的過程實際上可以簡單的歸納為狀態(tài)同步的過程,收消息以及收取你好友狀態(tài)更新都是相同的。在這樣的模式之下,我們會也許會把交互的模式統(tǒng)一化,只需要推送一個消息到達的通知就可以了,終端收到這個通知就來做消息的同步。在這樣的簡化模式之下,安卓和塞班都可以得到統(tǒng)一。這樣的系統(tǒng)本身的實現(xiàn)是更為復(fù)雜的,但是獲得很多額外的好處。讓剩下系統(tǒng)實現(xiàn)的部分更加簡單,簡化了交互模式,狀態(tài)同步可以通過狀態(tài)同步的差值獲得最小的數(shù)據(jù)變更,通過增量的傳輸?shù)玫阶钚〉臄?shù)據(jù)傳輸量。通過這樣的協(xié)議設(shè)計,微信可以確保消息是穩(wěn)定到達的,而且是按序到達。引用一句俗話:比它炫的沒它簡單,比它簡單的沒它快,沒誰比他更快,哪怕在GPRS下,微信也能把進度條輕易推到底。追求完美設(shè)計的團隊不能勝任海量服務(wù)在容災(zāi)之前面向最壞的思考,如果系統(tǒng)真的掛了,需要做一些事情,首先是防止雪崩,避免蝴蝶效應(yīng)。如果關(guān)注春節(jié)訂火車票就知道了,用戶的請求量會因為系統(tǒng)服務(wù)不了而不斷的重試,意味著發(fā)生雪崩的時候,系統(tǒng)可能會承載原先3-10倍的流量,使得所有的事情更加惡化。所以微信有很多"放雪"功能的設(shè)計。第二個詞是柔性可用,在任何的系統(tǒng)中不要追求完美設(shè)計,追求完美設(shè)計的是團隊是不能勝任海量服務(wù)的。如果在一個系統(tǒng)出現(xiàn)問題的時候,這個系統(tǒng)就掛了,那么這是一個不好的設(shè)計,最好的做法是提供0-1中間的選擇。舉一個例子,當(dāng)一個用戶向另外一個用戶發(fā)消息的時候,可能會通過一個垃圾信息過濾的檢測,如果垃圾信息過濾這個模塊突然掛掉了,這個消息難道就不能達到了嗎?在這樣的情況下,要忽略掉這個錯誤,使得消息正常達到對方。要精確定位出哪一個環(huán)節(jié)是最為重要的,把不是重要的錯誤盡可能的忽略掉。當(dāng)不能做到完美的時候,盡可能為用戶提供服務(wù)。另外一個重要方面叫做"保護點前置",最前的一個點就是終端,在手機終端上蘊埋更多的保護點,這樣會為用戶系統(tǒng)贏得更大的處理空間。如果終端具備這樣的能力,會獲得更大的反應(yīng)空間。周顥介紹了在微信上具體容災(zāi)設(shè)計的做法。在所有的容災(zāi)中存儲層的容災(zāi)是最難的,一個系統(tǒng)的設(shè)計分為三層:接入層、邏輯層、存儲層。接入層和邏輯層的容災(zāi)都有比較成熟的方案。邏輯層的容災(zāi)相對來說比較簡單,盡量不要有狀態(tài)的設(shè)計,比如說當(dāng)你做上一個請求的時候,會保持一些狀態(tài),要使得下一個請求發(fā)到下一個服務(wù)器。如果任何一個請求之間互相不關(guān)聯(lián)的話,這個就是無狀態(tài)的設(shè)計,只要做到這一點邏輯層的容災(zāi)可以隨意的切換。在回到存儲層本身的容災(zāi)設(shè)計上,相對來說困難一些,但是微信研發(fā)團隊采用了一些技巧,叫分而治之,分離業(yè)務(wù)場景,尋求簡單的設(shè)計,并不會尋求大而同一的解決方案,因為這樣會使得系統(tǒng)的復(fù)雜度大幅度上升,而微信會盡可能把產(chǎn)品拆細,尋求簡化的設(shè)計。首先是主備容災(zāi),這是最常見的方案。在有一些業(yè)務(wù)場景中是可以容忍最終一致性的,比如賬號系統(tǒng)的設(shè)計,每天寫入賬號系統(tǒng)的請求是非常少的,但是訪問的請求非常多,這個差異可能會達到數(shù)萬倍的規(guī)模,在這樣的場景下,微信會在賬號系統(tǒng)中采用簡化的方案,也可以獲得比較大的穩(wěn)定度。SET模型+雙寫第二種容災(zāi)的模式叫雙寫,兩臺Master的機器,當(dāng)一臺機故障的時候,另外一臺機還是可以接收到寫請求,當(dāng)兩臺機交錯啟動的時候,會得到數(shù)據(jù)的丟失。但是有一些場景是可以容忍輕度數(shù)據(jù)丟失的,比如說會有一個存儲專門記錄用戶終端的類型,比如說安卓還是塞班以及他們使用終端的微信版本是什么,這樣的數(shù)據(jù)是可以容忍輕度數(shù)據(jù)丟失的,因為偶爾有一些丟失的話,下一次訪問會把這些數(shù)據(jù)帶上來,會盡快的修復(fù)所有的數(shù)據(jù)。雙寫也是非常簡單的模式。微信的研發(fā)團隊做了一個叫SimpleQuorum的機制,在微信的后臺中,同步協(xié)議有一個很重要的基石叫序列發(fā)生器,這樣的一個序列發(fā)生器需要有極高的穩(wěn)定度。首先可以看到序列號有一個特點永遠是遞增的,用遞增方式往前推進的時候,最大的序列號就是最新的系列號。有一個畢業(yè)才加入廣研的畢業(yè)生想到一個絕佳的方案,按SET分布,從2G減到200K。前輕后重功能點后移周顥還談到了輕重的概念。這個概念的提出主要是從終端本身的一些困境所帶來的。首先在終端上需要表現(xiàn)最多的一個產(chǎn)品的邏輯,邏輯非常復(fù)雜,變更的成本也非常高,當(dāng)需要修復(fù)的時候必須發(fā)布一個新版本,這個新版必須由自己下載才能完成,下載的成本非常高。在這樣的前提下,如果手機終端產(chǎn)生了任何變化的時候,如果這個變化有非常大的問題就會有極大的困境,所以需要在每一個發(fā)布之前做一些充分的數(shù)據(jù),確保不會發(fā)生致命問題。如果一旦出現(xiàn)致命問題難以修復(fù),需要把關(guān)鍵的點從終端移到后臺實現(xiàn),把功能點后移,來充分發(fā)揮后臺快速變更的能力。接入優(yōu)化:從GSLB到IP重定向在接入層的優(yōu)化,速度很重要的因素,是不是能夠就近接入一個最優(yōu)的節(jié)點,比如說移動用戶最好接入移動的節(jié)點,海外的用戶可能需要尋找更佳的路由,有的時候可能無法自動做到這一點,一點是在終端上做測速,微信會通過在后臺IP逆向的能力,通過后臺指揮微信終端聯(lián)網(wǎng)的能力,尋找最優(yōu)的接入點。上圖就是每分鐘收到同一項指令曲線的報表。如何解決"偷流量"的問題當(dāng)國內(nèi)類微信類產(chǎn)品發(fā)布的時候出現(xiàn)一個大的問題就是"偷流量",當(dāng)用戶在某一些邏輯下進行一個死循環(huán),不斷訪問某一些數(shù)據(jù),這樣的死循環(huán)是非常可怕的,如果在用戶不知覺的情況之下,可能會在一個小時之內(nèi)偷到數(shù)10兆甚至數(shù)百兆的流量。有非常多業(yè)內(nèi)的同行都需要花大量的精力解決這個問題,微信研發(fā)團隊用了非常強大的方式解決它。通過在后臺建立起嚴(yán)厲的監(jiān)控系統(tǒng),對每一個用戶的行為做一個監(jiān)控,當(dāng)發(fā)現(xiàn)異常的時候,后臺會給終端發(fā)出指令,使得微信終端在一段時間無法聯(lián)網(wǎng),但是可以保證用戶流量不會白白的使用掉。功能適配的例子第一期微信版本發(fā)布的時候,當(dāng)時沒有群聊的功能,第二版發(fā)布的時候做了這個功能。當(dāng)時有兩個選擇,對于早期版本的用戶,因為不支持群聊,就無法享用到這個功能,但是微信希望提供更好的選擇,想讓早期不支持群聊的版本,也可以被拉到一個群里面收消息、發(fā)消息,通過后臺功能的適配也能做到這個事情。分而治之把監(jiān)控嵌入基礎(chǔ)框架對于一個海量系統(tǒng)來說,一個精密的儀表盤非常重要。監(jiān)控是非常痛苦的,對于這樣一個系統(tǒng)來說,每小時會產(chǎn)生數(shù)百G的監(jiān)控日志。微信希望在1分鐘之內(nèi)監(jiān)控的數(shù)據(jù)就能夠顯示在報表上,因為只有這樣的精準(zhǔn)和實時度才能夠贏得處理故障的時間。微信會做關(guān)聯(lián)統(tǒng)計,通過搖一搖加了好友,他們活躍度如何,過了一段時間他們的活躍度變化情況又是如何。這種需求是需要通過大量日志的關(guān)聯(lián)統(tǒng)計來獲得的。研發(fā)團隊也花了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新課標(biāo)小學(xué)語文“學(xué)習(xí)任務(wù)群”的教學(xué)思路
- 高中物理第十一章電路及其應(yīng)用課時13串聯(lián)電路和并聯(lián)電路課件新人教版必修第三冊
- Windows Server網(wǎng)絡(luò)管理項目教程(Windows Server 2022)(微課版)5.5 拓展案例1:Web站點安全加固
- 全省小學(xué)數(shù)學(xué)教師賽課一等獎數(shù)學(xué)一年級上冊(人教2024年新編)《10的加、減法》課件
- 2014年腔體耦合器投資分析研究咨詢報告
- 2024至2030年中國整體式豆奶機行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國成套污水處理機械設(shè)備數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國家用縫紉機控制器拉桿行業(yè)投資前景及策略咨詢研究報告
- 高中物理第五章交變電流5電能的輸送課件新人教版選修3-
- 2024至2030年中國中頻整體退火設(shè)備行業(yè)投資前景及策略咨詢研究報告
- GB/T 44679-2024叉車禁用與報廢技術(shù)規(guī)范
- 專題13隱圓問題(原卷版+解析)
- 2024人教版初中八年級數(shù)學(xué)上冊第十四章整式的乘法與因式分解大單元整體教學(xué)設(shè)計
- (新版)突發(fā)急性傳染病防控和應(yīng)急處置技能競賽理論考試題庫500題(含答案)
- 滬科版(2024)八年級全一冊物理第一學(xué)期期中學(xué)業(yè)質(zhì)量測試卷(含答案)
- 監(jiān)理工作重點、難點分析及解決方案
- 2024年礦業(yè)權(quán)評估師考試題庫大全(含答案)
- 2024年山東省港口集團有限公司招聘筆試參考題庫含答案解析
- 內(nèi)外腳手架施工方案
- 八年級數(shù)學(xué)上冊 2.4《整式的除法》2 多項式除以單項式教案 華東師大版
- 網(wǎng)絡(luò)GIS考試試題
評論
0/150
提交評論