版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
國(guó)家工業(yè)信息安全發(fā)展研究中心中國(guó)電子學(xué)會(huì)北京國(guó)家金融科技認(rèn)證中心隨著信息技術(shù)的迅猛發(fā)展,各行各業(yè)產(chǎn)生的數(shù)據(jù)量呈爆炸式增長(zhǎng),傳統(tǒng)集中式數(shù)據(jù)庫的局限性在面對(duì)大規(guī)模數(shù)據(jù)處理中逐漸顯露,從而分布式數(shù)據(jù)庫應(yīng)運(yùn)而生。分布式數(shù)據(jù)庫是在集中式數(shù)據(jù)庫的基礎(chǔ)上發(fā)展起來的,是分布式系統(tǒng)與傳統(tǒng)數(shù)據(jù)庫技術(shù)結(jié)合的產(chǎn)物,具有透明性、數(shù)據(jù)冗余性、易于擴(kuò)展性等特點(diǎn),還具備高可靠、高可用、低成本等方面的優(yōu)勢(shì),能夠突破傳統(tǒng)數(shù)據(jù)庫的瓶頸。分布式數(shù)據(jù)庫目前已應(yīng)用到金融、電信等大數(shù)據(jù)行業(yè),未來將走向更廣闊的領(lǐng)域。本報(bào)告旨在梳理我國(guó)分布式數(shù)據(jù)庫技術(shù)路線和產(chǎn)業(yè)現(xiàn)狀,分析分布式數(shù)據(jù)庫的技術(shù)特點(diǎn)以及面臨的問題與挑戰(zhàn),對(duì)未來分布式數(shù)據(jù)庫技術(shù)的發(fā)展趨勢(shì)進(jìn)行展望與研判,并提出發(fā)展建議。報(bào)告的第一章基于目前的技術(shù)發(fā)展情況,給出分布式數(shù)據(jù)庫的概念及分類;第二章闡述分布式數(shù)據(jù)庫的產(chǎn)業(yè)現(xiàn)狀;第三章指出當(dāng)前分布式數(shù)據(jù)庫面臨的機(jī)遇和挑戰(zhàn);第四章對(duì)分布式數(shù)據(jù)庫未來的技術(shù)發(fā)展趨勢(shì)進(jìn)行展望;第五章提出推動(dòng)分布式數(shù)據(jù)庫發(fā)展的建議。I 2 (二)分布式數(shù)據(jù)庫的分類 3 7 7(二)產(chǎn)業(yè)政策 9(三)市場(chǎng)格局 (一)軟硬件協(xié)同為分布式數(shù)據(jù)庫的設(shè)計(jì)提供新思路 (二)新技術(shù)發(fā)展為分布式數(shù)據(jù)庫的架構(gòu)帶來新挑戰(zhàn) (三)多租戶管理為分布式數(shù)據(jù)庫的運(yùn)維提供新方法 (四)數(shù)據(jù)遷移對(duì)分布式數(shù)據(jù)庫的兼容性提出新目標(biāo) (五)安全合規(guī)對(duì)分布式數(shù)據(jù)庫的安全性提出新要求 (六)數(shù)據(jù)增長(zhǎng)對(duì)分布式數(shù)據(jù)庫的存儲(chǔ)技術(shù)帶來新挑戰(zhàn)17 (二)分布式數(shù)據(jù)庫架構(gòu)的設(shè)計(jì)走向一體化 20(三)分布式數(shù)據(jù)庫的能力將向混合負(fù)載發(fā)展 22 24(五)分布式數(shù)據(jù)庫的高可用能力不斷在提升 26(六)分布式數(shù)據(jù)庫對(duì)數(shù)據(jù)一致性的支持將日臻完善 27 28(八)分布式數(shù)據(jù)庫需要支持異構(gòu)芯片的混合 29 30 32(二)鍛長(zhǎng)板,依托應(yīng)用豐富生態(tài),打造自主技術(shù)體系32(三)重測(cè)評(píng),建立專有測(cè)評(píng)體系,提高產(chǎn)品質(zhì)量水平33(四)推政策,加強(qiáng)頂層設(shè)計(jì)引導(dǎo),提升產(chǎn)品的成熟度34(五)促開源,借助開源生態(tài)建設(shè),優(yōu)化國(guó)際合作形勢(shì)351一、分布式數(shù)據(jù)庫的定義及分類當(dāng)前數(shù)字化浪潮席卷現(xiàn)代社會(huì)的每一個(gè)角落,以數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素的數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)庫技術(shù)成為數(shù)字產(chǎn)業(yè)化的核心關(guān)鍵技術(shù),數(shù)據(jù)庫成為了構(gòu)成新型基礎(chǔ)設(shè)施建設(shè)的堅(jiān)強(qiáng)底座。作為IT系統(tǒng)的核心之一,數(shù)據(jù)庫是企業(yè)級(jí)用戶交易數(shù)據(jù)、客戶信息、存貨庫存等海量數(shù)據(jù)的載體,數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展事關(guān)國(guó)家戰(zhàn)略全局。據(jù)統(tǒng)計(jì),2020年全球數(shù)據(jù)庫市場(chǎng)規(guī)模為671億美元,其中中國(guó)數(shù)據(jù)庫市場(chǎng)規(guī)模為35億美元(約合240.9億元人民幣),占全球5.2%;預(yù)計(jì)到2025年我國(guó)數(shù)據(jù)庫市場(chǎng)規(guī)模將達(dá)到688.02億元,2020-2025年復(fù)合增長(zhǎng)率為23.4%。隨著數(shù)據(jù)形態(tài)發(fā)生變化及數(shù)據(jù)體量爆發(fā)增長(zhǎng),分布式數(shù)據(jù)庫的提出為解決企業(yè)數(shù)據(jù)承載困難的問題提供了一個(gè)較好的解決思路。根據(jù)IDC調(diào)研,目前約26.8%的企業(yè)級(jí)市場(chǎng)用戶部署了分布式數(shù)據(jù)庫,超過90%的企業(yè)認(rèn)可分布式數(shù)據(jù)庫部署后的效果,其中,約66%的被訪企業(yè)看到數(shù)據(jù)庫系統(tǒng)性能的明顯改善,切實(shí)解決數(shù)據(jù)庫企業(yè)級(jí)應(yīng)用痛難點(diǎn)。(一)分布式數(shù)據(jù)庫的定義根據(jù)國(guó)際權(quán)威咨詢機(jī)構(gòu)(參考Gartner1,F(xiàn)orrester2)對(duì)1Gartner:<HypeCycleforDataManagement,2021>:“分布式事務(wù)數(shù)例節(jié)點(diǎn)集上執(zhí)行事務(wù)的數(shù)據(jù)庫。接受來自地理上分布的一組節(jié)點(diǎn)的寫入,同時(shí)保持?jǐn)?shù)據(jù)完整提供可接受的性能的能力使這項(xiàng)技術(shù)具有差異化?!?Forrester:<NowTech:Glo2于分布式數(shù)據(jù)庫的定義:分布式數(shù)據(jù)庫是一種能夠提供跨地域數(shù)據(jù)訪問能力的數(shù)據(jù)庫。分布式數(shù)據(jù)庫需要保證區(qū)域間數(shù)據(jù)一致性,在部分節(jié)點(diǎn)故障或者網(wǎng)絡(luò)故障時(shí)仍舊能持續(xù)保持?jǐn)?shù)據(jù)庫的可用性,同時(shí)在集群內(nèi)提供數(shù)據(jù)存儲(chǔ)區(qū)域的管控,滿足合規(guī)要求。支持法規(guī)遵跨區(qū)域提供從性任務(wù)一致且可信的數(shù)據(jù)改善業(yè)務(wù)連續(xù)性支持法規(guī)遵跨區(qū)域提供從性任務(wù)一致且可信的數(shù)據(jù)改善業(yè)務(wù)連續(xù)性分布式數(shù)據(jù)庫具備以下三個(gè)特點(diǎn):l跨區(qū)域提供一致且可信的數(shù)據(jù)。分布式數(shù)據(jù)庫可以存儲(chǔ)來自多種來源和格式的統(tǒng)一數(shù)據(jù),以跨區(qū)域提供一致和可信的數(shù)據(jù),從而支持現(xiàn)代業(yè)務(wù)應(yīng)用程序和混合工作負(fù)載,有助于最大限度地減少應(yīng)用層的數(shù)據(jù)集成,并確保數(shù)據(jù)的一致性和完整性。l改善業(yè)務(wù)連續(xù)性。業(yè)務(wù)連續(xù)性已變得至關(guān)重要,特別是在支持區(qū)域和全球需求方面。分布式數(shù)據(jù)庫提供了內(nèi)置支持跨地理分布區(qū)域的分布式數(shù)據(jù)處理和訪問,使用高速網(wǎng)絡(luò)連接,通過自3的高可用性(HA)功能,可在各個(gè)地理分布區(qū)域提供全天候數(shù)據(jù)可用性,并且零停機(jī)時(shí)間防止服務(wù)器或數(shù)據(jù)中心故障。l支持法規(guī)遵從性任務(wù)。分布式數(shù)據(jù)庫可以通過存儲(chǔ)和保護(hù)綁定到某個(gè)區(qū)域的敏感數(shù)據(jù),確保受GDPR和CCPA等法規(guī)遵從性要求驅(qū)動(dòng)的數(shù)據(jù)本地化。通過利用訪問控制、審核以及動(dòng)態(tài)和持久數(shù)據(jù)屏蔽功能,保護(hù)機(jī)密數(shù)據(jù)不被區(qū)域(二)分布式數(shù)據(jù)庫的分類分布式數(shù)據(jù)庫與單機(jī)數(shù)據(jù)庫的不同在于其可以將核心功能,即查詢、事務(wù)管理、存儲(chǔ)等擴(kuò)展到多臺(tái)節(jié)點(diǎn),甚至多個(gè)地域。從實(shí)現(xiàn)方式上看,當(dāng)前主要包含3條不同的技術(shù)路第一條技術(shù)路線為分布式中間件+單機(jī)數(shù)據(jù)庫。這條路線是在單機(jī)數(shù)據(jù)庫系統(tǒng)上進(jìn)行改造,主要解決了擴(kuò)展性的問題。上層無狀態(tài)的計(jì)算節(jié)點(diǎn)維護(hù)一套統(tǒng)一的分片規(guī)則,提供4SQL解析,請(qǐng)求轉(zhuǎn)發(fā)和結(jié)果合并的能力,下層實(shí)際是增強(qiáng)的單機(jī)數(shù)據(jù)庫,提供單機(jī)數(shù)據(jù)庫的存儲(chǔ)和執(zhí)行能力。這一架構(gòu)通過數(shù)據(jù)在邏輯層的切割,可近似線性地對(duì)計(jì)算性能和存儲(chǔ)容量進(jìn)行擴(kuò)展,具有可規(guī)模化擴(kuò)展的能力。這種路線的兼容性好,學(xué)習(xí)成本低;從原理上說,如果有足夠的資源投入,比如:硬件資源、開發(fā)運(yùn)維人員等,節(jié)點(diǎn)的擴(kuò)展可以做到很大規(guī)模。l劣勢(shì):首先,由于每張表只能有一個(gè)分片規(guī)則,業(yè)其次,由于分片規(guī)則是基于算法提供的,下層計(jì)算節(jié)點(diǎn)之間并不會(huì)進(jìn)行數(shù)據(jù)交互,擴(kuò)展下層計(jì)算節(jié)點(diǎn)的時(shí)候無法按需擴(kuò)這個(gè)路線本質(zhì)上把單機(jī)數(shù)據(jù)庫進(jìn)行了二次處理,在全局事務(wù)5能力、全局MVCC、副本控制、高可用等方面存在短板,需多,上層節(jié)點(diǎn)要保持高可用,分庫規(guī)則的存儲(chǔ)需要高可用,每個(gè)數(shù)據(jù)分片也需要一寫多讀的一組節(jié)點(diǎn)維持高可用。第二類技術(shù)路線是通過構(gòu)建分布式共享存儲(chǔ)實(shí)現(xiàn)擴(kuò)展,采用非對(duì)稱計(jì)算節(jié)點(diǎn),大部分公有云數(shù)據(jù)庫是這條路線。這條路線有限地解決了擴(kuò)展性問題,跨地域數(shù)據(jù)一致性主要依賴分布式存儲(chǔ)引擎。共享存儲(chǔ)能夠跨多個(gè)節(jié)點(diǎn)提供讀寫,上層的計(jì)算部分是無狀態(tài)的一組節(jié)點(diǎn)組成。當(dāng)有寫能力的計(jì)算節(jié)點(diǎn)出現(xiàn)故障時(shí),會(huì)自動(dòng)從可用的讀節(jié)點(diǎn)中自動(dòng)選出一個(gè)作為寫節(jié)點(diǎn),實(shí)現(xiàn)寫能力的高可用。l優(yōu)勢(shì):由于上層運(yùn)行的來自單機(jī)數(shù)據(jù)庫改造,兼容性好;日志和數(shù)據(jù)在分布式共享存儲(chǔ)中保持冗余和一致性,產(chǎn)品整合度相對(duì)較高;應(yīng)用不需要改造。6l劣勢(shì):擴(kuò)展性有限,尤其是寫節(jié)點(diǎn),當(dāng)數(shù)據(jù)處理規(guī)模要求較高時(shí),仍舊需要分庫處理;并且很難做到跨地域高可用。另外,這種架構(gòu)需要對(duì)底座有比較重的依賴,需要對(duì)基礎(chǔ)設(shè)施進(jìn)行大范圍替換。第三條技術(shù)路線是原生分布式數(shù)據(jù)庫,各計(jì)算節(jié)點(diǎn)提供對(duì)等的讀寫服務(wù)。這條路線是根據(jù)分布式一致性協(xié)議做底層設(shè)計(jì),與傳統(tǒng)數(shù)據(jù)庫有本質(zhì)區(qū)別。原生分布式數(shù)據(jù)庫將分布式存儲(chǔ)、事務(wù)、計(jì)算有機(jī)的結(jié)合在一起,數(shù)據(jù)由系統(tǒng)自動(dòng)打散并存儲(chǔ)多個(gè)副本,通過一致性協(xié)議保證多個(gè)副本和事務(wù)日志的一致性,對(duì)分布式事務(wù)、全局MVCC等支持更為徹底。整個(gè)分布式結(jié)構(gòu)是包裹在集群內(nèi)部的,應(yīng)用對(duì)此無感知,對(duì)應(yīng)用來說,與使用傳統(tǒng)數(shù)據(jù)庫沒有區(qū)別,大多數(shù)應(yīng)用不需要做分布式改造。7l優(yōu)勢(shì):系統(tǒng)不需要改造;集群的擴(kuò)展和收縮對(duì)應(yīng)用透明,并可以按需擴(kuò)展,沒有數(shù)量和規(guī)模限制;數(shù)據(jù)一致性是在事務(wù)層被一致性協(xié)議保護(hù)的,安全性更高;原生的多副本機(jī)制支持跨地域的訪問和容災(zāi);硬件依賴少,可靈活進(jìn)行混合云和多云部署,以及跨多云的數(shù)據(jù)管理;多活架構(gòu),硬件利用率高,可以通過普通PC服務(wù)器實(shí)現(xiàn)集群和高可用。l劣勢(shì):多數(shù)產(chǎn)品成熟度不足,仍需沉淀,沒有經(jīng)過長(zhǎng)時(shí)間核心系統(tǒng)驗(yàn)證;架構(gòu)與傳統(tǒng)數(shù)據(jù)庫不同,目前雖然一些金融、能源、電信等行業(yè)的業(yè)務(wù)場(chǎng)景已嘗試原生分布式數(shù)據(jù)庫的部署,但整體上下游生態(tài)適配還有待進(jìn)一步完善。二、分布式數(shù)據(jù)庫發(fā)展現(xiàn)狀(一)發(fā)展背景習(xí)近平總書記在中共中央政治局第三十四次集體學(xué)習(xí)時(shí)強(qiáng)調(diào)“數(shù)字經(jīng)濟(jì)發(fā)展速度之快、輻射范圍之廣、影響程度之深前所未有,正在成為重組全球要素資源、重塑全球經(jīng)濟(jì)結(jié)構(gòu)、改變?nèi)蚋?jìng)爭(zhēng)格局的關(guān)鍵力量?!痹跀?shù)字經(jīng)濟(jì)、產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的大背景下,數(shù)據(jù)要素尤為重要,而數(shù)據(jù)庫作為各行業(yè)數(shù)據(jù)的存儲(chǔ)、管理和分析的軟件,是數(shù)字經(jīng)濟(jì)、產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)。數(shù)字化轉(zhuǎn)型對(duì)于大多數(shù)行業(yè)來說是知之非艱、行之惟艱。在數(shù)字化轉(zhuǎn)型過程中,云計(jì)算、5G、IOT、人工智能、區(qū)塊8鏈等新興技術(shù)的發(fā)展,帶來了產(chǎn)品和應(yīng)用在各行各業(yè)的不斷更新和落地,隨之而來的是數(shù)據(jù)量呈現(xiàn)幾何級(jí)增長(zhǎng)、數(shù)據(jù)結(jié)構(gòu)復(fù)雜度與日攀升。根據(jù)國(guó)際數(shù)據(jù)公司(IDC)的監(jiān)測(cè)數(shù)據(jù)顯示,2013年全球大數(shù)據(jù)儲(chǔ)量為4.3ZB,2014年和2015年全球大數(shù)據(jù)儲(chǔ)量分別為6.6ZB和8.6ZB。近幾年全球大數(shù)據(jù)儲(chǔ)量的增速每年都保持在40%,2016年甚至達(dá)到87.21%的增長(zhǎng)率。2016年和2017年全球大數(shù)據(jù)儲(chǔ)量分別為16.1ZB和21.6ZB,2018年全球大數(shù)據(jù)儲(chǔ)量達(dá)到33.0ZB,2019年全球大數(shù)據(jù)儲(chǔ)量達(dá)到41ZB,2020年全球大數(shù)據(jù)儲(chǔ)量達(dá)到47ZB,預(yù)計(jì)到2025年全球大數(shù)據(jù)儲(chǔ)量達(dá)到163ZB。如今,除了要求數(shù)據(jù)庫提供完善的管理功能、數(shù)據(jù)存儲(chǔ)等功能之外,若能夠自如地利用數(shù)據(jù)庫對(duì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、傳輸、展現(xiàn)、分析和優(yōu)化等,就可以實(shí)現(xiàn)企業(yè)對(duì)數(shù)據(jù)資產(chǎn)的治理、增值與科學(xué)決策,對(duì)數(shù)據(jù)庫的高可靠、高可9用、高安全以及數(shù)據(jù)分析,發(fā)揮數(shù)據(jù)價(jià)值的能力需求進(jìn)一步提升。但傳統(tǒng)數(shù)據(jù)庫在處理高并發(fā)、實(shí)時(shí)處理等數(shù)據(jù)業(yè)務(wù)時(shí),明顯力不從心,同時(shí),高昂的建設(shè)成本也難以迎合數(shù)字化時(shí)代的潮流趨勢(shì)。相較于傳統(tǒng)數(shù)據(jù)庫,分布式數(shù)據(jù)庫的優(yōu)勢(shì)盡顯:首先是傳統(tǒng)數(shù)據(jù)庫遇到的性能瓶頸,快速發(fā)展更新的業(yè)務(wù)驅(qū)動(dòng)著數(shù)據(jù)規(guī)模無限增長(zhǎng),傳統(tǒng)集中式數(shù)據(jù)庫面對(duì)數(shù)據(jù)量的增長(zhǎng)時(shí)難以維持性能,然而分布式數(shù)據(jù)庫的性能可以水平擴(kuò)展;其次是傳統(tǒng)數(shù)據(jù)庫面臨分析能力的缺失,傳統(tǒng)解決方案通常需要構(gòu)建獨(dú)立分析系統(tǒng),數(shù)據(jù)存在冗余且獲取延時(shí),而分布式數(shù)據(jù)庫的混合負(fù)載能力可大幅度提升分析時(shí)效性,并減少數(shù)據(jù)冗余,靈活性大大提高;最后是傳統(tǒng)數(shù)據(jù)庫的成本頗為高昂,集中式數(shù)據(jù)庫系統(tǒng)水平擴(kuò)展難,需要按最大容量設(shè)計(jì),可靠性需要付出高額的成本,反觀分布式數(shù)據(jù)庫,其架構(gòu)支持靈活擴(kuò)展,并可實(shí)現(xiàn)低成本的高可用解決方案。多重因素驅(qū)動(dòng)下,分布式數(shù)據(jù)庫的崛起,將為企業(yè)數(shù)字化轉(zhuǎn)型提供新的思路。(二)產(chǎn)業(yè)政策當(dāng)前,國(guó)家已出臺(tái)多項(xiàng)政策扶持?jǐn)?shù)據(jù)庫行業(yè)的發(fā)展,并且信創(chuàng)政策也已經(jīng)上升到國(guó)家戰(zhàn)略層面,近三年部分相關(guān)政策見下圖。借助政策紅利,從市場(chǎng)層面,國(guó)產(chǎn)數(shù)據(jù)庫的應(yīng)用越來越廣泛,主要體現(xiàn)在黨政、金融、電信、交通等行業(yè)領(lǐng)域;從技術(shù)層面,國(guó)產(chǎn)數(shù)據(jù)庫技術(shù)也處于加速提升的關(guān)鍵階段,各方面能力突飛猛進(jìn),在與國(guó)外高端數(shù)據(jù)庫技術(shù)的抗衡中逐漸不落下風(fēng)。金融業(yè)是數(shù)據(jù)密集型行業(yè),移動(dòng)互聯(lián)網(wǎng)和電子支付的蓬勃發(fā)展對(duì)金融系統(tǒng)能力帶來全新的挑戰(zhàn)。比如金融行業(yè)的數(shù)據(jù)量急劇增長(zhǎng),對(duì)數(shù)據(jù)存儲(chǔ)和管理提出了更高要求,同時(shí)面臨高并發(fā)業(yè)務(wù)和大用戶量帶來的系統(tǒng)壓力,這就要求移動(dòng)應(yīng)用響應(yīng)速度更快;目前我國(guó)絕大部分金融核心運(yùn)行在大型機(jī)系統(tǒng)上,運(yùn)行速度尚能滿足,但安全風(fēng)險(xiǎn)逐漸上升。分布式數(shù)據(jù)庫在金融領(lǐng)域的應(yīng)用能夠極大的提升行業(yè)的安全與效率,同樣,金融產(chǎn)品的日新月異也對(duì)分布式數(shù)據(jù)庫技術(shù)的成熟與穩(wěn)定有著極高的要求。除金融外,電信行業(yè)也是一個(gè)典型的大數(shù)據(jù)行業(yè),數(shù)據(jù)是其重要的生產(chǎn)要素。隨著5G的發(fā)展與普及,電信運(yùn)營(yíng)商需要處理的數(shù)據(jù)業(yè)務(wù)呈指數(shù)級(jí)增長(zhǎng)。在助力各行各業(yè)數(shù)字化的進(jìn)程中,如何利用好數(shù)據(jù)、技術(shù)等資源,釋放更強(qiáng)大的生產(chǎn)力,實(shí)現(xiàn)對(duì)其他行業(yè)的快速支撐,是對(duì)電信行業(yè)的考驗(yàn),也是對(duì)數(shù)據(jù)庫技術(shù)的創(chuàng)新與突破的考驗(yàn)。(三)市場(chǎng)格局我國(guó)分布式數(shù)據(jù)庫自2011年陸續(xù)起步,經(jīng)過10年的發(fā)展,國(guó)產(chǎn)分布式數(shù)據(jù)庫百花齊放,比如技術(shù)路線為分布式中間件+單機(jī)數(shù)據(jù)庫的有TDSQL、GoldenDB、PolarDB-X等;技術(shù)路線是通過構(gòu)建非對(duì)稱計(jì)算節(jié)點(diǎn)與分布式存儲(chǔ)實(shí)現(xiàn)擴(kuò)展的有GaussDB(forMySQL)、TDSQL-C、SequoiaDB等;技術(shù)路線為原生分布式數(shù)據(jù)庫的有OceanBase、TiDB、ZNBase等。以下整理了部分國(guó)內(nèi)分布式數(shù)據(jù)庫的典型企業(yè)及其產(chǎn)品。第一條技術(shù)路線:分布式中間件+單機(jī)數(shù)據(jù)庫第二類技術(shù)路線:非對(duì)稱計(jì)算節(jié)點(diǎn)+分布式存儲(chǔ)第三條技術(shù)路線:原生分布式數(shù)據(jù)庫三、分布式數(shù)據(jù)庫發(fā)展面臨的機(jī)遇和挑戰(zhàn)(一)軟硬件協(xié)同為分布式數(shù)據(jù)庫的設(shè)計(jì)提供新思路硬件和軟件是信息系統(tǒng)的核心組件,兩者之間相輔相成,互相制約、互相促進(jìn),所以新型硬件的發(fā)展為分布式數(shù)據(jù)庫的發(fā)展帶來新的挑戰(zhàn),軟硬件協(xié)同設(shè)計(jì)為分布式數(shù)據(jù)庫架構(gòu)提供更多的想象空間。比如:由于市場(chǎng)競(jìng)爭(zhēng)帶來的性能效率問題,多核CPU技術(shù)走向成熟,但實(shí)際應(yīng)用中CPU核數(shù)的簡(jiǎn)單疊加并不能實(shí)現(xiàn)數(shù)據(jù)庫處理能力的無限擴(kuò)張,核數(shù)增加帶來的性能增益會(huì)出現(xiàn)拐點(diǎn)和瓶頸,所以如何進(jìn)行多核CPU調(diào)度優(yōu)化為分布式數(shù)據(jù)庫的架構(gòu)設(shè)計(jì)提出新的難題。另一方面,由于非易失內(nèi)存具有掉電不易失、高速讀寫負(fù)載等優(yōu)點(diǎn),那么“把數(shù)據(jù)存儲(chǔ)在內(nèi)存中”便為數(shù)據(jù)庫設(shè)計(jì)提供了更多的空間,但隨著大容量?jī)?nèi)存和高速硬盤的普及,如何搭配新存儲(chǔ)介質(zhì)設(shè)計(jì)新的分布式數(shù)據(jù)庫架構(gòu)也有待探索。(二)新技術(shù)發(fā)展為分布式數(shù)據(jù)庫的架構(gòu)帶來新挑戰(zhàn)隨著大數(shù)據(jù)、人工智能、云計(jì)算等數(shù)字技術(shù)蓬勃發(fā)展,傳統(tǒng)數(shù)據(jù)庫產(chǎn)品與新興技術(shù)的緊密融合促使數(shù)據(jù)形態(tài)發(fā)生的前提下,還有許多待探索的問題。一是分布式事務(wù)的一致性保證。對(duì)于單機(jī)較容易實(shí)現(xiàn)的ACID,分布式環(huán)境中出現(xiàn)了更多的難題。分布式數(shù)據(jù)庫將需要處理的事務(wù)進(jìn)行拆分,再部署到不同的服務(wù)器上進(jìn)行處理,理想狀況下,整個(gè)過程需要全局一致性協(xié)議的保護(hù),而分庫分表兩階段的方式在一些意外情況下容易出現(xiàn)問題。二是架構(gòu)的創(chuàng)新。當(dāng)前各廠商在進(jìn)行分布式改造時(shí),分布式數(shù)據(jù)庫的架構(gòu)要么是對(duì)中間件負(fù)擔(dān)過重,可擴(kuò)展性較差,要么是在多并發(fā)和低延時(shí)上還存在升級(jí)改造的空間,因此分布式數(shù)據(jù)庫的架構(gòu)需要再創(chuàng)新。三是數(shù)據(jù)分片的智能化。分布式通過分庫分表進(jìn)行數(shù)據(jù)拆分,從而各表的數(shù)據(jù)量保持在閾值以下,從而應(yīng)對(duì)高并發(fā)和海量數(shù)據(jù),但如何高效的、高質(zhì)量的進(jìn)行分片,還需再探索。四是企業(yè)級(jí)能力的提升。傳統(tǒng)的數(shù)據(jù)庫產(chǎn)品能夠?yàn)橛脩籼峁┖芏嗥髽I(yè)級(jí)的服務(wù),但分布式數(shù)據(jù)庫的企業(yè)級(jí)能力還有眾多挑戰(zhàn),比如:分庫分表后會(huì)影響原有集中式數(shù)據(jù)庫的功能,如存儲(chǔ)過程的調(diào)用等,因此,分布式數(shù)據(jù)庫自身的企業(yè)級(jí)能力還需進(jìn)一步加強(qiáng)。(三)多租戶管理為分布式數(shù)據(jù)庫的運(yùn)維提供新方法從管理難度的角度,相較于傳統(tǒng)集中式數(shù)據(jù)庫,分布式數(shù)據(jù)庫的前后端工具使用均體現(xiàn)出差異,分布式數(shù)據(jù)庫對(duì)運(yùn)維人員的工作增加了許多新要求。比如:基于分布式數(shù)據(jù)庫分片特性,需要更準(zhǔn)確地管理不同節(jié)點(diǎn)不同類型的數(shù)據(jù)表;基于分布式數(shù)據(jù)庫多節(jié)點(diǎn)特性,運(yùn)維節(jié)點(diǎn)的數(shù)量也大幅增長(zhǎng);基于分布式數(shù)據(jù)庫架構(gòu)特性,運(yùn)維過程中更加需要注意節(jié)點(diǎn)故障中留存的數(shù)據(jù)不一致問題。這就需要數(shù)據(jù)庫廠商提供全生命周期的運(yùn)維管理工具,覆蓋遷移、開發(fā)、運(yùn)維全流程。從管理資源角度,多租戶架構(gòu)中一個(gè)集群中可以同時(shí)運(yùn)行多個(gè)數(shù)據(jù)庫租戶,每個(gè)租戶單獨(dú)配置數(shù)據(jù)副本數(shù)量、副本類型、存儲(chǔ)位置及計(jì)算資源等,租戶之間的數(shù)據(jù)和資源互相隔離。多租戶架構(gòu)具備在現(xiàn)有服務(wù)器資源下的彈性,可以自動(dòng)在不同業(yè)務(wù)之間靈活分割資源、不同時(shí)間段之間靈活調(diào)整資源,進(jìn)而提升運(yùn)維效率。從管理數(shù)量的角度,用戶的業(yè)務(wù)系統(tǒng)種類不斷增加,分布式數(shù)據(jù)庫的實(shí)例數(shù)量也不斷增加,運(yùn)維管理變得更困難。另外,用戶既存的大量應(yīng)用系統(tǒng)相互隔離、分別建設(shè),導(dǎo)致硬件資源利用率低,通過多租戶管理等解決方案,將多個(gè)傳統(tǒng)數(shù)據(jù)庫實(shí)例并入一套分布式數(shù)據(jù)庫集群,能夠有效提升資源利用效率,結(jié)合方便易用的管理工具,從而為分布式數(shù)據(jù)庫的運(yùn)維提供新方法。有可能實(shí)現(xiàn)一個(gè)企業(yè)一個(gè)數(shù)據(jù)庫解決所有應(yīng)用的目標(biāo),最大限度地減少企業(yè)開發(fā)和運(yùn)維的投入,專注于業(yè)務(wù)發(fā)展,實(shí)現(xiàn)降本增效。(四)數(shù)據(jù)遷移對(duì)分布式數(shù)據(jù)庫的兼容性提出新目標(biāo)大部分行業(yè)經(jīng)過企業(yè)信息化的長(zhǎng)期積累與革新,在企業(yè)內(nèi)部積累了大量的業(yè)務(wù)系統(tǒng)。傳統(tǒng)的企業(yè)級(jí)數(shù)據(jù)庫產(chǎn)品提供了強(qiáng)大的能力,協(xié)助開發(fā)者快速便捷地構(gòu)建應(yīng)用程序,但同時(shí)也導(dǎo)致應(yīng)用設(shè)計(jì)過度依賴數(shù)據(jù)庫功能。適配新的數(shù)據(jù)庫產(chǎn)品必須對(duì)應(yīng)用代碼進(jìn)行大量修改,比如:當(dāng)一款經(jīng)過長(zhǎng)期迭代發(fā)展的業(yè)務(wù)系統(tǒng)需要進(jìn)行數(shù)據(jù)遷移時(shí),由于源數(shù)據(jù)庫與目標(biāo)數(shù)據(jù)庫在底層架構(gòu)、實(shí)現(xiàn)邏輯上存在差異,在進(jìn)行數(shù)據(jù)遷移過程中,各數(shù)據(jù)表的數(shù)據(jù)類型、函數(shù)、語法規(guī)則需要進(jìn)行系統(tǒng)、全面、細(xì)致的改造。這就要求分布式數(shù)據(jù)庫對(duì)原有數(shù)據(jù)庫都能夠很好的支持,降低遷移的代碼改造成本。目前大多數(shù)分布式數(shù)據(jù)庫還不完全具備主流數(shù)據(jù)庫生態(tài)的兼容能力,兼容的種類還不夠豐富,兼容度還有待提高。個(gè)別技術(shù)路線還不能做到數(shù)據(jù)庫架構(gòu)對(duì)應(yīng)用系統(tǒng)的完全透明,需要單獨(dú)對(duì)數(shù)據(jù)庫架構(gòu)做分布式改造。另一方面,將數(shù)據(jù)從傳統(tǒng)集中式數(shù)據(jù)庫遷移至分布式數(shù)據(jù)庫是一項(xiàng)復(fù)雜且龐大的工程。企業(yè)對(duì)于能否在不影響業(yè)務(wù)的條件下,實(shí)現(xiàn)安全的無損遷移,是尤為重要的。遷移前對(duì)兼容度和性能進(jìn)行評(píng)估和模擬測(cè)試,在遷移過程中,支持在較大數(shù)據(jù)量的背景下快速、準(zhǔn)確完成遷移,并且不影響線上生產(chǎn)環(huán)境應(yīng)用正常運(yùn)行。完成之后還需要進(jìn)行多輪全量數(shù)據(jù)校驗(yàn)和業(yè)務(wù)測(cè)試,以保證遷移正確性。但是目前大多數(shù)分布式數(shù)據(jù)庫還無法提供遷移流程的全生命周期管理,流程缺失,或者準(zhǔn)確性不足。值得一提的是,高度的商業(yè)數(shù)據(jù)庫兼容能力意味著大量的設(shè)計(jì)和研發(fā)工作,涉及產(chǎn)品整體架構(gòu)的多個(gè)方面,十分考驗(yàn)廠商對(duì)代碼的理解和掌控能力。完全自主研發(fā)的產(chǎn)品在這方面具備先天的優(yōu)勢(shì),未來無論在兼容性適配還是產(chǎn)品能力的研發(fā)上都更具潛力。(五)安全合規(guī)對(duì)分布式數(shù)據(jù)庫的安全性提出新要求當(dāng)前信息安全已經(jīng)上升到國(guó)家戰(zhàn)略高度,諸多行業(yè)監(jiān)管機(jī)構(gòu)和政府部門對(duì)數(shù)據(jù)存儲(chǔ)和使用都有明確的安全合規(guī)性要求,而數(shù)據(jù)庫系統(tǒng)對(duì)維持企業(yè)核心數(shù)據(jù)的安全性和業(yè)務(wù)的穩(wěn)定性具有重要作用,任何數(shù)據(jù)的丟失和長(zhǎng)時(shí)間的服務(wù)中斷都將給企業(yè)造成無法挽回的損失。另一方面,隨著“互聯(lián)網(wǎng)新技術(shù)蓬勃發(fā)展,企業(yè)越來越重視數(shù)據(jù)庫的可用性、可擴(kuò)展性、穩(wěn)定性以及安全性。由于分布式數(shù)據(jù)庫天然對(duì)數(shù)據(jù)有頻繁調(diào)度,不論是地理位置方面還是節(jié)點(diǎn)方面,都增加了傳輸過程的風(fēng)險(xiǎn)性。盡管分布式數(shù)據(jù)庫會(huì)設(shè)計(jì)一些安全措施,但企業(yè)仍會(huì)持審慎的態(tài)度,所以如何有效預(yù)防分布式數(shù)據(jù)庫的數(shù)據(jù)泄露,保證分布式數(shù)據(jù)庫滿足安全合規(guī)的約束,對(duì)分布式數(shù)據(jù)庫的發(fā)展提出了新的要求。(六)數(shù)據(jù)增長(zhǎng)對(duì)分布式數(shù)據(jù)庫的存儲(chǔ)技術(shù)帶來新挑戰(zhàn)在當(dāng)今的數(shù)字化時(shí)代,隨著業(yè)務(wù)的迅速發(fā)展,每天產(chǎn)生 的數(shù)據(jù)量驚人,數(shù)據(jù)庫存儲(chǔ)的成本將會(huì)越來越大。通常的做 法是,對(duì)歷史數(shù)據(jù)做歸檔,即將長(zhǎng)期不使用的數(shù)據(jù)遷移至以 文件形式存儲(chǔ)的廉價(jià)存儲(chǔ)設(shè)備上,然而在部分核心業(yè)務(wù)的應(yīng)用場(chǎng)景下,會(huì)存在典型的如針對(duì)幾個(gè)月甚至幾年前的“舊”數(shù)據(jù)依舊存在實(shí)時(shí)的、低頻的查詢甚至更新需求。如果這時(shí) 從歷史備份中還原后查詢,那么查詢時(shí)間將會(huì)是以天為單位。如果將這些低頻但實(shí)時(shí)的查詢需求的歷史數(shù)據(jù)與近期活躍存儲(chǔ)在同一套分布式數(shù)據(jù)庫集群下,同樣會(huì)帶來一系列挑戰(zhàn),?存儲(chǔ)成本巨大,進(jìn)而導(dǎo)致成本遠(yuǎn)大于收益,比如釘釘聊天信息數(shù)據(jù)量在高度壓縮后接近50PB,很難想象這些數(shù)據(jù)不做壓縮會(huì)帶來多大的資金開銷。?性能挑戰(zhàn)巨大,隨著數(shù)據(jù)量越來越大,即使針對(duì)數(shù)據(jù)做了分布式存儲(chǔ),單實(shí)例容量超過大概5T以后性能也會(huì)急劇下滑,進(jìn)而影響到近期活躍數(shù)據(jù)的查詢性能,拖垮整個(gè)集群。?運(yùn)維難度巨大,比如針對(duì)海量數(shù)據(jù)下發(fā)一個(gè)表數(shù)據(jù)結(jié)構(gòu)變更操作,很難想象全部完成需要多長(zhǎng)時(shí)間。正是基于上述情況,數(shù)據(jù)增長(zhǎng)對(duì)分布式數(shù)據(jù)庫的存儲(chǔ)技術(shù)帶來了諸多新挑戰(zhàn)。鑒于存儲(chǔ)成本是考核數(shù)據(jù)庫的關(guān)鍵指標(biāo)之一,分布式數(shù)據(jù)庫需要具備數(shù)據(jù)壓縮能力、HTAP數(shù)據(jù)混合處理的能力等,以解決成本可控、統(tǒng)一查詢?nèi)肟?、改造成本低廉等問題。四、分布式數(shù)據(jù)的發(fā)展趨勢(shì)(一)分布式數(shù)據(jù)庫走向原生設(shè)計(jì)隨著數(shù)據(jù)處理規(guī)模指數(shù)級(jí)增長(zhǎng),眾多系統(tǒng)面臨著性能和成本的雙重壓力。為應(yīng)對(duì)新的業(yè)務(wù)需要,數(shù)據(jù)庫領(lǐng)域急需革命性產(chǎn)品開啟未來。分布式數(shù)據(jù)庫的核心理念是讓多臺(tái)服務(wù)器協(xié)同工作,完成單臺(tái)服務(wù)器無法處理的任務(wù),尤其是高并發(fā)或者大數(shù)據(jù)量的任務(wù)。而原生分布式高可用設(shè)計(jì)能夠在普通服務(wù)器上實(shí)現(xiàn)無限水平擴(kuò)展,通過添加低成本服務(wù)器即可擴(kuò)展算力,提升數(shù)據(jù)庫集群的整體性能。所有節(jié)點(diǎn)均支持讀寫,對(duì)外提供統(tǒng)一的數(shù)據(jù)庫服務(wù),支持全局索引、全局一致性事務(wù)。特別是對(duì)客戶來說,用法與傳統(tǒng)集中式數(shù)據(jù)庫沒有區(qū)別,從而省去了定制改造的步驟,減少大量人工成本。除此之外,在高可用方面,容災(zāi)能力是關(guān)鍵業(yè)務(wù)系統(tǒng)的重要衡量指標(biāo)。原生分布式在設(shè)計(jì)之初就假定硬件是不可靠的,它可以支持多個(gè)數(shù)據(jù)副本分散存儲(chǔ)在不同地域,實(shí)現(xiàn)跨機(jī)架、跨數(shù)據(jù)中心、跨地域的容災(zāi)部署,能夠最大程度提高業(yè)務(wù)系統(tǒng)的容災(zāi)能力。在強(qiáng)一致事務(wù)的保護(hù)下,變更操作在多個(gè)地域保證成功提交,因此當(dāng)災(zāi)難發(fā)生時(shí),數(shù)據(jù)不會(huì)丟失,達(dá)到高級(jí)別的容災(zāi)標(biāo)準(zhǔn)。原生分布式架構(gòu)是一個(gè)全新的設(shè)計(jì),具備集群的擴(kuò)展和收縮對(duì)應(yīng)用透明,并可以按需擴(kuò)展,沒有數(shù)量和規(guī)模限制;原生的多副本機(jī)制支持跨地域的訪問和容災(zāi);多活架構(gòu),硬件利用率高等優(yōu)勢(shì)??梢灶A(yù)見的是,未來更多的產(chǎn)品會(huì)走向原生分布式的技術(shù)路線,原生分布式數(shù)據(jù)庫也將迎來更好的發(fā)展機(jī)遇。移應(yīng)用還需要在復(fù)雜的業(yè)務(wù)邏輯中梳理Oracle某原生分布式數(shù)據(jù)庫基于Paxos協(xié)議和分區(qū)等技術(shù)整合多套原先的分散(二)分布式數(shù)據(jù)庫架構(gòu)的設(shè)計(jì)走向一體化目前國(guó)內(nèi)數(shù)據(jù)庫主要分為存量替換和增量市場(chǎng)兩個(gè)部分。其中,增量市場(chǎng)主要以開源語法兼容為主,絕大部分業(yè)務(wù)邏輯在應(yīng)用中實(shí)現(xiàn),對(duì)數(shù)據(jù)庫能力要求相對(duì)較低,很多開源產(chǎn)品也能滿足。而對(duì)廠商來說,增量市場(chǎng)研發(fā)投入相對(duì)較少,因此大部分新興分布式數(shù)據(jù)庫廠商都在追逐這個(gè)市場(chǎng)。而存量替換則是多數(shù)國(guó)內(nèi)企業(yè)真正遇到的難題,絕大部分企業(yè)的核心業(yè)務(wù)系統(tǒng)運(yùn)行在功能強(qiáng)大的集中式商業(yè)數(shù)據(jù)庫上,目前面臨著原有數(shù)據(jù)庫系統(tǒng)無法升級(jí)的困境,存在License過期的風(fēng)險(xiǎn),而業(yè)務(wù)系統(tǒng)重構(gòu)又存在成本高、風(fēng)險(xiǎn)大的問題。商業(yè)數(shù)據(jù)庫功能靈活、語法支持多等對(duì)分布式數(shù)據(jù)庫的兼容能力設(shè)計(jì)提出極大的挑戰(zhàn)。廠商要用一體化設(shè)計(jì)的思路,將傳統(tǒng)商業(yè)數(shù)據(jù)庫的強(qiáng)大的單機(jī)能力與分布式融合,將多種負(fù)載能力在一套數(shù)據(jù)庫上融合,甚至將多種兼容能力體現(xiàn)在同一套數(shù)據(jù)庫中,這些是國(guó)內(nèi)各重點(diǎn)行業(yè)的企業(yè)迫切需要的,能夠?yàn)槠髽I(yè)節(jié)省大量的遷移適配成本。此外,未來分布式數(shù)據(jù)庫應(yīng)提供數(shù)據(jù)遷移過程的全生命周期管理,在管控界面上完成數(shù)據(jù)遷移的創(chuàng)建、配置和監(jiān)控,交互簡(jiǎn)便。同時(shí)提供多種方式的數(shù)據(jù)校檢和保護(hù),全面高效的保證數(shù)據(jù)正確性,展示差異數(shù)據(jù),提供快速修復(fù)能力。因此,未來分布式數(shù)據(jù)庫產(chǎn)品將具備全方位、高標(biāo)準(zhǔn)、高可靠性的平滑遷移能力。(三)分布式數(shù)據(jù)庫的能力將向混合負(fù)載發(fā)展企業(yè)級(jí)應(yīng)用的業(yè)務(wù)場(chǎng)景通??梢苑譃槁?lián)機(jī)交易和實(shí)時(shí)分析兩種,通常稱為OLTP和OLAP的業(yè)務(wù)應(yīng)用,由于是不同的應(yīng)用場(chǎng)景,大型企業(yè)往往會(huì)選擇多款數(shù)據(jù)庫產(chǎn)品分別支持。這種組合式的解決方案要求數(shù)據(jù)在不同產(chǎn)品間進(jìn)行流轉(zhuǎn),數(shù)據(jù)的同步過程就帶來了時(shí)間延遲和數(shù)據(jù)不一致的風(fēng)險(xiǎn),而且還會(huì)產(chǎn)生冗余數(shù)據(jù),成本開銷被迫提高,這在一定程度上限制了企業(yè)的發(fā)展。HTAP(混合事務(wù)/分析處理),是近年來提出的一種新興的應(yīng)用框架,旨在打破事務(wù)處理和分析之間“壁壘”。未來分布式數(shù)據(jù)庫應(yīng)具備混合負(fù)載能力,即在支持高并發(fā)、事務(wù)性請(qǐng)求的同時(shí),也對(duì)分析型的復(fù)雜查詢提混合負(fù)載管理,提供高性能并行執(zhí)行計(jì)算,充分釋放資源,進(jìn)一步提升系統(tǒng)穩(wěn)定性。并且可以靈活配置兩種負(fù)載的資源占比,使得在線交易和分析互不影響,一站式地解決企業(yè)級(jí)應(yīng)用的各種需求,從而大幅度降低成本,同時(shí)提高了企業(yè)決策的效率。混合型事務(wù)和分析(HTAP)能力能夠幫助企業(yè)提高諸多特定場(chǎng)景的分析決策的實(shí)時(shí)性,比如:金融防欺詐、證券交易決策、信用風(fēng)險(xiǎn)評(píng)級(jí)等。一個(gè)對(duì)數(shù)據(jù)多種查詢和計(jì)算的HTAP系統(tǒng)于用戶而言更加友好,性價(jià)比更高,省去了數(shù)據(jù)抽取轉(zhuǎn)化加載的過程并保證了查詢結(jié)果的實(shí)時(shí)性,將成為更多用戶的選擇。(四)分布式數(shù)據(jù)庫的場(chǎng)景將向云化發(fā)展全球知名咨詢公司Gartner指出,“到2022年,75%的數(shù)據(jù)庫將被部署或遷移到云平臺(tái),只有5%的數(shù)據(jù)庫會(huì)考慮本地部署?!痹苹療o疑代表了未來,當(dāng)前,云已經(jīng)成為中小型企業(yè)和互聯(lián)網(wǎng)公司進(jìn)行數(shù)字化轉(zhuǎn)型的首選IT架構(gòu),在傳統(tǒng)行業(yè),云的使用度也在逐步攀升。在此趨勢(shì)下,數(shù)據(jù)庫也加速了與云環(huán)境融合。分布式數(shù)據(jù)庫可以將傳統(tǒng)部署和公有云資源有機(jī)結(jié)合,有效解決私有部署靈活度低,成本過高的問題。多云支持具備快速部署、快速銷毀、前期投入低等特點(diǎn)。利用公有云資源能夠低成本實(shí)現(xiàn)容災(zāi)和算力擴(kuò)展。另外,部署靈活特性意味著不被特定硬件和服務(wù)綁定,能夠做到機(jī)房部署,任意公有云部署,甚至集群內(nèi)跨多基礎(chǔ)設(shè)施的混合云,多云部署。因此,在數(shù)據(jù)庫產(chǎn)品設(shè)計(jì)層面要充分適配云環(huán)境、兼容更多云技術(shù),從而添加更多資源管控、靈活購買、多部署形態(tài)等云化方面的能力。面對(duì)未來越來越多的用戶選擇業(yè)務(wù)上云,企業(yè)如何在云原生架構(gòu)下使用數(shù)據(jù)庫以及提升自己跨云數(shù)據(jù)管理的能力,就成為必須要思考的問題。在“互聯(lián)網(wǎng)+”的大背景下,保險(xiǎn)公司的傳統(tǒng)業(yè)務(wù)面臨向互聯(lián)網(wǎng)化轉(zhuǎn)型的(五)分布式數(shù)據(jù)庫的高可用能力不斷在提升提高分布式數(shù)據(jù)庫的可用性包括了容災(zāi)能力建設(shè)及可靠性建設(shè)。在容災(zāi)方面,傳統(tǒng)的高可用容災(zāi)方案依賴操作系統(tǒng)、存儲(chǔ)、數(shù)據(jù)庫等多組件整合分級(jí)實(shí)現(xiàn),與業(yè)務(wù)自身應(yīng)用配合度低,容災(zāi)切換要求高、難度大,風(fēng)險(xiǎn)難以估計(jì),亟需變革升級(jí)。在可靠性方面,由于各行業(yè)迅猛發(fā)展和信息量爆發(fā)式增長(zhǎng)的現(xiàn)狀對(duì)數(shù)據(jù)庫的高可用能力要求更高,7×24小時(shí)的服務(wù)不中斷和數(shù)據(jù)零丟失往往超出了傳統(tǒng)數(shù)據(jù)庫可以式數(shù)據(jù)庫應(yīng)采取更好的方案來提升其高可用能力。對(duì)公理財(cái)系統(tǒng)是銀行重要業(yè)務(wù)系統(tǒng)之一,支撐著企業(yè)客戶萬億級(jí)別的資+主備模式提升高可用水平,為業(yè)務(wù)提供堅(jiān)實(shí)的連續(xù)性保障,同時(shí)保證了系統(tǒng)(六)分布式數(shù)據(jù)庫對(duì)數(shù)據(jù)一致性的支持將日臻完善研究表明,在可靠數(shù)據(jù)庫管理系統(tǒng)中,事務(wù)應(yīng)該具有四個(gè)特性:原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)。以往在處理單一事務(wù)時(shí),事務(wù)的原子性和持久性可以確保在一個(gè)事務(wù)內(nèi),操作多條數(shù)據(jù)要么都成功,要么都失敗。這樣在一個(gè)系統(tǒng)內(nèi)部,可以使用數(shù)據(jù)庫事務(wù)來保證數(shù)據(jù)一致性。但是在微服務(wù)日益廣泛的今天,一項(xiàng)操作會(huì)涉及到跨多個(gè)系統(tǒng)、多個(gè)數(shù)據(jù)庫的時(shí)候,用單一的數(shù)據(jù)庫事務(wù)就沒辦法解決了。并且,數(shù)據(jù)一致性不僅指在事務(wù)發(fā)生時(shí)的數(shù)據(jù)一致性,還需要考慮到主備副本之間、集群之間的數(shù)據(jù)一致性,以及是否有類似區(qū)塊鏈似的校驗(yàn),具備防篡改的能力和應(yīng)對(duì)磁盤MySQL還是其他大多數(shù)數(shù)據(jù)庫都沒有校驗(yàn)主備副本之間的數(shù)據(jù)一致性。傳統(tǒng)數(shù)據(jù)庫技術(shù)面臨巨大挑戰(zhàn),無法有效保障數(shù)據(jù)一致性。因而,在數(shù)據(jù)服務(wù)場(chǎng)景越發(fā)多樣化的趨勢(shì)下,對(duì)分布式數(shù)據(jù)庫所具備的數(shù)據(jù)一致性級(jí)別要求將會(huì)越來越高。當(dāng)前支持跨區(qū)域的數(shù)據(jù)一致性只是基本,隨著微服務(wù)的廣泛應(yīng)用,還需要分布式數(shù)據(jù)庫能夠支持跨集群、跨表分區(qū)、跨數(shù)據(jù)塊(七)分布式數(shù)據(jù)庫的生態(tài)建設(shè)亟需推動(dòng)數(shù)據(jù)庫作為基礎(chǔ)軟件,需要與整個(gè)上下游軟硬件廠商適配,需要很好的產(chǎn)業(yè)建設(shè)和人才培養(yǎng),才能為用戶提供更完整、更便利的服務(wù)。分布式數(shù)據(jù)庫作為數(shù)據(jù)庫產(chǎn)業(yè)的下一步發(fā)展趨勢(shì),要積極推動(dòng)生態(tài)建設(shè),與國(guó)產(chǎn)芯片廠商、硬件廠商、操作系統(tǒng)廠商、中間件廠商等相互認(rèn)證,與上游ISV共建行業(yè)解決方案,為用戶提供一整套的產(chǎn)品服務(wù)體系。先行的分布式數(shù)據(jù)庫廠商要積極參與國(guó)家行業(yè)標(biāo)準(zhǔn)制定,推動(dòng)整個(gè)行業(yè)發(fā)展。另一方面,要積極參與制定人才培養(yǎng)體系,與高校深入合作,為國(guó)家培養(yǎng)更多的基礎(chǔ)軟件人才,助力行業(yè)基業(yè)長(zhǎng)青。而分布式數(shù)據(jù)庫生態(tài)建設(shè)的核心,便是開源的思想。開源是做基礎(chǔ)軟件的必經(jīng)之路,也是社會(huì)組織分工的一種新形式和新趨勢(shì),開源社區(qū)本身就是基礎(chǔ)軟件商業(yè)化當(dāng)中重要的一環(huán)。分布式數(shù)據(jù)庫之所以需要開源,是因?yàn)樾枰嗳巳ダ斫夂褪褂茫褂煤蜑槠湄暙I(xiàn)代碼的人越多,才能越有助于構(gòu)建出一個(gè)完整和健康的生態(tài)。因此,開源生態(tài)建設(shè)既是企業(yè)商業(yè)布局的利器,也是促進(jìn)技術(shù)發(fā)展和推廣的重要手段。當(dāng)更多的分布式數(shù)據(jù)庫廠商通過開源方式將技術(shù)共享給開發(fā)者、社區(qū)、合作伙伴進(jìn)而推進(jìn)共建生態(tài)環(huán)境時(shí),分布式數(shù)據(jù)庫將會(huì)步入快速高品質(zhì)迭代的大道,提升產(chǎn)品質(zhì)量,擴(kuò)大品牌力,吸引更多、更廣的用戶群體,為分布式數(shù)據(jù)庫的推廣與發(fā)展,起到跨越式的推動(dòng)作用。(八)分布式數(shù)據(jù)庫需要支持異構(gòu)芯片的混合部署異構(gòu)計(jì)算時(shí)代已經(jīng)到來。所謂異構(gòu),即將CPU、DSP、GPU、ASIC、FPGA等不同制程架構(gòu)、不同指令集、不同功能的計(jì)算單元,組合起來形成一個(gè)混合的計(jì)算系統(tǒng)。所謂異構(gòu)芯片的混合部署,就是在允許異構(gòu)內(nèi)核以分離模式運(yùn)行的同時(shí),集成內(nèi)核的共享集群邏輯以鎖定模式運(yùn)行。這就在不同的層級(jí)上既提供了鎖定模式的安全機(jī)制,又提供了分離模式的性能。而在關(guān)鍵行業(yè)及軟件領(lǐng)域,數(shù)據(jù)庫還需要提供對(duì)異構(gòu)芯片的支持,從而提升數(shù)字化解決方案的嚴(yán)謹(jǐn)性,降低應(yīng)用風(fēng)險(xiǎn),分布式數(shù)據(jù)庫也不例外。而對(duì)于企業(yè),從成本角度上看,如A芯片漲價(jià),企業(yè)可選擇采購B芯片,提升采購自由度的同時(shí),可降低芯片成本;從安全層面上看,如果A芯片爆出安全漏洞,企業(yè)可隨時(shí)替換B芯片,尤其在核心系統(tǒng),可以選擇安全性更高的芯片,從而保障業(yè)務(wù)的連續(xù)性。(九)分布式數(shù)據(jù)庫應(yīng)支持?jǐn)?shù)據(jù)透明加密正式施行之后,監(jiān)管部門已在金融等行業(yè)中推廣數(shù)據(jù)加密,要求敏感數(shù)據(jù)采用加密的方式進(jìn)行存儲(chǔ)。而數(shù)據(jù)庫、存儲(chǔ)產(chǎn)品等作為數(shù)據(jù)的承載媒介,有義務(wù)為此提供堅(jiān)實(shí)的數(shù)據(jù)安全目前,敏感數(shù)據(jù)加密業(yè)界普遍的做法是通過代碼直接調(diào)用加密機(jī)進(jìn)行加密,這在實(shí)際的應(yīng)用中帶來了負(fù)擔(dān),因?yàn)槊看螒?yīng)用代碼的迭代都要考慮是否完成了對(duì)敏感數(shù)據(jù)的加密。同時(shí),應(yīng)用開發(fā)人員需要與安全、審計(jì)人員協(xié)作完成這塊工作,一旦出現(xiàn)遺漏,就易造成信息的泄露。因而在分布式數(shù)據(jù)庫的發(fā)展中,亟需實(shí)現(xiàn)更加簡(jiǎn)易的數(shù)據(jù)加密機(jī)制,而數(shù)據(jù)透明加密的出現(xiàn)不失為一種有益思路。其通過數(shù)據(jù)庫層配置即可完成,開發(fā)人員無需修改代碼,因而能夠使應(yīng)用完全無感。目前,數(shù)據(jù)透明加密的實(shí)現(xiàn)在透明傳輸加密及透明存儲(chǔ)加密兩個(gè)層面都取得了突破。具體而言,透明傳輸加密使得即使網(wǎng)絡(luò)包被拷貝走以后,網(wǎng)絡(luò)包中傳輸?shù)臄?shù)據(jù)也無法解密,其需要實(shí)現(xiàn)SQL代理到數(shù)據(jù)庫服務(wù)器之間的通信加密。而透明存儲(chǔ)加密使得即使數(shù)據(jù)庫的文件被拷貝拿走,也無法解密其中的數(shù)據(jù)。透明存儲(chǔ)加密采用兩級(jí)密鑰管理,第一級(jí)密鑰為根密鑰,在國(guó)家認(rèn)證的加密機(jī)里,而第二級(jí)密鑰即數(shù)據(jù)密鑰的密文需在分布式數(shù)據(jù)庫的內(nèi)部表里管理。五、分布式數(shù)據(jù)庫的發(fā)展建議(一)補(bǔ)短板,聚集技術(shù)研發(fā)力量,推動(dòng)標(biāo)準(zhǔn)體系建設(shè)我國(guó)分布式數(shù)據(jù)庫起步較晚,且數(shù)據(jù)庫的技術(shù)壁壘高,長(zhǎng)期以來一直面臨著緊張的外部壓力。在核心技術(shù)研發(fā)上,強(qiáng)強(qiáng)聯(lián)合比單打獨(dú)斗效果要好,要充分調(diào)動(dòng)產(chǎn)學(xué)研用多方力量,協(xié)同攻關(guān),解決技術(shù)瓶頸問題,持續(xù)加強(qiáng)關(guān)鍵核心技術(shù)突破,不斷完善分布式數(shù)據(jù)庫產(chǎn)品在高性能、高可靠、高安全、海量數(shù)據(jù)支撐等方面的核心技術(shù)研發(fā),集聚資源力量協(xié)同攻堅(jiān)。另一方面,隨著商業(yè)模式向云化、微服務(wù)等方向發(fā)展,分布式數(shù)據(jù)庫產(chǎn)品需要結(jié)合商業(yè)模式的轉(zhuǎn)變,注重技術(shù)攻關(guān)與商用模式創(chuàng)新有機(jī)結(jié)合,完成技術(shù)攻關(guān)與融合創(chuàng)新的更新迭代。由此來建立面向我國(guó)分布式數(shù)據(jù)庫自主技術(shù)路線的標(biāo)準(zhǔn)體系,從關(guān)鍵技術(shù)、技術(shù)遷移、適配兼容、行業(yè)應(yīng)用等多維度建立標(biāo)準(zhǔn)規(guī)范,實(shí)現(xiàn)行業(yè)規(guī)則統(tǒng)一、互聯(lián)互通、高效發(fā)展,探索出特色發(fā)展路徑,抓住機(jī)遇盡早實(shí)現(xiàn)分布式數(shù)據(jù)庫領(lǐng)域的換道超車。(二)鍛長(zhǎng)板,依托應(yīng)用豐富生態(tài),打造自主技術(shù)體系對(duì)于數(shù)據(jù)庫廠商來說,做好產(chǎn)品是硬道理。好的產(chǎn)品是“用出來”的,要經(jīng)歷足夠的應(yīng)用實(shí)踐,由用戶推動(dòng)成熟,在應(yīng)用中解決層出不窮的問題,才能讓產(chǎn)品更健壯,所以行業(yè)應(yīng)用是推動(dòng)數(shù)據(jù)庫發(fā)展的關(guān)鍵要素,用戶和廠商需共同為數(shù)據(jù)庫產(chǎn)業(yè)良性發(fā)展而努力。當(dāng)前,我國(guó)正在構(gòu)建以內(nèi)循環(huán)為主,國(guó)內(nèi)國(guó)際雙循環(huán)相互促進(jìn)的新格局。我們應(yīng)當(dāng)抓住這次以外力促進(jìn)提升內(nèi)功的機(jī)會(huì),轉(zhuǎn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年秋季藝術(shù)品展銷會(huì)交易合同3篇
- 2024年私人房屋租賃管理服務(wù)合同3篇
- 笨氯苯課程設(shè)計(jì)文獻(xiàn)
- 游學(xué)課程設(shè)計(jì)培訓(xùn)總結(jié)
- 甜點(diǎn)面包烘焙 課程設(shè)計(jì)
- 環(huán)保課程設(shè)計(jì)理念有哪些
- 醫(yī)院醫(yī)療質(zhì)量安全管理制度與規(guī)范
- 研學(xué)課程設(shè)計(jì)國(guó)風(fēng)藝術(shù)
- 粽子醬的制作課程設(shè)計(jì)
- 中國(guó)田園犬行業(yè)銷售工作總結(jié)
- 五年級(jí)上冊(cè)小數(shù)遞等式計(jì)算200道及答案
- 教育用地劃撥流程
- 制造業(yè)智能制造工廠布局方案
- 10《吃飯有講究》教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治一年級(jí)上冊(cè)統(tǒng)編版
- 2024年中考數(shù)學(xué)二輪復(fù)習(xí)二次函數(shù)綜合(含答案)
- 拆除鋁合金門窗及附窗安全協(xié)議書
- 體外診斷試劑-C反應(yīng)蛋白(CRP)測(cè)定試劑盒(膠乳增強(qiáng)免疫比濁法)臨床評(píng)價(jià)報(bào)告-血清
- 八年級(jí)物理上冊(cè)(滬粵版2024)新教材解讀課件
- 人教版數(shù)學(xué)四上《大數(shù)的認(rèn)識(shí)》說課稿
- 氣胸講課課件
- 2024年典型事故案例警示教育手冊(cè)15例
評(píng)論
0/150
提交評(píng)論