
文章插圖
1. 前言Gartner預(yù)測到2023年,全球3/4的數(shù)據(jù)庫都會跑在云上,云原生數(shù)據(jù)庫最大的優(yōu)勢之一便是天然擁有云計算的彈性能力,數(shù)據(jù)庫可以像水、電、煤一樣隨取隨用,而Autosaling能力便是彈性的極致體現(xiàn) 。數(shù)據(jù)庫的Autoscaling能力是指數(shù)據(jù)庫處于業(yè)務(wù)高峰期時,自動擴容增加實例資源;在業(yè)務(wù)負載回落時,自動釋放資源以降低成本 。
業(yè)界的云廠商AWS與Azure在其部分云數(shù)據(jù)庫上實現(xiàn)了Autoscaling能力,阿里云數(shù)據(jù)庫同樣實現(xiàn)了其特有的Autosaling能力,該能力由數(shù)據(jù)庫內(nèi)核、管控及DAS(數(shù)據(jù)庫自治服務(wù))團隊共同構(gòu)建,內(nèi)核及管控團隊提供了數(shù)據(jù)庫Autoscaling的基礎(chǔ)能力,DAS則負責(zé)性能數(shù)據(jù)的監(jiān)測、Scaling決策算法的實現(xiàn)及Scaling結(jié)果的呈現(xiàn) 。DAS(Database Autonomy Service)是一種基于機器學(xué)習(xí)和專家經(jīng)驗實現(xiàn)數(shù)據(jù)庫自感知、自修復(fù)、自優(yōu)化、自運維及自安全的云服務(wù),幫助用戶消除數(shù)據(jù)庫管理的復(fù)雜性及人工操作引發(fā)的服務(wù)故障,有效保障數(shù)據(jù)庫服務(wù)的穩(wěn)定、安全及高效 。其解決方案架構(gòu)如圖1.所示,Autoscaling/Serverless能力在其中屬于“自運維”的部分 。
圖1. DAS的解決方案架構(gòu)
2. Autosaling的工作流程數(shù)據(jù)庫Autoscaling整體的工作流程可定義為如圖2.所示的三個階段,即“When:何時觸發(fā)Scaling”、“How:采取哪種方式Scaling”及“What:Scaling到哪個規(guī)格” 。
何時觸發(fā)Scaling即確定數(shù)據(jù)庫實例的擴容與回縮的時機,通常的做法是通過觀測數(shù)據(jù)庫實例的性能指標,在實例的負載高峰期執(zhí)行擴容操作、在負載回落時執(zhí)行回縮操作,這是常見的Reative被動式觸發(fā)方式,除此之外我們還實現(xiàn)了基于預(yù)測的Proactive主動式觸發(fā)方式 。關(guān)于觸發(fā)時機在2.1章節(jié)會進行詳細的介紹 。Scaling的方式通常有ScaleOut(水平擴縮容)與ScaleUp(垂直擴縮容)兩種形式 。以分布式數(shù)據(jù)庫PolarDB為例,ScaleOut的實現(xiàn)形式是增加只讀節(jié)點的數(shù)量,例如由2個只讀節(jié)點增加至4個只讀節(jié)點,該方式主要適用于實例負載以讀流量占主導(dǎo)的情形;ScaleUp的實現(xiàn)形式是升級實例的CPU與內(nèi)存規(guī)格,如由2核4GB升級至8核16GB,該方式主要適用于實例負載以寫流量占主導(dǎo)的情形 。關(guān)于Scaling方式在2.2章節(jié)會進行詳細的介紹 。在擴容方式確定后需要選擇合適的規(guī)格,來使實例的負載降至合理的水位 。例如對于ScaleOut方式,需要確定增加多少個實例節(jié)點;對于ScaleUp方式,需要確定升級實例的CPU核數(shù)與內(nèi)存,以確定升級至哪種實例規(guī)格 。關(guān)于擴容規(guī)格的選擇在2.3章節(jié)會進行詳細的介紹 。圖2. Autoscaling的工作流程圖示
2.1 Autoscaling的觸發(fā)時機
2.1.1 Reactive被動式觸發(fā)(基于觀察)
基于觀察的Reactive被動式觸發(fā)是當前Autoscaling主要的實現(xiàn)形式,由用戶為不同的實例設(shè)置不同的擴、縮容觸發(fā)條件 。對于計算性能擴容,用戶可以通過設(shè)置觸發(fā)CPU閾值、觀測窗口長度、規(guī)格上限、只讀節(jié)點數(shù)量上限及靜默期等選項來配置符合業(yè)務(wù)負載的觸發(fā)條件;對于存儲空間擴容,用戶可以通過設(shè)置空間的擴容觸發(fā)閾值及擴容上限來滿足實例業(yè)務(wù)的增長,并避免磁盤資源的浪費 。被動式觸發(fā)的配置選項在3.2章節(jié)會進行詳細的展示 。
Reactive被動式觸發(fā)的優(yōu)點是實現(xiàn)相對容易、用戶接受度高,但如圖3.所示,被動式觸發(fā)也存在其缺點,通常Scaling操作在達到用戶配置的觀測條件后才會真正執(zhí)行,而Scaling操作的執(zhí)行也需要一定的時間,在這段時間內(nèi)用戶的實例可能已經(jīng)處于高負載較長時間,這會在一定程度上影響用戶業(yè)務(wù)的穩(wěn)定性 。
圖3. 被動式觸發(fā)的擴容資源對比圖示
以上關(guān)于本文的內(nèi)容,僅作參考!溫馨提示:如遇健康、疾病相關(guān)的問題,請您及時就醫(yī)或請專業(yè)人士給予相關(guān)指導(dǎo)!
「愛刨根生活網(wǎng)」www.malaban59.cn小編還為您精選了以下內(nèi)容,希望對您有所幫助:- mysql定時備份數(shù)據(jù)庫命令 mysql數(shù)據(jù)庫自動備份方法
- 阿里云服務(wù)器租用費用 阿里云服務(wù)器怎么樣
- 一人被批捕一人被監(jiān)視居住 阿里女員工案王某文為何未被批捕
- 盤點阿里的10個賺錢項目 阿里創(chuàng)業(yè)平臺怎么賺錢
- 阿里女員工案王某文為何未被批捕?律師回應(yīng):反映檢察院對該案慎重
- 阿里女員工案王某文為何未被批捕?檢方和代理律師回應(yīng)
- 阿里女員工案王某文為何未被批捕
- 阿里女員工被侵害案:1名嫌犯被批捕
- 數(shù)據(jù)庫數(shù)據(jù)去重方法 mysql查詢?nèi)ブ睾蟮目倲?shù)
- 數(shù)據(jù)庫遷移的兩種方法 oracle數(shù)據(jù)庫遷移方案對比
