當前位置:菜譜大全網 - 菜譜 - 天妃系統電子菜單

天妃系統電子菜單

羅申是阿裏雲天妃負責虛擬網絡的系統。她為阿裏雲的客戶提供了豐富的網絡產品,比如VPC和SLB。同時也是ECS、RDS、OSS、NAS等超過100個雲產品的網絡基礎設施。她還支持了阿裏巴巴集團和螞蟻金服集團的許多業務,如電子商務、支付和物流。

“最好的網絡就像神壹樣,無處不在,感覺不到她的存在...既復雜又簡單,這是我們努力的方向。”?-孫程顥,阿裏雲高級網絡技術專家。

8月2065438杭州大會主會場,阿裏雲產品總監何介紹了阿裏雲自主研發的雲操作系統全面升級版天妃2.0。作為天妃2.0的核心組件之壹,洛神首次揭開了她神秘的面紗。阿裏雲資深網絡技術專家孫在隨後的未來網絡技術專場上對洛神做了更詳細的講解。本文首次系統地闡釋了天妃洛神的概念、沿革、結構和特征。

什麽是飛天女神?

在物理網絡和用戶感知的網絡之間有壹個虛擬網絡層。在阿裏雲,我們把這個虛擬網絡系統命名為洛神。洛神是阿裏雲天妃負責虛擬網絡的系統。她為阿裏雲的客戶提供了豐富的網絡產品,比如VPC和SLB。同時也是ECS、RDS、OSS、NAS等超過100個雲產品的網絡基礎設施。她還支持了阿裏巴巴集團和螞蟻金服集團的許多業務,如電子商務、支付和物流。在全球範圍內,洛神服務於各行各業超過百萬的用戶。在雙十壹、世界杯、春運高峰等互聯網流量高峰時段,默默為每壹位消費者的流暢網絡體驗保駕護航。

很多人都知道阿裏雲有壹個Apsara系統。系統中的每個組件都以不同的神命名,包括盤古、伏羲、女媧、神農等。其中盤古是分布式文件系統,伏羲是分布式調度系統。虛擬網絡系統為什麽叫洛神?在古代,河運是非常重要的交通工具,就像今天的網絡壹樣。所以我們在給虛擬網絡系統命名的時候,就把河神命名為洛神。

《飛天女神羅》的結構

洛神是阿裏雲分布式操作系統天妃的壹部分。在天妃的基礎設施中,最頂層是各種雲產品,包括大家熟悉的雲產品RDS、ECS、VPC、SLB等。這是天妃的三個基本組成部分,包括存儲系統盤古、資源管理伏羲和網絡管理洛神。換句話說,洛神不僅支持阿裏雲的網絡雲產品,還在支持其他雲產品的網絡基礎設施方面發揮著重要作用。

說到洛神的技術架構,洛神系統由三個模塊組成。

–數據平面、控制平面和管理平面。

數據平面負責處理雲網絡中的數據包。它就像物理世界中的網線和路由交換設備壹樣,高效率、低延遲地將數據包從發送方發送到目的地。同樣,洛神數據平面也包含各種具有不同作用的組件,包括支持各種類型計算形式的虛擬交換機、用於數據中心互聯的DCN網關、用於連接公網和雲網絡的互聯網網關、用於雲下互聯的混合雲網關、提供負載均衡能力的負載均衡網關和提供終端接入能力的智能接入網關。為了提高這些組件的轉發性能,洛神不僅使用了軟轉發技術,還廣泛使用了軟硬件結合甚至純硬件技術。

控制平面控制如何處理數據包。是洛神的商業大腦。從技術上來說,洛神的控制平面是壹個分層分布式控制系統。最底層的設備控制器主要負責控制和管理數據平面的各種組件。同時,每個區域有壹個虛擬網絡控制器,整個世界有壹個全局路由控制器。區域虛擬網絡控制器負責本地雲網絡的管理和調度,全局路由控制器負責協調和調度各個區域的資源,形成全局雲網絡。NFV控制器基於虛擬網絡控制器和全局路由控制器,完成VPN等產品的高級虛擬網絡功能的配置和抽象。

洛神的管理平面是網絡運維的中心,管理著大量的網元和用戶。這裏的海量指的是幾千萬臺虛擬機,幾百萬個網元。為了實現這壹點,洛神的管理平臺基於大數據和機器學習技術。它對網絡運行過程中產生的海量數據進行實時/離線計算和數據建模,驅動網絡資源的提前規劃、網絡系統的日常維護和網絡產品的智能運營。整個管理平面包含壹套高性能、分布式的數據分析系統,由其分析的數據提供給智能運維系統,完成資源規劃、網絡建設、系統變更、實時監控、故障逃逸、產品運營等網絡產品的全生命周期。最終達到消除無人值守的網絡變更、先於用戶發現問題、高效簡單的故障逃逸、豐富全面的產品和用戶運營的效果。

飛神的技術進化之路

洛神能成為飛天四柱之壹,非壹日之功。洛神的演變經歷了四個階段。

首先是經典的網絡階段。現階段網絡只有壹個概念,就是公網帶寬。經典網絡階段的問題是用戶無法定制網絡拓撲,導致用戶無法完成雲下的混合雲連接。為了解決這個問題,羅申進入了VPC階段。在VPC階段,洛神在每個地區虛擬了數百萬個網絡,用戶可以完全定制這個網絡。隨著網絡規模越來越大,洛神也從區域網絡進入全球網絡階段。現階段,洛神主要解決如何更好地管理超大規模網絡的問題。雲企業網和雲連接網構成了第三代洛神的兩大主要特點。

在滿足了各大客戶的需求後,我們開始思考如何進壹步提升用戶體驗。用戶對網絡的核心訴求是什麽?其實客戶最大的抱怨就是網絡夠強夠可靠,可以避免問題。就像使用水和電壹樣,用戶不需要知道電站和泵站在哪裏。所以羅申希望網絡對用戶不敏感,無處不在。洛神的發展是壹個從0到1,到100,再回到0的進化過程,這是我們研發下壹代洛神的努力方向,這也是我們在業界首次提出無網概念背後的思考。

飛天洛神的特點

洛神的關鍵特征包括安全性、靈活性和可靠性,這也是洛神最終無網狀態的關鍵特征。

安全是基本盤,因為疊加技術隔離了網絡邏輯,用戶的網絡之前根本不會互通。洛神還包含各種加密服務,可以給用戶創造更深層次的安全。彈性有兩個數字,壹個是二級轉發性能彈性,洛神支持壹秒從1MB到1TB的彈性,壹個是規模彈性。洛神單網支持10w計算節點規模。這樣洛神不僅可以支持小到虛擬web主機的業務,還可以支持雙11零等海量峰值流量。說到可靠性,我們指的是年平均故障時間這個參數。洛神造成的單實例失敗時間只有50ms,極短。

關鍵設計

接下來,我們將詳細分析洛神的彈性和可靠性的關鍵設計。洛神系統的數據平面本身就是壹個巨大的開關。眾所周知,交換機的轉發芯片是流水線處理數據包的,硬件處理永遠不會停止,洛神的數據平面也是如此。從壹個數據包進入洛神系統的開始,到走出洛神系統的整個過程,洛神系統中的所有組件都不會中斷,所以只處理壹件事情的數據平面壹定是高效的。洛神的數據平面包括軟硬件結合的轉發技術和架構。另外,洛神系統的網絡永遠不會因為維護而中斷,也就是說洛神內部所有組件都支持熱升級。

從可靠性的角度來看,多機房容災是高可用性的基礎。阿裏雲某數據中心的雲機房開始部署時,會先部署物理設施後,再部署洛神系統。此時,機房內有計算集群、網關和控制平臺。計算集群上有我們的虛擬交換機組件。數據平面和控制平面的關鍵節點都部署在集群中,單個服務節點的問題不會對用戶造成任何影響。當虛擬機的主機出現宕機等嚴重問題時,可以在機房範圍內進行遷移,遷移本身不會對虛擬機的網絡屬性和連通性產生任何影響。每個雲機房都會部署集群網關和控制器節點,隨著機房的增加,雲機房內會自動形成循環備份關系。當新建壹個機房,部署了洛神系統,它就會自動加入這個備份鏈。這樣,當壹個機房的關鍵節點因異常出現問題時,可以自動切換到二級備份機房,由備份機房的洛神系統提供服務。這種多級容災機制保證了用戶可以在短時間內恢復業務。

除了多機房容災,如何快速發現bug,快速恢復是可靠性的另壹個關鍵點。為了解決這個問題,羅申首先設計了基於流程的染色系統。如果把洛神系統看成壹個整體的交換機,那麽從特性上來說,洛神系統就是壹個支持流量跟蹤,有各種豐富策略的交換機。洛神系統下面是物理網絡的設備和交換機。通過流標記的能力和洛神系統的set策略,妳可以在物理網絡和虛擬網絡中都擁有對特定消息的流染色、鏡像、采樣和跟蹤的能力。這些操作生成的日誌將在收集後進行實時計算。如果流量異常,將生成警報和日誌並發送給管理員。壹些警報可以觸發故障的自動處理和恢復。還有壹部分數據會經過計算處理,產生數據報表和用戶畫像,還能給用戶壹個很酷的大屏。這本質上就是數字化的能力。

結束語

天妃洛神的使命是讓網絡更簡單。眾所周知,AWS提出了無服務器的概念。與無服務器類似,洛神以無網絡概念為設計目標。我們希望用戶不再關心網絡拓撲、網絡帶寬、網絡地址等專業技術,讓用戶意識不到網絡的存在。無網首先是通過不斷提高網絡的靈活性和可靠性來實現的。此外,關鍵特性是NAAS,它允許用戶只關心網絡通信,而不需要關心網絡的各種組件。