少數派萬國數據:數據中心的「有限規則」與「無限游戲」
“世上至少有兩種游戲,一種可稱為有限游戲,另一種稱為無限游戲,有限游戲以取勝為目的,而無限游戲以延續游戲為目的?!薄队邢夼c無限的游戲》
2019年萬國數據關于數據中心運營的討論會上,這樣的表述第一次和數據中心業務產生交集。
彼時疫情還未發生,萬國數據也未在港交所二次上市,數據中心還沒得到新基建概念的加持,在數據中心這一略顯偏門的領域,能把運營講透的人少之又少。
萬國數據高級副總裁梁艷
萬國數據高級副總裁梁艷一定是其中之一,她負責萬國數據中心設計與運營管理,搭建數據中心運營系統和管理平臺,截至2021年第一季度末,萬國數據在京津冀地區、長三角地區、粵港澳大灣區及西南等地區部署了70座自建數據中心,運營中的總機房面積近33.3萬平方米。
“運營為什么難——設計其實是有限規則,0與1都是固定的,但是運營是無限規則,萬國數據運營團隊有一個人今天上班心情不好,跟老婆吵架了,晚上打盹了,他一失手做的事情都可以讓萬國數據面臨災難,所以運營它是無限規則?!?/p>
深刻且直白,梁艷的話到今天依然適用。不同的是,相比于她剛接手設計團隊時,理論懸而未落,本次鈦媒體App再次來到萬國上海六號數據中心,見到了理論具現化之后的產品與體系,萬國數據將其命名為“GOCC全球運營指揮中心”。
主業與副業
“美國第三方IDC(Internet Data Center,互聯網數據中心)已經有20年的積累,而中國才起步6-7年,現在中國每年的增量大概是美國的3倍,有望在未來10年內趕超美國的體量?!?,梁艷感慨道。相對應地,中國數據中心運營體系的建設時間表也被大大壓縮。
萬國數據超過700家的客戶中,包括大型國有銀行及商業銀行、國內外頂尖的金融服務機構、大型知名跨國公司、地方政府、電信與 IT 服務商,以及國內互聯網與云計算及各垂直行業的領軍企業,關乎國計民生,任何一點疏漏都可能成為熱搜新聞。
“可能很多人認為,干運維的就是在公司里價值比較低,不出事,大家都不知道我們的重要性,出了事,老板才意識到我們的重要性,但是在萬國數據不是這樣”,梁艷說道。
運營崗位對其他數據中心來說是副業,是為了保障主營業務的穩定運行,而對于萬國數據來說,運營就是主業,出發點不同導致了萬國數據運營體系全盤皆不同。
高可用、高安全、高效率、高滿意度是萬國數據運營的四個基本目標,在梁艷看來,做運營是一次長跑,不是一次性工程,飛機飛上天還能下來休息一會兒,萬國數據只要數據中心一旦上電,就始終處于空中航行狀態,所有的應急指揮、維修、調度等等全部都要在空中完成。
“看不到,聽不到,靠電話,靠老師傅”,是數據中心運營長久存在的弊端,當故障無法定位時,只能一點一點的憑經驗去試,大部分數據中心還停留在傳統階段。
“這個行業沒有那么多老師傅,那個時候我們就堅定要研發系統,做到輔助決策”,梁艷表示?!肮芾砑聪到y,系統即管理,沒有系統的管理很難做到不走偏,GOCC創始團隊一代一代的迭代,研發系統跟著管理系統一直升級,才有了今天GOCC的雛形”。
今天的萬國數據已經進入到“造飛機”的領域,因為行業里已有產品不能百分百滿足萬國數據運營的場景需求,運營反向推動設計和研發,或者只有在萬國數據才能發生,“不合理”邏輯的背后存在著必然。
GOCC的誕生
據了解,萬國數據歷經近十年研發GOCC,對標百年歷史民航體系,能夠應對環境災難、疫情等在內的外部突發類事件,保障環境安全、人員安全,算算時間,GOCC的誕生就是萬國數據新運營體系的起點。
萬國數據GOCC核心區
2020年疫情突如其來,為萬國數據帶來了現實的考驗,也進一步完善了萬國數據運營體系。此外,考慮到未來數據中心規模的持續增大,萬國數據將數據中心整體架構進行了立體化的分化,構建起全球運營指揮中心(GOCC)、區域運營指揮中心(ROCC) 和單座數據中心(DCU)的三道防線。
● GOCC(Global Operation Command Center) :強風控、全球支持——離岸集中監控、風險預判和危機管控、跨國資源協調;
● ROCC(Regional Operation Command Center) :強監護、強調度——集中監護和技術支持、應急指揮和資源調度、資格認證和授權中樞;
● DCU(Data Center Unit) :強操作、強應急——快速恢復、快速維護、現場服務。
“我們公司是業界少有的團隊結構——一家做數據中心IDC的運營團隊可以養研發團隊。”梁艷表示?!拔覀冞@支研發團隊一直獨立存在,這也是我們的堅持,其他都可以拿走,研發團隊不能走,因為研發承載的是未來智能化、數字化、平臺化所有的夢想?!?/p>
數據中心的運營是一套軟硬一體的建設方法論,數字化工具需要傳感器、控制器等作為觸角,繼而形成標準化的流程平臺,向上承載,向下打穿,完成信息的流轉,實現數據中心未來的自動駕駛。
鈦媒體App了解到,在萬國數據全國數據中心內的600多萬個有效監控測點內,每月實時處理并存儲3000+億條監測數據。萬國數據還會對這些數據進行大數據規則運算以輸出實時指令和業務預警,其中部分數據會直接用于人工智能監督學習以及自動控制和故障預測。
通過定義并建立不同的功能模型,將人的經驗和大數據分析結果融入到系統中,萬國數據橫向實現了設計、建設、接維、運營、服務全生命周期業務的數據聯通,真正利用軟件來驅動人員、運營和業務,并以此方式連接整個產業鏈,形成更加高效、優質的數據中心交付及服務生態。
運營在規則,更在于人
比起萬國數據建立的運營體系,其如何構建起對標航空行業的“機長制”,是一個更值得行業關注的話題。
在萬國數據內部,產品、設計、建設、采購、運營、服務各部門關注的焦點都不一樣,萬國數據董事長兼首席執行官黃偉下定決心做了一個頗為大膽的決定,把設計跟運營合并,因為這兩個部門與技術強相關,合并以后,運營部門和設計部門人員互相輪崗。正如讓“開飛機”的人親自去“造飛機”一樣,輪崗后“造飛機”的人能夠把每個場景融入到飛機設計中。
“原來設計與運營不能充分溝通理解,運營覺得設計方案不便維護,可擴展性差等等,但當運營人員到設計部門輪崗一年,回來完全變了樣,為了提高一點空間效率,運營人員寧愿麻煩?!绷浩G十分滿意組織打通之后的效果。
反之,設計部門比運營部門還緊張運維,從設計角度不只考慮一層故障,甚至要確保兩重三重故障后,數據中心還能穩定運營。
自2016年開始,萬國數據就將人才招聘不止局限在數據中心行業,核電、油田、銀行、航空、運營商、BAT等等不同背景都是萬國數據的目標,萬國數據有意將人才背景分散化,如此做的理由是什么?
梁艷介紹,當時萬國數據明顯感覺到,因為數據中心規模、體量的擴大,整個團隊的技術能力跟管理能力,包括系統的承載能力已經不能達到萬國數據訴求。
數據中心規則觸碰到天花板,萬國數據關心的是怎么樣把數據中心方法論建制突破到更高的標準??咳f國數據或者數據中心行業的背景,即便是巨頭也有行業局限性。
“我們一定要海納百川,比如核電是怎么管安全的,自動化程度比數據中心高得多,航空公司飛機起飛前是如何檢查配件的……所有他們的規則,都是萬國數據和數據中心行業最需要的養分,去構建我們真正龐大的系統?!绷浩G道出其中奧秘。
決策者(機長)、指揮官(塔臺或TACC)、觀察員(機務或安全員),這些航空崗位已經成為萬國數據的內部崗位?!拔覀儼堰\營的標準對標航空公司,這就是我們對于運營的理念和信仰。”梁艷自信地表示。
在幢幢數據中心內服務器的轟鳴聲中,萬國數據諳熟“運營在規則、更在于人”的道理。
(本文首發鈦媒體App 作者 | 張帥)
-
江蘇儀征構建大數據百企園區![2022-02-14]
-
融媒體大數據國家示范標準規范體系融媒指數專家委員會成立[2020-11-27]
-
中國首個跨境數據托管服務平臺投用[2022-04-19]
-
安徽省大數據發展條例今起施行[2021-05-01]
-
廣東省政務大數據中心潮州市分節點上線[2021-09-02]
-
大數據如何更好地服務于國家發展戰略[2021-03-08]
-
中國電信柯瑞文:構建5G云網數一體化基礎 開拓數字化轉型新局面[2020-12-30]
-
AI換臉、合成語音大爆發!清華《深度合成十大趨勢報告(2022)》發布[2022-02-28]
-
高效安全更及時,新華三遠程運維保障企業發展“生命線”[2022-04-18]
-
華為面向運營商發布數據存儲OneStorage解決方案[2021-02-25]
-
國家電投張成剛:云邊協同工業大數據平臺加速集團數字化轉型[2021-09-03]