專訪每日互動CTO 葉新江丨數據智能的未來,是不提大數據但其無所不在的時代
回首過去十年,我們見證了大數據從概念誕生到行業落地,逐漸發展到基于數據中臺驅動決策的數據智能時代。作為后互聯網時代的產物,數據智能必將是未來很長一段發展階段的核心所在。
每日互動(個推)作為數據智能行業的代表企業之一,于今年迎來了第一個十年。在這十年間,每日互動以消息推送起家,借助技術力量拓寬以數據智能為核心的業務范疇,現已成長為一家在A股上市的數據智能企業。
但“數據智能”這個詞,對于大眾來說仍然相對比較陌生。數據行業從業者如何定義“數據智能”?過去的十年間,每日互動經歷了怎么樣的發展歷程?即將到來的“數據智能”新十年,每日互動又將以什么樣的角色參與當中?
在每日互動十周年之際, SegmentFault 思否帶著以上這些問題,對每日互動 CTO 葉新江進行了一次專訪。
一、何謂“數據智能”?
隨著移動互聯網時代的到來,互聯網內容傳播和展現形式發生了巨大的變化,也讓數據的量級和形態發生了改變,數據服務也隨之發生了轉變。傳統的數據服務基本只針對于數據本身,而數據智能作為一種由數據、算力和算法等驅動的技術手段,具備著賦能企業進行管理和決策的能力。
1、數據智能是今年非常熱門的一個話題,能否談談對于「數據智能」和「數據中臺」的定義與理解?
目前數據經濟在國家層面是一個非常重要的發展方向,但同時也延伸出了一個亟待解決的問題 —— 如何把各個行業的數據作為生產要素,通過數據治理發揮出更進一步的作用。
針對看不見摸不著的數據,需要有一個東西能進行有感管理,數據中臺就是一種用來進行數據治理的產品或者平臺,而數據智能則屬于一個更為廣義的范疇,它是以數據作為生產資料,通過結合大規模數據處理、數據挖掘、機器學習、人機交互、可視化、云計算等多種技術,從大量的數據中提煉、發掘、獲取知識,為人們在制定決策時提供有效的支持,減少或者消除不確定性的解決方案。
這兩個詞看起來很接近,但其實是不同維度的。以我們公司來講,數據中臺更多的是一個產品,體現了我們公司的數據能力;而數據智能則包含更多技術,融合了更多的行業知識,中臺是其中一個很重要的工具。打一個形象的比喻,數據中臺或者平臺是一個電腦的操作系統,而數據智能則是結合業務,使用這個電腦,利用多種技術進行APP開發,并且不斷進行優化的過程。
2、您認為數據中臺的「行業壁壘」和「技術壁壘」分別是什么?每日互動作為一個成功上市的專業數據智能服務公司,自身在這個領域內具備的最大優勢是什么?
目前市面上有很多數據中臺類的產品,據我們觀察,其中大部分的重點仍主要聚焦于數據治理的能力,但這可能只是數據中臺的“第一步”。
對于數據中臺產品來講,技術壁壘可能并不是很高。中臺會應用到的技術,雖然有些功能可以通過直接使用開源產品來實現,但也有不少標準或者要求,比如安全性、實時性、可視化能力等,需要專業的技術來定制實現。
當然在數據中臺層面,采用的技術架構不同、產品設計的理念不同也是可以有差異的,譬如是否容易使用、容易理解、對資源要求是否經濟等。
如果希望通過數據中臺中來解決業務問題,實現降本增效或者發現新的業務模式,這就不是數據治理能解決的問題,需要有對行業的深度理解,也就是所謂的行業壁壘。
每日互動和其他大數據公司的差別,就體現在如何挖掘數據價值的層面。
每日互動的第一款產品是消息推送服務,這是一項跟數據緊密相關的業務。為了支撐這項業務的進行,實現消息推送在海量數據量下的快速響應,每日互動一直在嘗試為企業內部打造一個業務 + 數據平臺的協同閉環。這也為之后公司推出數據服務產品打下了很好的基礎。
在數據服務層面,每日互動既是服務的提供者也是使用者,這是我們在這個領域內最大的優勢。
3、數據服務領域是否有一套標準化的判定體系?如何評定服務能力與技術水平的高低?
數據服務領域暫時還沒有一套國際或者國家權威機構提出的行業標準。究其原因,是因為數據服務在不同的行業間有著很大的差別,與一般的技術體系相比,具備更強的服務屬性。
對于客戶來說,挑選數據服務的時候會有幾個考量的維度:
? 平臺是否可以快速部署;
? 部署所耗費的資源是否合理;
? 能否借助數據服務快速實現業務提升;譬如是否能快速開發出業務的新需求,是否能很好地完成內部各個角色之間的協同。
這三項標準會是客戶選擇服務時的決策依據。但在選擇完之后,服務商應該如何完成、如何實現客戶提出的需求,因為沒有清晰的界定與評判方式,需要客戶在選型時進行綜合性的考慮,并在后續實際的業務場景中去感受平臺的服務能力。
這種情況其實也和市場需求有關。目前國內企業提出的需求都較為“定制化”,再加上不同行業間的差異,導致國內的數據服務公司大部分是結合行業提供垂直的數據服務能力。
二、每日互動發展的每一步,踩的都是行業需求
我國的數字經濟發展才剛剛開始,數據智能服務的能力也在不斷迭代、發展。人工智能、區塊鏈、知識圖譜、可視化等新興技術,都可以作為底層的技術支撐為數據智能服務賦能,從而讓我們的數據服務具備更強大的能力,產生更多價值。
1、每日互動的發展經歷了多個階段,技術也在不斷迭代和演進。能否簡要分享一下不同階段的業務邏輯重點以及技術研發重點?
每日互動是我們的消息推送產品,做得比較早并且比較成熟了。但其實我們公司發展到現在已經十年了,業務范疇也早就不止是消息推送了。
公司發展的第一個階段是 2010 年到 2013年。當時我們的核心團隊主要是在打磨消息推送的能力,也就是一套大規模的通信系統 + 互聯網搜索系統,這是一個比較垂直但對于技術要求很高的領域。
2014年至2018年,公司進入了數據價值的“掘金”與“實踐”階段。在不斷精進推送能力的同時,我們發現系統產生了非常多的數據,如何讓這些數據發揮價值成為了我們需要思考和解決的問題。也是從這個階段開始,每日互動開始致力于大數據系統的研發。
每日互動的消息推送產品每天會產生幾十個 T 的數據,如何存儲、清洗、建模,如何在業務場景中產生商業化的價值,這是這一階段我們的研發重點。經過幾年的業務培養與場景實踐,我們將在數據服務領域沉淀下來的能力和 know how(知識、經驗、流程) ,變成一種可以服務于更多行業的產品,可以說公司正式進入到了數據智能的階段。
2019年3月,每日互動成功在A股創業板上市,也引起了數據智能領域的一次新風潮。
在今年的疫情過程中,每日互動數據智能的能力得到了相當程度的驗證。疫情期間,我們與李蘭娟院士取得聯系,與李蘭娟院士團隊合作成立聯合戰隊。通過大數據技術,聯合戰隊對疫情發展態勢進行了研判,幫助疫情防控部門找到工作重點區域、重點人群和重點場景。在全國逐步有序恢復生產的時候,每日互動也充分發揮大數據能力并參與其中,為多個省份的疫情聯防聯控與民生保障、復工復產的有序統籌提供了決策參考依據。
當然,每日互動的數據智能服務仍然是在不斷迭代發展的。隨著人工智能、區塊鏈、知識圖譜、可視化等等新興技術的發展,這項基于數據的服務也將產生更多的價值。
2、每日互動致力于打造“每日治數平臺”,目標方向是什么樣的?與一般的中臺產品有什么區別?
「每日治數平臺」其實也是數據中臺的概念,但我們提供的數據服務主要是應用于數據治理領域,所以命名為治數平臺更為準確。
這個平臺還有一個提煉后的名字 —— DMP。D 代表了數據(DATA),M 代表了 機器(MACHINE),而 P 則代表了人(PEOPLE)和專業(PRO)。這幾個關鍵詞也代表了我們平臺的定位,即數據作為底層資料,快速專業地服務于具體業務當中。
我國的數字經濟發展其實才剛剛開始,據了解,不少企業并不知道該如何進行數字化、智能化的轉型,業內也缺乏專業的數據人才。
因此,我們的目標方向和傳統的數據中臺不同。我們希望真正將每日互動 know how 的能力沉淀下來,形成客戶可以復用的服務或平臺產品。之所以想要打造這樣的一個平臺,背后其實也是基于用戶的實際需求。
3、每日互動的第一個客戶是哪家企業?
每日互動消息推送業務的第一個客戶是新浪微博。當時微博非常火,有著上億的用戶量,消息推送對他們來說是不可或缺的一項功能。
2011年,我們主動聯系了微博相關業務的負責人,表示可以提供專業的消息推送服務,用更低的成本來實現更好的效果,這也是我們能夠打動他們的原因。
之所以第一個客戶就敢挑戰“行業頂配”的難度,一方面是技術團隊自身具備扎實的技術基礎和行業基礎,另一方面就是前面提到的,我們在支持自身業務的過程當中沉淀下來的數據和技術能力。
有這樣一個需求明確的大客戶,讓我們的技術服務能力得以更加高效地迭代,大大加快了技術進步的速度。
接受挑戰并做到“極致”,正是我們公司的工程師文化,對此我們感覺很自豪。
4、目前面向的客戶群體有哪些,涉及哪些領域?
隨著數據能力的增強,以及對于行業理解的不斷加深,我們目前的服務客戶已經擴展到四大領域 —— 互聯網、公共服務、風控服務和品牌營銷服務。
以金融領域為例, 很多金融機構內部有自己的 App,涉及推送、統計、分析之類非常繁復的數據和信息處理場景。我們幫他們打造了一個集成的消息平臺中心,解決了消息處理的分散問題,改善了工作流程。在深度溝通之后,我們發現數據智能服務在金融行業中是一個非常重度的業務場景,為此我們也在考慮開發專門針對金融行業的治數平臺。
5、對于數據公司來說,數據安全是紅線。每日互動如何保障數據安全性?
每日互動團隊自建立之初,便非常注重對于數據安全的保障。正如問題所說,數據安全對數據公司來說是紅線,每日互動始終認為保護用戶數據隱私是企業必須要堅守和捍衛的行業準則、道德底線,并要時刻保持對數據安全的敬畏之心。
每日互動在嚴格落實合規和監管要求的同時,倡導行業自律,積極聯合行業伙伴的力量,共同推動行業的健康發展。今年8月,由每日互動牽頭起草的《信息安全技術移動互聯網應用程序(App)SDK安全指南》國家標準項目,獲得全國信息安全標準化技術委員會正式立項,這將有助于SDK行業在開發、運營、信息處理、安全管理等環節向更規范的方向邁進。
在今年的國家護網行動當中,每日互動在三四百家參選企業中不借助外部安全公司的力量,僅憑公司自身的安全能力,便取得了第 11 名的成績,還是很自豪的。
三、大數據的未來,是不提大數據但是數據又無處不在的時代,“你意識不到我的存在就是我最大的存在”
隨著數據產業的規模越來越大,生態分工在未來將會越來越細,數據服務也將越來越細。而隨著人工智能、云計算、物聯網等技術的發展,大數據會不會和互聯網一樣,不再成為人們單獨討論的概念,而是成為像水電一樣的基礎設施,服務于各行各業中?
1、隨著社會的發展,未來的數據會呈現多形態共存的狀態。您認為未來幾年大數據領域會出現什么樣的一些變化?哪些因素將推動這些變化?你們的生態布局是怎么樣的?
隨著 5G 的成熟,數據領域的發展將從基礎的量變迎來一次質變,成為像水電一樣的社會基礎設施。
近幾年大家其實很少再單獨討論互聯網的概念,其中的一個因素,我認為是互聯網已經不再是新鮮事物,現階段技術的發展基于互聯網但又高于互聯網,大數據之后的發展肯定也會這樣,數據智能的未來,雖然基于大數據,但是不會再單獨討論大數據的概念。
從技術層面來看,大數據行業的發展對海量數據的存儲、處理、挖掘需求肯定會越來越高,未來可能也會誕生出幾個巨頭,將行業進行更加明確的細分。這是一個大家已經能夠觀察到的趨勢。
隨著數據產業的規模越來越大,生態分工在未來將會越來越明確,數據類的服務也將越來越精細化。我們打造的每日互動每日治數平臺,就是希望能夠參與到生態的建設當中,甚至圍繞平臺打造出一種新的生態。
2、業內最近有個觀點:“云原生體系架構是云服務時代的數據管理方法論”,從技術角度來看,您如何評判云與數據智能間的關系?
不同的人評價同一件事肯定會有不同的出發點,這個觀點看起來應該是云服務廠商提出的(笑)。很巧,我前一陣也跟吉利公司的人在討論這個問題,他們最近剛從一家云廠商中遷移出來。
對企業來說,上不上云、選擇公有云還是私有云、選擇哪家云廠商需要考慮幾個維度:成本吃不吃得消、是否自主可控、當不滿足業務需求或者服務需求時是否方便切換等。
以每日互動為例,我們目前不會將數據放到第三方的云上,但從資源的調度、成本的控制等方面來看,云體系已經是一個公認的標準答案,所以我們也會使用云計算的相關技術,比如容器云、虛擬化等。
3、物聯網、AI、機器學習等新技術的出現,對行業來說是機會還是挑戰?每日互動應對技術的發展是否有做哪些前瞻性的探索?
新技術的出現,對行業來講既是機會也是挑戰。每次新技術的出現,都能為人類解放生產力或者提高生產力提供了可能性。
但一些技術因為過于“新”,暫時還沒有找到發揮能力的場景,沒辦法發揮出實際的社會價值,讓企業的投入與產出不成正比。
每日互動還成立了數據智能研究院,目前研究的方向是探索如何將技術更好地服務于具體的業務當中。比如我們對物聯網技術方向的探索,是想將自身的推送技術能力延伸到電視機、汽車等場景當中;對機器學習和區塊鏈的探索則是為了進行一些業務模式的研究。
技術是面向未來的,但用戶的需求是現在的。對于我們來說,目前的重點還是如何借助技術快速迭代服務能力,為用戶以及行業賦能。
回顧大數據行業和每日互動的發展時間線,不難發現每日互動成立的這十年,恰巧也是大數據從一種輔助工具向引領發展方向的核心引擎轉變的十年。
隨著大數據行業的發展,國家正在大力發展數字經濟,企業正在迎來一波借助數據智能實現數字化、智能化的轉型新浪潮。在這股浪潮中,開始“治數”的每日互動將會扮演一個什么樣的角色?我們拭目以待。
-
最高支持300萬元 成都印發《成都市促進大數據產業發展專項政策》[2021-06-29]
-
中國工業互聯網研究院江蘇分院國家工業互聯網大數據中心江蘇分中心落戶蘇州[2021-01-06]
-
歐科云鏈集團:區塊鏈大數據的機遇與展望[2021-07-26]
-
萬基控股用能數據“聯網”河南省能源大數據中心[2021-02-02]
-
國際集裝箱道路運輸企業大數據中心落戶寶山“鴨嘴獸”公司[2021-03-05]
-
中國地名大數據中心在京啟動 助力地理信息產業數字化轉型發展[2020-11-29]
-
平臺經濟應在規范中發展[2021-04-12]
-
貴州力爭今年大數據領域投資額達到170億元[2022-04-01]
-
華為面向運營商發布數據存儲OneStorage解決方案[2021-02-25]
-
北京市經信局:市大數據平臺已匯聚近三千萬條涉稅數據[2021-09-17]
-
微盟集團設立數據智能產業基金 布局云計算和AI、大數據[2021-02-22]
-
“能源大數據創新發展”論壇在榕舉行,探討中國能源大數據發展之路[2021-04-27]