CIO如何做到并保持數據驅動
五月里不斷發生一些的事件和出版的書籍將對數據、人工智能和分析世界產生深遠的影響。這些事件和書籍涵括了應該(和不應該)做決定的方式以及領導者應如何塑造一個可持續的數據驅動文化等等各方面。下面我們快速回顧一下在過去一個月可能錯過了的東西。
分析是數字轉型的關鍵
如果讀者從事技術工作,那么Gartner峰會應該是你不希望錯過的活動,Gartner峰會通常充滿了新的研究和驚喜。今年的數據與分析峰會定不會讓雄心勃勃的首席數據官(CDO)失望。
根據研究公司Gartner的數據,擁有面向業務的關鍵績效指標的CDO可以:
有效地持續產生明確的商業價值的可能性為1.7倍 有效縮短上市時間的可能性為2.3倍 在數據貨幣化方面做到有效的可能性為3.5倍
這對于那些認為數據應該成為其組織轉型中心的人來說是個好消息。在過去的一年半里,CDO有機會塑造和推動他們公司的議程。其中72%的人表示,他們正在領導或大量參與數字化轉型計劃。
然而,那些知道如何將數據作為一種資產進行管理并利用它來推動創新的組織只是例外,而不是常規。
根據《哈佛商業評論》特別提到的一項調查,近七成的組織中仍在掙扎:
只有29.2%的高管的報告說取得了轉型業務成果 30%的人報告說已經制定了一個明確的數據戰略
也許更令人擔擾的是,“數據驅動能力”據說在下降;同一調查表明,受訪者認為他們的組織是數據驅動型組織從37.8%降到24%,下降超過13個百分點。
那現在怎么辦呢?
也許過去的戰略已經無效了。也許,快速的技術顛覆對許多人來說挑戰性太大了以至于無法應付,因為需要不可思議的轉變,數據庫管理就是一個很好的例子。這種不可思議的轉變在今年的峰會上表示:
2020年數據庫管理系統市場總收入增長的86%基于云 到2023年,75%的數據庫將在云平臺上運行
如果你的公司在未來24個月內存儲和使用數據的方式將發生巨大變化,你需要建立什么能力來利用這一新的發展呢?
我筆者曾有機會與一些通過數據獲得突破的企業領導人和數字原生代合作過并研究過他們的成功。我其實也沒有什么神奇的公式,但我觀察到“數據領導者”所表現出的至少3個特征,在這里分享一下。
3個特征為:
數據即“才能” 數據即生態系統 數據即運行公司決策系統的結構
數據即才能
你會發現圍繞“數據文化”和合理決策科學存在很多資源。關于這個主題的書實際上是上個月出版的,是我最近最喜歡的書:《Framers》和《Noise》,《Framers》的作者是Francis de Véricourt、Kenneth Cukier和Viktor Mayer-Sch?nberger,《Noise》的作者是Daniel Kahneman、Olivier Sibony和Cass R. Sunstein。這兩本書都是雄心勃勃的數據管理人員必讀之作。
這些書中的知識與諸如分析培訓及“數據導師”等最佳實踐結合起來就可以幫助企業建立“數據文化”的基礎。不過,要評估維持這種文化的機會可以用到的一個好方法,那就是計算你的組織雇用“數據人”的百分比。
考慮一下這樣的場景:領導者經常說,他們的競爭優勢的來源是他們手下的人,而不僅僅是他們的產品或服務。如果這是真的,那么判斷你公司的核心競爭力的最好方法就是看看你的員工和他們的職能。
上個星期的報道指星展銀行首席執行官Piyush Gupta曾就這個話題發表過看法,他是這樣說的,“我們現在越來越覺得自己是一家提供金融服務的技術公司,而不是一家傳統銀行”。我們的工程師人數是銀行家人數兩倍”,這一事實也許證明了我們公司質的轉變。
我在月初就相關話題發布了一項LinkedIn問卷調查,問的問題是“你應當雇用占你公司總員工人數多少百分比的數據員工”。該問卷調查受到廣泛關注,瀏覽次數接近80,000,投票次數為625。
你應該雇用占總雇員人數多少百分比的“數據雇員”?(Bruno Aziza on LinkedIN)
接受問卷訪問之一的是受人尊敬的數據科學家、加州理工學院的Kirk Borne博士,他就“數據雇員”一詞提供了有用的指導。他表示:
大約100%的員工應該具備數據知識(即“認識、理解和‘談論’數據”) 三分之一的員工應該是“數據流利的”(即“用數據分析、創造論據和展示結果”) 少于10%的員工應該是數據專業人員或 是“從組織的數據資產中創造價值的受薪人員(數據科學家、數據分析師、BI專家、數據AI ML工程師、數據庫數據倉庫工程師)”
讀者公司目前的比例是多少呢?建立“數據文化 ”需要書籍、培訓、不間斷的強化和墻上的各種海報。但數據文化是由你公司的組織結構圖來維持的。所以要務必確保你的各種數字與你的雄心壯志相匹配。
數據即生態系統及相互連接的“數據網絡”威力
建立“數據文化”時另一個重要的考慮因素是你的員工所接觸到的數據類型。領導者們長久以來一直都在抱怨員工難于接觸到他們公司的生產數據。不幸的是,這只是問題一個小小的部分。
倫敦勞埃德銀行的數據產品主管Nick Blewden上個星期在網上的分享指,“數據近視”這個問題可能比你想象的還要嚴重。他發布的圖片(下圖)說出了全部情況:紅點是你公司的數據(同樣,你的團隊可能很少看到今天這些數據),灰色區域是你可以看到的數據。
所有這些都指向一個值得關注的趨勢:數據交換的崛起。我有機會在過去的一周里在DM電臺播客里分享我對這個話題的看法,DM電臺播客由Bloor集團的首席執行官Eric Kavanagh主持,可以在網上收聽。而在宏觀層面上,我們應該知道,最前衛的公司將數據視為一個“生態系統”機會,洞察力則來自于相互連接的“數據網絡”所產生的數據組合??纯慈缦碌臄祿?/p>
根據Gartner的資料,數據分析領導者已經定出了他們的三大優先事項:1)數據質量(51%)2)D&A投資的ROI(44%)3)數據共享(43%)。 Gartner還預測,到2023年,促進數據共享的組織將在大多數商業價值指標上優于同行。 Deloitte的研究表明,92%的受訪者希望他們的公司增加對外部數據源的使用。
然而……目前只有5%的數據共享項目能正確識別可信數據和定位可信數據源。這也導出了我的第三個話題:數據結構。
數據即結構
“數據結構”這個詞不是個新詞。據維基百科介紹,這個詞已經存在至少20年了,它的含義也在也被修改了多次。今年Gartner發布2021年十大數據和分析趨勢時,這個詞獲得了巨大的關注。研究公司Gartner預測,數據結構大可:
減少30%的設計時間 減少30%的部署時間 減少70%的維護時間
值得注意的是,數據結構(Data Fabric)一詞目前處于研究公司的數據管理炒作周期頂端,在這一階段,客戶的期望和解決方案的現實之間存在著最大差距。這些預測的內容很多,要進一步了解什么是數據結構什么不是,請參考Gartner的研究。
各個企業尋求部署數據結構,業界對其根本原因已有了很好的了解:由于數據越來越趨向于分布式(跨越數據湖、數據集市和數據倉庫),類型(結構化、非結構化)和位置(在企業內部及跨云)高度多樣化,數據和分析領導者面臨著在不做重大取舍的前提下管理數據訪問和治理的挑戰。
在IT部門不能有效地管理數據及用戶不能及時訪問他們需要的信息時,創新就會受到影響。根據最近的維度數據(Dimensional Data)研究調查結果,68%的數據分析師有推動利潤的想法但沒有時間去實施。
該領域里越來越多的分析師指導可以有助于你形成自己的觀點:一個很好的資源是IDC公司一個文檔,關乎IDC稱之為“數據控制平面”概念。
前文提到的書的作者Chandana Gopal、Stewart Bond和Dan Vesset很好地解釋了這種跨整合、跨訪問、跨治理和保護的新架構,解釋提出了其中三層的作用,即:
智能層——用于數據概況、分類、質量、位置、脈絡和背景的透明度 治理層——政策引擎,目的是控制數據的可訪問性、移動性、可用性和保護性 數據工程層——用于數據集成、攝取和轉換、內存數據虛擬化、聯合、復制和流式
,五月里不斷發生一些的事件和出版的書籍將對數據、人工智能和分析世界產生深遠的影響。這些事件和書籍涵括了應該(和不應該)做決定的方式以及領導者應如何塑造一個可持續的數據驅動文化等等各方面。下面我們快速回顧一下在過去一個月可能錯過了的東西。
分析是數字轉型的關鍵
如果讀者從事技術工作,那么Gartner峰會應該是你不希望錯過的活動,Gartner峰會通常充滿了新的研究和驚喜。今年的數據與分析峰會定不會讓雄心勃勃的首席數據官(CDO)失望。
根據研究公司Gartner的數據,擁有面向業務的關鍵績效指標的CDO可以:
有效地持續產生明確的商業價值的可能性為1.7倍 有效縮短上市時間的可能性為2.3倍 在數據貨幣化方面做到有效的可能性為3.5倍
這對于那些認為數據應該成為其組織轉型中心的人來說是個好消息。在過去的一年半里,CDO有機會塑造和推動他們公司的議程。其中72%的人表示,他們正在領導或大量參與數字化轉型計劃。
然而,那些知道如何將數據作為一種資產進行管理并利用它來推動創新的組織只是例外,而不是常規。
根據《哈佛商業評論》特別提到的一項調查,近七成的組織中仍在掙扎:
只有29.2%的高管的報告說取得了轉型業務成果 30%的人報告說已經制定了一個明確的數據戰略
也許更令人擔擾的是,“數據驅動能力”據說在下降;同一調查表明,受訪者認為他們的組織是數據驅動型組織從37.8%降到24%,下降超過13個百分點。
那現在怎么辦呢?
也許過去的戰略已經無效了。也許,快速的技術顛覆對許多人來說挑戰性太大了以至于無法應付,因為需要不可思議的轉變,數據庫管理就是一個很好的例子。這種不可思議的轉變在今年的峰會上表示:
2020年數據庫管理系統市場總收入增長的86%基于云 到2023年,75%的數據庫將在云平臺上運行
如果你的公司在未來24個月內存儲和使用數據的方式將發生巨大變化,你需要建立什么能力來利用這一新的發展呢?
我筆者曾有機會與一些通過數據獲得突破的企業領導人和數字原生代合作過并研究過他們的成功。我其實也沒有什么神奇的公式,但我觀察到“數據領導者”所表現出的至少3個特征,在這里分享一下。
3個特征為:
數據即“才能” 數據即生態系統 數據即運行公司決策系統的結構
數據即才能
你會發現圍繞“數據文化”和合理決策科學存在很多資源。關于這個主題的書實際上是上個月出版的,是我最近最喜歡的書:《Framers》和《Noise》,《Framers》的作者是Francis de Véricourt、Kenneth Cukier和Viktor Mayer-Sch?nberger,《Noise》的作者是Daniel Kahneman、Olivier Sibony和Cass R. Sunstein。這兩本書都是雄心勃勃的數據管理人員必讀之作。
這些書中的知識與諸如分析培訓及“數據導師”等最佳實踐結合起來就可以幫助企業建立“數據文化”的基礎。不過,要評估維持這種文化的機會可以用到的一個好方法,那就是計算你的組織雇用“數據人”的百分比。
考慮一下這樣的場景:領導者經常說,他們的競爭優勢的來源是他們手下的人,而不僅僅是他們的產品或服務。如果這是真的,那么判斷你公司的核心競爭力的最好方法就是看看你的員工和他們的職能。
上個星期的報道指星展銀行首席執行官Piyush Gupta曾就這個話題發表過看法,他是這樣說的,“我們現在越來越覺得自己是一家提供金融服務的技術公司,而不是一家傳統銀行”。我們的工程師人數是銀行家人數兩倍”,這一事實也許證明了我們公司質的轉變。
我在月初就相關話題發布了一項LinkedIn問卷調查,問的問題是“你應當雇用占你公司總員工人數多少百分比的數據員工”。該問卷調查受到廣泛關注,瀏覽次數接近80,000,投票次數為625。
你應該雇用占總雇員人數多少百分比的“數據雇員”?(Bruno Aziza on LinkedIN)
接受問卷訪問之一的是受人尊敬的數據科學家、加州理工學院的Kirk Borne博士,他就“數據雇員”一詞提供了有用的指導。他表示:
大約100%的員工應該具備數據知識(即“認識、理解和‘談論’數據”) 三分之一的員工應該是“數據流利的”(即“用數據分析、創造論據和展示結果”) 少于10%的員工應該是數據專業人員或 是“從組織的數據資產中創造價值的受薪人員(數據科學家、數據分析師、BI專家、數據AI ML工程師、數據庫數據倉庫工程師)”
讀者公司目前的比例是多少呢?建立“數據文化 ”需要書籍、培訓、不間斷的強化和墻上的各種海報。但數據文化是由你公司的組織結構圖來維持的。所以要務必確保你的各種數字與你的雄心壯志相匹配。
數據即生態系統及相互連接的“數據網絡”威力
建立“數據文化”時另一個重要的考慮因素是你的員工所接觸到的數據類型。領導者們長久以來一直都在抱怨員工難于接觸到他們公司的生產數據。不幸的是,這只是問題一個小小的部分。
倫敦勞埃德銀行的數據產品主管Nick Blewden上個星期在網上的分享指,“數據近視”這個問題可能比你想象的還要嚴重。他發布的圖片(下圖)說出了全部情況:紅點是你公司的數據(同樣,你的團隊可能很少看到今天這些數據),灰色區域是你可以看到的數據。
所有這些都指向一個值得關注的趨勢:數據交換的崛起。我有機會在過去的一周里在DM電臺播客里分享我對這個話題的看法,DM電臺播客由Bloor集團的首席執行官Eric Kavanagh主持,可以在網上收聽。而在宏觀層面上,我們應該知道,最前衛的公司將數據視為一個“生態系統”機會,洞察力則來自于相互連接的“數據網絡”所產生的數據組合??纯慈缦碌臄祿?/p>
根據Gartner的資料,數據分析領導者已經定出了他們的三大優先事項:1)數據質量(51%)2)D&A投資的ROI(44%)3)數據共享(43%)。 Gartner還預測,到2023年,促進數據共享的組織將在大多數商業價值指標上優于同行。 Deloitte的研究表明,92%的受訪者希望他們的公司增加對外部數據源的使用。
然而……目前只有5%的數據共享項目能正確識別可信數據和定位可信數據源。這也導出了我的第三個話題:數據結構。
數據即結構
“數據結構”這個詞不是個新詞。據維基百科介紹,這個詞已經存在至少20年了,它的含義也在也被修改了多次。今年Gartner發布2021年十大數據和分析趨勢時,這個詞獲得了巨大的關注。研究公司Gartner預測,數據結構大可:
減少30%的設計時間 減少30%的部署時間 減少70%的維護時間
值得注意的是,數據結構(Data Fabric)一詞目前處于研究公司的數據管理炒作周期頂端,在這一階段,客戶的期望和解決方案的現實之間存在著最大差距。這些預測的內容很多,要進一步了解什么是數據結構什么不是,請參考Gartner的研究。
各個企業尋求部署數據結構,業界對其根本原因已有了很好的了解:由于數據越來越趨向于分布式(跨越數據湖、數據集市和數據倉庫),類型(結構化、非結構化)和位置(在企業內部及跨云)高度多樣化,數據和分析領導者面臨著在不做重大取舍的前提下管理數據訪問和治理的挑戰。
在IT部門不能有效地管理數據及用戶不能及時訪問他們需要的信息時,創新就會受到影響。根據最近的維度數據(Dimensional Data)研究調查結果,68%的數據分析師有推動利潤的想法但沒有時間去實施。
該領域里越來越多的分析師指導可以有助于你形成自己的觀點:一個很好的資源是IDC公司一個文檔,關乎IDC稱之為“數據控制平面”概念。
前文提到的書的作者Chandana Gopal、Stewart Bond和Dan Vesset很好地解釋了這種跨整合、跨訪問、跨治理和保護的新架構,解釋提出了其中三層的作用,即:
智能層——用于數據概況、分類、質量、位置、脈絡和背景的透明度 治理層——政策引擎,目的是控制數據的可訪問性、移動性、可用性和保護性 數據工程層——用于數據集成、攝取和轉換、內存數據虛擬化、聯合、復制和流式
-
避免“大數據殺熟” 如何打破“信息繭房”?[2020-11-27]
-
出行數據會不會流到國外?監管部門怎么做?[2021-07-05]
-
數字產業化與產業數字化:數據庫技術對“數字經濟”雙向加持[2021-05-17]
-
騰訊發布自研第四代數智融合計算平臺“騰訊大數據-天工”,引領大數據計算進入下一時代[2021-04-19]
-
云計算、大數據與人工智能三者的關系[2021-03-02]
-
2022技術趨勢(中文版)[2022-04-11]
-
Gartner:新冠疫情下的積極信號,中國CIO突出重圍[2020-12-30]
-
Halliburton首席數據科學家兼技術研究員談能源行業AI應用現狀[2020-12-31]
-
中國工程院院士鄔賀銓:大數據創新任重道遠[2021-01-21]
-
7年,這家公司終于從醫療大數據做成了“賣藥的”[2021-06-29]
-
新視野|大數據時代的信息安全[2021-08-04]
-
貴州:“大數據”推動執法“大提升”[2021-03-01]
-
對大數據開發工程師的能力新要求[2021-01-20]
-
數字經濟時代,大數據喚新企業的N種方式[2021-08-13]
-
新基建:大數據未來發展趨勢[2020-12-15]