作者:吳寧川 / 日期:2016-04-14
隨著云計算在2008年前后的興起,DevOps開發者文化盛行一時,加上近年來企業加速向互聯網轉型,造成開發者文件激增。云計算又促使了商業模式的巨大變革,大量的公司并購、合并、裁員以及創業公司的興起,導致人員流動加劇、“遺留”數據暴漲。此外,隨著智能手機的興起,視頻與圖像文件的爆發,也成為企業的沉重負擔。
一份由信息管理解決方案商VeritasTechnologies日前發布的公益性報告《數據基因指數》(DataGenomics Index)稱,開發者文件是當前全球企業數據環境中數量最多的文件類型,占整體文件總量的20.13%及存儲總量的9.17%。該報告還指出,當員工職位變更或離職后,其遺留的文件往往成為孤立數據,不僅造成安全隱患而且長期耗費企業存儲成本。
開發者文件、未知文件(包括孤立數據)和圖像文件已經成為企業轉型的數據殘局主體。《數據基因指數》稱,過去三年中有41%的企業數據從未被修改過。現在,企業越來越“養不起”數據了。
企業轉型的迷茫與失控
當前企業IT基礎架構發生了重大改變,這種改變已經深入到企業的日常運營中。特別在國內大力發展互聯網+、企業著重向互聯網轉型,互聯網技術全面滲透到了傳統企業IT中,“軟件定義”的概念鋪天蓋地,“這讓大多數企業對IT整體環境感到既興奮又迷茫”。
41%企業數據文件在過去三年都無人訪問過
Veritas公司大中華區技術支持部高級總監李剛分享了這兩年接觸國內企業的情況:
“企業不了解如何實現軟件定義,不清楚如何在IT規劃中構建混合云模式,不明白要怎樣應用知識儲備和技能儲備來應對挑戰,也不知道什么樣的合作伙伴能夠幫助企業發展。”
這些問題如今都尖銳地擺在CIO和IT主管面前,讓企業感到迷茫。
而企業感到興奮的原因在于,他們又看到了IT驅動業務成功的案例。“這種興奮與迷茫,使企業產生了無力感和失控感。”
一方面,企業正在經歷行業轉型,另一方面又無力掌控企業IT的發展方向。與此同時,業務部門和企業高層對IT的期望越來越高,而IT管理者對IT方向的把握和管控能力卻越來越弱,這是當前很多中國企業的普遍狀態。
“我們在與客戶交流中發現,企業IT管理者始終通過基礎架構來管控IT。基礎架構是過去企業IT建設過程中最能夠掌控的部分。而‘軟件定義’后,所有的硬件變成了‘大宗商品’。混合云時代,企業的應用程序可以在‘云’中來回漂移。因此,企業的失控,實際上是對IT基礎架構管控層面的失控。”
李剛表示,Veritas認為企業需要轉換思路,不應該執著于IT基礎架構,而應該更多關注數據本身。未來的企業都將是軟件企業和數據企業,所以,企業IT決策者們真正應該關注的是對數據的管控。企業IT如果要重新掌控核心能力,就應該加強數據掌控,數據才是企業的核心資產。
如何轉換數據管理思維?
Veritas服務于全球5萬多家企業的信息與數據管理需求,其中86%的企業為全球財富500強。《數據基因指數》是Veritas自1989年成立以來,首次通過對數百億文件深入分析而得。這份報告的起因,正是企業近年來數據大爆炸與有限存儲資源之間矛盾直接導致的產物。
2012年的一項Gartner研究稱,企業存儲1PB數據的成本在500萬美元左右。近幾年隨著技術的發展這一成本可降至50萬美元左右,而目前1PB數據在云上一年的存儲成本最低也在250萬到300萬人民幣之間。大數據還沒來得及產生價值,就已經成為企業的大負擔,而且數據還在不斷增長中。Veritas首席信息治理專家徐晨說,他曾遇到剛成立的公司,總存儲空間只有幾個TB,但業務部門上來便提出PB級的需求。
企業的數據在不斷膨脹,如何盡早轉換數據管理思維?李剛認為這有幾個前提。首先要關注數據可用性,企業要能夠隨時隨地訪問所需數據;其次是數據的生命周期管理,企業需要有完整工具來完成數據的生成、處理、歸檔、刪除、銷毀等一系列步驟;第三是要關注數據的復用和挖掘;最后是制定對不同云環境的數據訪問策略。
針對數據存儲環境的變化,李剛認為如今處于混合云環境中的企業數據分散存儲在私有云以及不同的公有云中,這種復雜的環境對數據管理構成了極大的挑戰。實際上,由于IT的云化和虛擬化后,數據并不固定存在,企業關心的是隨時訪問數據,而不是具體存儲位置,這帶來了全新的觀點。
從了解數據基因入手
為了“收拾”數據殘局,需要對數據有本質上的認識與了解,這就是《數據基因指數》的目的與意義所在。任何企業、行業專家、咨詢人員、終端用戶、技術人員以及其他相關人士,都可以通過datagenomicsproject.org了解全球企業的數據基因。
根據首份《數據基因指數》報告,企業創建數據的增長速度非常快,年均增長率達到39%。而且企業在不同季節的數據增長情況各不相同:超過68%的視頻文件創建于夏天,這有可能是因為員工把度假視頻放在了企業服務器上;很多企業都實施了年度備份政策,所以10月、11月、12月的備份數據增長率大幅提升達756%。
當前企業的整體數據環境
而根據合規要求,數據通常在3年后會從“可能相關”變為“過期”狀態。在企業中,平均41%的企業數據已經過期,或者是連續3年沒有任何用戶進行過修改操作。此外,孤立數據占企業整個數據環境的5%,不僅占比非常大,而且很容易成為過期數據。孤立數據多為內容豐富的文件類型,如視頻、圖片和演示文稿等。
《數據基因指數》指出,演示文稿、電子表格和文檔等傳統Office格式文件所占據的空間遠遠超出合理值,為企業造成不必要的成本負擔,視頻和圖片等視覺格式文件也是企業的另一負擔。以10PB為普通環境舉例,如果展開專門處理過期演示文稿、文檔、電子表格和文本文件的歸檔項目,能為企業每年節省大約200萬美元的存儲成本。
除了Veritas外,另一家企業業務可用性解決方案提供商Veeam Software(衛盟軟件)也首次在今年倡導把每年的3月30日定為世界可用性日(WorldAvailability Day)。根據Veeam委托進行的一項最新行業調查,84%的CIO承認無法滿足企業員工、客戶和合作伙伴對數據可用性的預期,而且每年為此損失達1,600萬美元。
目前由于IT基礎架構的巨大變化,類似于Veritas這樣的數據治理與管理技術專業供應商和Veeam這樣的企業業務可用性技術供應商都在市場中有獨特的定位與位置,也是企業在轉型過程中需要了解的供應商。當然,現在還沒有供應商能夠整合所有的數據管理及業務可用性工具。Veritas計劃推出類似“數據中間件”的產品,整合、協同更多解決方案廠商的產品,幫助企業獲得全面的數據掌控能力。
總體來說,大數據爆炸時代,企業需要提前準備好應對“大數據殘局”。在制定數據可用性技術、全數據生命周期管理方案、數據利用和數據挖掘以及數據訪問策略的前提下,要充分了解和認知企業數據的產生特點、規律和本質,然后選用獨特而專業的供應商解決具體的問題,同時注意不同工具之間的兼容性和通用性,致力于最終形成一個“數據中間件”層。
從數據本身出發,重新思考企業的整體IT策略與架構,這是轉型期的重要方法論之一。