在智能化決策越來越被重視的今天,無論行業或企業規模如何,我們看到越來越多的企業開始依賴數據分析和可視化來建立自己的競爭優勢。
各行各業的企業在收集、存儲和分析來自不同格式的數據。在商業智能化競爭下,要想獲得成功,利用數據進行商業決策則變成了比業務本身更重要的事情。
數據分析和可視化技術的快速發展意味着企業和個人非常希望通過正確的技術選擇儘快地獲得業務上的成功。
創業者們需要知道他們是否選擇了正確的語言、產品、架構和數據源,而個人則需要知道他們是否正在學習正確的技能來獲得更有前途的工作。
那些沒有選擇正確的人會面臨被淘汰的危險,因爲他們沒有充分利用實時的數據分析和可視化程序提供的洞察理解。
基於數據分析和可視化技術的迅速發展,企業級服務商Zoomdata聯合橫跨多領域的科技媒體公司O’Reilly Media進行了一次調查,以評估智能商業現狀。有875名受訪者提供了他們使用這些技術的情況。在詳細分析調研結果之前,我們先把主要的結論列出,以便大家閱讀:
大數據分析和可視化應用在製造業、金融服務和科技/
軟件公司中是最成熟的
這些技術通常是企業級用戶及業務分析師來使用,他們通常是依靠可視化儀表盤來獲取所需的見解,以優化業務流程並更好的瞭解客戶
關係型數據庫仍然是最常見的數據源(雖然分析型數據庫和Hadoop是大數據領域最常見的數據源)
企業非常需要Python、SQL和關係型數據庫的能力
Kafka和Spark正在成爲流數據技術(streaming data technology)的首選
360度客戶洞察是最常見的使用場景
1、商業需求引發業務流程迭代
875個受訪者來自不同的行業,其中超過35%來自科技/
軟件行業,接近10%來自金融服務,8%來自醫療健康/醫療科技領域,還有製造業、政府、零售和教育/學術這幾個領域分別佔約5%。
從受訪者的工作崗位來看,18%是是工程師/開發人員,17%是數據科學家,15%是數據分析師/業務分析師,還有13%是架構師,他們的公司規模各異。有趣的是,企業CXO們和經理的佔比也非常高(14%),甚至高於IT專家(8%)。
還有一個值得關注的是,有26%的受訪者是來自員工人數少於50人的企業,這也表明了小型企業是使用這些新技術和業務流程的領導者。
超過50%的受訪者表示,他們使用分析來獲得全方位的客戶洞察,43%的受訪者使用分析來優化業務流程。客戶和業務流程是直接影響業務的重要因素,因此這些環節也是企業需要使用數據分析和可視化工具從而通過數據來輔助決策的重要方面。
2、智能決策的行業應用
們看到360度客戶洞察是數據分析和可視化工具使用最多的領域,但是從不同的行業來看情況可能就有所不同,而且也能顯示出一些趨勢。
在科技/
軟件、金融服務和零售行業,360度客戶洞察無疑是使用分析技術最主要的領域,佔比在50%以上。令我們感到驚訝的是在教育/學術行業,使用分析技術最主要的領域也是360度客戶洞察。毫無疑問這些行業都是客戶至上的行業,只有全面的瞭解客戶,才能給客戶更好的體驗,才能獲得更多的收入。
醫療保健/醫療科技行業中醫療數據分析是使用分析技術的主要領域,這並不令人驚訝,因爲能稱作是醫療科技的醫療企業都需要分析醫療數據,否則很難做出有現實意義的成果。
業務流程優化也是一個重度使用分析技術的主要領域,在調查報告裏的所有涉及到的行業,業務流程優化使用技術分析技術的佔比都排在前三位,在製造業和政府行業則排名第一。優化業務流程通常會降低運營成本,並可能提高客戶的滿意度,因此這也是在許多行業中建立競爭優勢的戰略途徑之一。
製造業和零售行業也把重點放在了供應鏈分析上。及時發現供應鏈環節中存在的問題,可以幫助零售商和製造企業節省換供應商的時間。一個優化的供應鏈結構也是一個企業的競爭優勢和技術壁壘。
欺詐檢測/網絡安全情報是金融服務和政府行業的重要領域。欺詐檢測對於任何金融服務都至關重要,離錢越近的地方越容易出現欺詐行爲。檢測並消除欺詐行爲有助於與客戶建立信任並降低運營成本。網絡安全情報是衆多政府機構關注的焦點,在選舉和可持續運營層面,防止欺詐也至關重要。
我們還向受訪者提了這樣一個問題“貴公司的大數據分析處於什麼階段?是剛剛開始,還是已經應用在工作的各個方面?”,有助於我們理解各行業的採用率如何變化。令我們驚訝的是製造業行業有26%的受訪者表示他們的公司在多個方面都已經使用了數據分析技術,是所有行業中最高的,而最低的是政府行業,只有7%的人認爲公司在多個方面已經應用了數據分析技術。政府行業也是“我們沒有使用大數據分析技術”這個選項佔比最多的行業,達到33%,科技/軟件行業則佔比最低。
3、背後的技術原理
在如何獲取數據來源的問題中,數據倉庫/數據集市是最多的回答,在零售行業最爲明顯。虛擬聯合/糅合(Virtual federation/mashup,即時混合數據而不移入倉庫)在醫療健康/醫療科技、科技/軟件和政府行業應用的最多。
關係型數據庫仍然是各行業使用最多的,在醫療健康/醫療科技行業的佔有率達到39%。非關係型數據庫以及大數據存儲的分析型數據庫、Hadoop、NoSQL數據庫、雲數據存儲、內存數據庫和搜索數據庫中,金融服務和政府使用分析型數據庫最多,而零售和科技/
軟件行業使用雲數據庫存儲最多。
Kafka和Spark是分析流數據最常用的技術,在我們的調查中,這兩個技術佔流數據分析的65%以上。科技/軟件行業是使用Kafka的主要行業,其次是金融服務。政府中最普遍的是使用Confluence。
4、人才缺口
在我們分析使用數據分析和可視化工具的技術人員的相關技能時,我們發現總體上需求最大的是Python、SQL和關係型數據庫,其次是Hadoop和Java。政府行業最需要的是會Python的人才,其次是關係型數據庫的人才,而醫療健康/醫療科技最需要的事SQL的人才。
5、智能決策的價值所在
衡量大數據的價值有四個方面:準確性、實時性、多樣性和數據量。準確性指的是數據接近“真相”的程度,實時性指的是數據收集和分析的速度,多樣性指的是結構化和非結構化數據的多種來源和類型,數據量指的是能夠收集和分析的總數據量。我們通過了解各個企業看重這四個方面的哪幾個方面,來深入理解數據分析是如何影響公司業務的。
從整體來看,衡量數據的價值最重要的方面是準確性,這並不令人意外,因爲沒有真實的數據,那麼分析結果就沒有任何意義。其次重要的是多樣性,這表明無論什麼行業,做數據分析和可視化必須要結合多種來源和類型的數據,才能更好的提供企業所需的見解。實時性是最不重要的,這表明典型的商業數據獲取是否及時並不影響分析的結果和業務的決策,這也是流數據分析相對少的原因之一。但實時性對於科技/
軟件和製造業來說卻是最有價值的。
總之,爲了更好的給企業提供商業價值,智能化工具越來越多的應用在日常工作中,給業務分析師和管理人員提供所需的信息。這些信息通常嵌入到生產環境的應用程序或獨立的BI應用中,並通過儀表盤進行操作。我們通過這個調研希望可以給企業一個直觀的感受,讓各個行業的從業人員都瞭解到大數據分析技術已經發展到什麼程度以及採用度如何,在今後採用這些新技術或拓展大數據收集、存儲、分析和可視化應用時,有一個參考。