- 第2節(jié) 第二章
-
數據體量大:大數據一般指在10TB 規(guī)模以上的數據量。但在實際應用中,很多企業(yè)用戶把多個數據集放在一起,已經形成了PB 級的數據量。
數據多樣性:數據來自多種數據源,數據種類和格式日漸豐富,已經沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。
價值密度低:大數據所創(chuàng)造的價值密度明顯更低。根據福利經濟學的觀點,生產率與單位商品的價值無關,生產率只與生產的數量有關,即生產率高的企業(yè)在相同的時間內生產更多的價值——因而可以把更高的生產率理解為通過生產和管理技術的革新而形成的更高的勞動復雜度,勞動復雜度的提高使單位勞動時間具有了更大的價值密度。
速度快:有數據顯示,在全球范圍內,數據量以每年 50%的速度增長,數據增長的速度已經遠遠超過IT 設計發(fā)展的速度。數據本身已經成為企業(yè)發(fā)展的資產?焖俨蹲綌祿畔,實現數字化生產和管理,已經成為未來企業(yè)贏得市場,應對行業(yè)互聯網化的必經之路。
另外,從“數據”這個詞來分析,大數據是海量的,是巨大的,它關乎數據量。筆者認為可以從3 個方面定義大數據:(1)數據量;(2)廣度、分類;(3)速度。簡而言之,大數據就是一個體量特別大,數據類別特別豐富的數據集。也就是說“大數據”本身并不是一種新的技術,也不是一種新的產品,而是我們這個時代出現的一種現象。而這個“大”
大到了一種什么樣的程度呢?可以說它即將突破現有常規(guī)軟件所能提供的能力極限。
綜上所述,全球最大的戰(zhàn)略咨詢公司麥肯錫給出了一個十分明確的定義:大數據是指無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。
隨著互聯網革命性地改變了商業(yè)的運作模式、政府的管理方法以及人們的生活方式,信息的積累足以引發(fā)新的變革。世界充斥著比以往更多的信息,信息總量的變化導致了信息形態(tài)的變化!按髷祿边@一概念應運而生。“大數據”不同于互聯網,它正在以巨大的力量改變著世界,它是具有更強的決策力、洞察力、流程優(yōu)化能力、高增長率和多樣化的信息資產。
如今,數據庫、大數據已經成為變革的中心,事實上可以成為一場革命。在IT 領域、制造業(yè)、零售業(yè)、政府管理、科技領域,大數據都在改變著這個世界的運行方式。因此,我們稱之為大數據的新世界。
專 家 提 醒
數據基本單位換算:
1B(byte,字節(jié))=8b(bit 位)
1KB(Kilobyte,千字節(jié))=1024B
1MB(Megabyte,百萬字節(jié)兆字節(jié),簡稱“兆”)=1024KB
1GB(Gigabyte,十億字節(jié)吉字節(jié),又稱“千兆”)=1024MB
1TB(Trillionbyte,萬億字節(jié)太字節(jié))=1024GB
1PB(Petabyte,千萬億字節(jié)拍字節(jié))=1024TB
1EB(Exabyte,百億億字節(jié)艾字節(jié))=1024PB
1ZB(Zettabyte,十萬億億字節(jié)澤字節(jié))=1024EB
1.1.2 大數據結構特征
如今,全球存儲的數據量正在急劇增長,數據量大是大數據的一致特征。在2000
年,全球存儲了800000PB 的數據。預計到2020 年,這一數字會達到35ZB。單單Twitter
每天就會生成超過7TB 的數據,Facebook 為10TB,一些企業(yè)在一年中每一天的每一小時就會產生數TB 的數據。
就傳統IT 企業(yè)來看,其結構化和非結構化的數據增長也是驚人的。2005 年企業(yè)存儲的結構化數據為4EB,到2015 年將增至29EB,年復合增長率逾20%。非結構化數據發(fā)展更猛。2005 年為22EB,2015 年將增至1600EB,年復合增長率約60%,遠遠快于摩爾定律。
那么,一分鐘到底會有多少數據產生呢?
電子郵件用戶發(fā)送204166677 條信息。
Google 收到超過2000000 個搜索查詢。
Facebook 用戶分享684478 條內容。
消費者在網購上花費272070 美元。
Twitter 用戶發(fā)送超過100000 條微博。
蘋果公司收到大約47000 個應用下載。
Facebook 上的品牌和企業(yè)收到34722 個“贊”。
Tumblr 博客用戶發(fā)布27778 個新帖子。
Instagram 用戶分享36000 張新照片。
Flickr 用戶添加3125 張新照片。
Foursquare 用戶執(zhí)行2083 次簽到。
571 個新網站誕生。
WordPress 用戶發(fā)布347 篇新博文。
由于數據自身的復雜性,作為一個必然的結果,處理大數據的首選方法就是在并行計算的環(huán)境中進行大規(guī)模并行處理(Massively Parallel Processing,MPP),這使得并行攝取、并行數據裝載和分析成為可能。實際上,大多數的大數據都是非結構化或者半結構化的,這需要不同的技術和工具來處理和分析。
大數據的結構就體現了它最突出的特征,如表1-1 所示,顯示了幾種不同數據結構類型數據的增長趨勢。據悉,未來數據增長的80%~90%將來自于非結構化的數據類型
(包括半非結構化、準非結構化和非結構化數據)。
1.1.3 大數據與云計算
在過去3 年當中,筆者經歷了大數據的發(fā)展從無到有,3 年前可能還沒有人說這個詞,現在已經如火如荼,F在,每天有大量數據和信息生成,這為大數據分析提供了機會。相較于傳統數據,大數據更能反映這個世界的真實情況,例如,人們會上傳和公布大量的圖片來記錄個人的生活和社會的變化。如今,一天之內人們上傳的照片數量就相當于柯達發(fā)明膠卷之后拍攝的圖像總和。
過去,計算機主要是用于解決大企業(yè)交易型的數據,并不會記錄其他無關的信息,只有在云計算產業(yè)規(guī);l(fā)展之后,分布式計算才給大數據提供了記錄的載體?梢哉f,云計算使大數據變成可能,打個比方,云計算充當了工業(yè)革命時期“發(fā)動機”的角色,而大數據則是“電”。
然而,現在除了數據本身發(fā)生了改變,云計算也使數據變得更加分散,在這樣的趨勢下,傳統數據庫對于海量數據存儲的需求、處理速度的需求、數據多樣化的需求難以滿足,從而使各種各樣的解決方案大行其道。
總之,云計算為大數據帶來了硬件存儲的條件——更便宜的分布式運算存儲,而互聯網時代的今天也在不斷呼喚數據應用和服務。在技術和需求的雙重推動下,會有越來越多的政府機構、公司企業(yè)和個人意識到數據是巨大的經濟資產,像貨幣或黃金一樣,它將帶來全新的創(chuàng)業(yè)方向、商業(yè)模式和投資機會。
大數據和云計算的區(qū)別與聯系如表1-2 所示。
專 家 提 醒
云計算和大數據注定將帶來一次革命,無論是對社會、公司和個人來說,都是一次世界觀的改變。屆時,互聯網不再是一個展示公司的工具或平臺,而是屬于未來的生產方式,是關乎競爭和生存的關鍵。
1.1.4 大數據規(guī)模預測
當你走進一家陌生的小餐廳時,耳邊響起只有你才熟悉的音樂旋律。這樣的場景實現技術上并不難,餐廳只要讀出你的手機音樂下載記錄,通過數據分析,就可以定制播放你喜歡的音樂,這就是大數據時代的潛力。
前面筆者已經說了,大數據由4 個V 組成,這4 個V 的組合推動了第5 個因素——價值(Value)的出現。隨著云計算概念日漸深入人心,大數據也越來越受到關注。國際知名數據公司IDC 在長期對云計算市場進行跟蹤研究的同時,也對大數據市場保持著密切關注。如圖1-6 所示,IDC 發(fā)現,目前大數據對市場的影響正日益提升,已經開始影響數據中心設計、移動應用投資、數據管理等相關領域。
圖1-6 IDC 全球大數據市場規(guī)模與預測
1.1.5 大數據的發(fā)展史
如今,越來越多的企業(yè)參與到大數據的競爭中來,那么“大數據”這個詞匯是如何誕生以及演變的呢?
大數據是一個修辭學意義上的詞匯,在數據方面,“大”(big)是一個快速發(fā)展的術語。早在1890 年,美國統計學家赫爾曼·霍爾瑞斯為了統計這一年的人口普查數據,發(fā)明了一臺電動器來讀取卡片上的數據,該設備讓美國用一年時間就完成了原本耗時8年的人口普查活動,由此在全球范圍內引發(fā)了數據處理的新紀元。
1961 年,剛成立9 年的美國國家安全局(NSA)是擁有超過12000 個密碼學家的情報機構,在間諜飽和的冷戰(zhàn)年代,面對超量信息,他們開始采用計算機自動收集處理信號情報,并努力將倉庫內積壓的模擬磁帶信息進行數字化處理。僅1961 年7 月份,該機構就收到了17000 卷磁帶。
起初,許多科學家和工程師都嘲笑“大數據”只不過是一個營銷術語。2008 年末,“大數據”得到部分美國知名計算機科學研究人員的認可,業(yè)界組織“計算社區(qū)聯盟”(Computing Community Consortium)發(fā)表了一份有影響力的白皮書《大數據計算》,中肯地闡述了大數據帶來的機遇和挑戰(zhàn)。
2009 年5 月,美國總統巴拉克·奧巴馬政府推出data.gov 網站,作為政府開放數據計劃的部分舉措。該網站擁有超過4.45 萬的數據量集,這樣一些網站和智能手機應用程序能跟蹤如航班、產品召回、特定區(qū)域內失業(yè)率等信息,這一行動激發(fā)了肯尼亞、英國等政府相繼推出類似舉措。
2011 年2 月,掃描2 億頁的頁面信息,或4 兆兆字節(jié)磁盤存儲,只需幾秒即可完成。同時,IBM 的沃森計算機系統在智力競賽節(jié)目《危險邊緣》中打敗了兩名人類挑戰(zhàn)者,后來《紐約時報》稱這一刻為“大數據計算勝利”的時刻。
2011 年,英國《自然》雜志曾出版專刊指出,倘若能夠更有效地組織和使用大數據,人類將得到更多的機會發(fā)揮科學技術,這對社會發(fā)展有巨大的推動作用。
2012 年3 月,美國政府報告要求每個聯邦機構都要有一個“大數據”的策略,作為回應,奧巴馬政府宣布了一項耗資兩億美元的大數據研究與發(fā)展項目。
2012 年7 月,美國國務卿希拉里·克林頓宣布了一個名為“數據2X”的公私合營企業(yè),用來收集統計世界各地的婦女和女童在經濟、政治和社會地位方面的信息。
回顧過去的50 多年,我們可以看到IT 產業(yè)已經經歷了幾輪新興和重疊的技術浪潮,如圖1-7 所示。這里面的每一波浪潮都是由新興的IT 供應商主導的,他們改變了已有的秩序,重新定義了已有的計算機規(guī)范,并為進入新時代鋪平了道路。
圖1-7 IT 產業(yè)的發(fā)展浪潮
人們手中的手機和移動設備是數據量爆炸的一個重要原因,目前,全球擁有 50 億臺手機用戶,其中20 億臺為智能電話,這相當于20 世紀80 年代20 億臺IBM 的大型機掌握在消費者手里。
“大數據”是“數據化”趨勢下的必然產物。數據化最核心的理念是:“一切都被記錄,一切都被數字化”。它帶來了兩個重大的變化:一是數據量的爆炸性劇增,最近兩年所產生的數據量等同于2010 年以前整個人類文明產生的數據量總和;二是數據來源的極大豐富,形成了多源異構的數據形態(tài),其中非結構化數據所占比重逐年增大。
1.1.6 大數據技術架構
即便是在“摩爾定律”,即每18 個月芯片性能將提高1 倍的支撐下,硬件性能進化的速度也早已趕不上數據增長的速度了,并且差距越來越巨大。例如,一分鐘之內,新浪微博有數萬條微博發(fā)送,蘋果應用商店下載次數以萬計,淘寶賣出了幾萬件商品,百度產生了百萬次搜索查詢……所有這些行為都由海量的數據來呈現。
那么,大數據是通過什么樣的技術架構來接受、容納并處理這些海量數據的呢?
要容納數據本身,IT 基礎架構必須能夠以經濟的方式存儲比以往更大量、類型更多的數據。此外,還必須能適應數據速度,即數據變化的速度。數量如此大的數據難以在當今的網絡連接條件下快速來回移動。大數據基礎架構必須具有分布式計算能力,以便能在接近用戶的位置進行數據分析,減少跨越網絡所引起的延遲。
因此,云計算模式為大數據的成功提供了很好的條件,以實現大數據分析所需的效率、可擴展性、數據便攜性和經濟性。另外,還可以用來跨越毫不相干的數據源比較不同類型的數據和進行模式匹配。這使得大數據分析能以新視角挖掘企業(yè)傳統數據,并帶來傳統上未曾有過的數據洞察力。
例如,LinkedIn 是世界上最大的專業(yè)人士社交網絡,在全球范圍內有2.25 億用戶,并且以每秒2 個新用戶的速度增長。LinkedIn 還是一個解決方案供應商,據悉,目前有88%的財富100 強企業(yè)在使用LinkedIn 的付費解決方案,LinkedIn 還有超出290 萬的公司主頁及相關信息。
LinkedIn 之所以取得如此大的成功,是因為他們有專業(yè)的身份可以拓展人脈發(fā)現機遇,專業(yè)的內容全方位掌握業(yè)界資訊,專業(yè)的平臺隨時隨地了解人脈動向。
從LinkedIn 的業(yè)務模型不難看出,其本身就擁有海量的數據,通過這些數據創(chuàng)造出有價值的產品和服務,來增加用戶數量和用戶黏性,這樣數據還會不斷增長從而形成一個“閉環(huán)”。LinkedIn 有人才、市場、高級訂閱服務三大商業(yè)解決方案,而且三大商業(yè)解決方案的盈收每年也呈翻倍增長趨勢,而其中占盈收比例最大的是人才解決方案。
另外,LinkedIn 的數據按用戶可分為用戶特征數據、用戶行為數據、用戶網絡數據;按數據存取速度可分為在線數據、近線數據、離線數據。LinkedIn 的三級數據架構根據不同性質的工作設計,其中近線數據存儲在Voldemort 分布式數據庫中,在線數據存儲在Oracle 和Espresso 中,服務器日志存儲在Web Logs 中。使用Kafka 發(fā)布數據,通過Databus 捕獲在線數據,而所有的離線數據由Hadoop 和Teradata 數據庫構成。
基于上述考慮,大數據可以采用四層堆棧式技術架構,如表1-3 所示。
表1-3 采用四層堆棧式技術架構的大數據
專 家 提 醒
云模型鼓勵訪問數據并提供彈性資源池來應對大規(guī)模問題,其解決了如何存儲大量數據,以及如何積聚所需的計算資源來操作數據的問題。在云中,數據可跨多個節(jié)點調配和分布,這使得數據更接近需要它的用戶,從而縮短響應時間和提高生產率。
1.1.7 大數據重要的理由
人們?yōu)槭裁慈绱岁P心大數據呢?其實大數據可以使我們提出新問題,來了解我們的業(yè)務。例如社交網絡分析,一個企業(yè),即使你是一個個體,你也有一個品牌,如何分析你的品牌影響力、品牌聲譽,這些問題之前不容易回答,如今在大數據的時代可以很容易得到答案,并且?guī)缀跏且詫崟r的速度來解答。
例如,有一家物流公司,有卡車等運輸工具,希望優(yōu)化車隊的運輸路線,提高運輸效率,并且基于實時的交送信息、天氣信息及其他類型的信息。現在通過傳感器和大數據就可以做到。事實上,關于過去和現在,甚至是未來的事務,大數據分析都能夠用得上。
專 家 提 醒
雖然大數據是一個重大問題,但筆者認為,真正的問題是如何讓大數據更有意義,如何在大數據里面尋找模式幫助組織機構做出更好的商業(yè)決策。
當前,隨著互聯網科技的日益成熟,各種類型數據的增長將會超越歷史上任何一個時期。因此,用戶想要從這龐大的數據庫中提取對自己有用的信息,就離不開大數據分析技術和工具。如表1-4 所示,向大家展示了大數據分析將越來越重要的10 個理由。
表1-4 大數據分析為何重要的理由
專 家 提 醒
對大企業(yè)而言,大數據的興起,首先,是因為計算能力可以更低的成本獲得,且各類系統如今已能夠支持多任務處理;其次,內存的成本也在直線下降,企業(yè)可以在內存中處理比以往更多的數據;最后,把計算機聚合成服務器集群越來越簡單。
1.1.8 大數據的解決方案
當前,越來越多的企業(yè)將大數據的分析結果作為其判斷未來發(fā)展的依據。同時,傳統的商業(yè)預測邏輯正日益被新的大數據預測所取代。既然大數據如此重要,那么大數據解決方案是否可以完全替代傳統的數據庫解決方案呢?
在這里,筆者先不說出答案,而是先帶大家看一個典型的案例:
例如,一個優(yōu)秀的棒球運動員知道自己的哪一只手更擅長拋球,哪一只手更擅長接球。就像這樣一種情形,每只手可以嘗試執(zhí)行它天生不適合的任務,但會非常笨拙,因此,通常不會看到棒球運動員使用一只手接球,停下來,丟掉他們的手套,然后使用同一只手拋球。棒球運動員的左手和右手協同起來會實現最佳的結果。
上面的例子就是傳統數據庫和大數據技術的一個簡單類比:沒有這兩個重要實體的協同工作,任何組織或結構的信息平臺都很難得到進一步發(fā)展,因為就像棒球運動員協調雙手來拋接棒球一樣,一個團結一致的分析生態(tài)系統才能實現最佳的結果。
此時,我們經過初步分析就可以了解到,有些類型的問題不是本來就屬于傳統數據庫的,至少在最初不是,而且也不確定是否希望將一些數據放在倉庫中,因為我們不知道它是否擁有較高的價值、是否是非結構化的,或者是否太龐大了。更多的情況是,在投入精力和金錢將數據放在倉庫之后,才能發(fā)現每個字節(jié)的數據價值;但我們希望在投資之前,就能明確該數據值得保存,并擁有較高的價值。
典型的大數據解決方案應該是具有多種能力的平臺化解決方案,這些能力包括結構化數據的存儲、計算、分析和挖掘,多結構化數據的存儲、加工和處理,以及大數據的商務智能分析。筆者認為,這種解決方案在技術上應具有以下4 個特性:軟硬集成化的大數據處理能力、全結構化數據處理的能力、大規(guī)模內存計算的能力、超高網絡速度訪問的能力。
因此,你一定要認識到傳統數據庫技術是整體解決方案中一個重要且相關的部分。事實上,它們在與你的大數據平臺結合使用時會變得更加重要。
專 家 提 醒
當前,越來越多的企業(yè)將大數據的分析結果作為其判斷未來發(fā)展的依據。同時,傳統的商業(yè)預測邏輯正日益被新的大數據預測所取代。但是,筆者覺得大家對于大數據的期望值要謹慎一些,因為海量數據只有在得到有效治理的前提下,才能進一步發(fā)揮其價值。
1.2 預測未來,大數據的發(fā)展趨勢
據悉,在1993 年的美國《紐約人》雜志上刊登了一幅標題為“互聯網上,沒有人知道你是一條狗”的漫畫,而作者彼得·施泰納也因此賺取了超過5 萬美元。此后的20年間,互聯網發(fā)生了巨大的變化,移動互聯、社交網絡及電子商務大大拓展了互聯網的疆界和應用領域。
如今,我們在享受便利的同時,也無償貢獻了自己的“行蹤”,現在互聯網不但知道對面是一只狗,甚至還知道這只狗喜歡什么食物,幾點出去遛彎,幾點回窩睡覺。每個人在互聯網進入到大數據時代,都將是透明性存在的,可以說是“處處行跡處處留痕”。
收集并分析海量的各種類型數據,并快速獲取影響未來的信息的能力,這就是大數據技術的魅力。事實上大數據的來源非常廣泛,天上的衛(wèi)星、地上的汽車、埋在土壤里面的各類傳感器,無時無刻不在生成大量的數據。這些數據如果加以綜合利用,產生的社會價值和經濟價值將是難以估量的。大數據技術讓人們看到未來解決預測問題的一絲曙光。
1.2.1 大數據撬動全世界
大數據不僅體現為數據量的驚人增長,更前所未有地引入了正在不斷擴展中的數據類型。從量的增長來看,根據IDC(國際數據公司)的跟蹤分析,全球產生的數據總量2011 年已經達到1.8ZB(1ZB 等于1 萬億GB,1.8ZB 也就相當于18 億個1TB 移動硬盤的存儲量);2012 年達到約2.8ZB,但當年全球產生的數據中僅有約0.5%得到有效分析。據悉,到2020 年,全球數據總量中有22%將來自中國。
電商投放廣告、物流調度運力、證監(jiān)會抓老鼠倉、金融機構賣基金、民航節(jié)約成本、農民破解豬周期、制片人拍電影……看似毫不相關的事情,背后都有大數據在發(fā)力。隨著互聯網、移動互聯網對各個領域的滲透越來越深,從政府到企業(yè),從群體到個人,數據的積累與日俱增。4G 牌照的發(fā)放,又讓移動數據通道由“鄉(xiāng)村公路”升級為“高速公路”。
與此同時,社會上的各行各業(yè),從電信、IT 業(yè),到金融、證券、保險、航空、酒店服務業(yè)等,地球上的各種存在事物,從每個人到每棵樹、每朵花乃至每粒沙子,無一例外地都在成為大數據的生成者。筆者可以預見,大數據席卷各行各業(yè)和人們生活的速度只會越來越快。
例如,世界上第一部“先拍照后對焦”光場相機Lytro,就運用了大數據處理分析理念。與傳統相機只記錄一束光不同,Lytro 可以記錄整個光場里所有的光,也就是用總體數據取代了隨機樣本。用戶沒必要一開始就對焦,想要什么樣的照片可以在拍攝之后再決定。
因此,究竟該如何“開采”大數據這座豐富的礦藏,成為了一個令人著迷的問題,因為與正確答案相隨的將是誰都渴望的巨大商業(yè)成功。當前,伴隨著變革的發(fā)生,傳統的互聯網企業(yè)已經站在了大數據時代的最前沿。作為后PC 時代的4 大巨頭,Facebook、谷歌、蘋果、亞馬遜正在成為大數據的擁有者和使用者,其主要特點如表1-5 所示。
表1-5 4 大互聯網企業(yè)的大數據策略
大數據,正在撬動全世界的神經,無論是國家、企業(yè),還是每一個獨立存在的個人,都將成為大數據時代的貢獻者和受益者。
專 家 提 醒
目前,數據量的大幅增加對人們注重精確性的習慣提出了挑戰(zhàn)。大數據需要技術和思維上的變革才能利用,才能做到從海量到精準。這一輪的變革,事關絕大多數企業(yè)的命運。可以看到,用大數據這個視角,可以考察企業(yè)的興衰。第一,如果對大數據不關心,不了解,必將走向衰;第二,擁有大量的數據并善加運用的公司,必將贏得未來。時代變了,判斷企業(yè)價值的標準、判斷軟件價值的標準也變了。
1.2.2 大數據是大勢所趨
大數據有多火?有媒體將2013 年稱為“大數據元年”。目前,幾乎所有世界級的互聯網企業(yè),都將業(yè)務觸角延伸至大數據產業(yè);無論是社交平臺逐鹿、電商價格大戰(zhàn)還是門戶網站競爭,都有它的影子。2012 年,美國政府投資兩億美元啟動“大數據研究和發(fā)展計劃”,更將大數據上升到國家戰(zhàn)略層面。大數據,正在由技術熱詞轉變?yōu)橐还缮鐣顺,影響社會生活的方方面面?
星巴克有意推出的“大數據咖啡杯”就是個小小的例子。美國媒體報道,這家咖啡連鎖巨頭打算試驗在一些咖啡杯中裝上傳感器,收集?秃瓤Х人俣鹊葦祿,從而為喝咖啡較慢顧客提供保溫效果好的杯子,以提高其滿意度和忠誠度。
又例如,在 2008 年初,阿里巴巴平臺上整個買家詢盤數急劇下滑,歐美對中國采購量也在下滑。通常而言,買家在采購商品前,會比較多家供應商的產品,反映到阿里巴巴網站統計數據中,就是查詢點擊的數量和購買點擊的數量會保持一個相對的數值。
阿里巴巴平臺通過統計歷史上所有買家、賣家的詢價和成交的數據,可以形成詢盤指數和成交指數。這兩個指數是密切相關的:詢盤指數是前兆性的,前期詢盤指數活躍,就會保證后期一定的成交量。因此,當馬云觀察到詢盤指數異乎尋常地下降,自然就可以推測未來成交量的萎縮。這種統計和分析,如果缺少大數據技術的支持,是難以完成的。這次事件,馬云得以提前呼吁,幫助成千上萬的中小制造商準備“過冬糧”,從而贏得了很高的聲譽。
因此,大數據是一種新的價值觀和方法論,人們面對的不再是隨機樣本而是全體數據,不是精確性而是混雜性,不是因果關系而是相關關系。
1.2.3 大數據將成為資產
眾所周知,用戶的消費習慣、興趣愛好、關系網絡以及整個互聯網的趨勢、潮流都將成為互聯網從業(yè)者關注的熱點,而這一切的獲取和分析都離不開大數據,因為在社會化媒體基礎上的大數據挖掘和分析都會衍生很多應用。例如,幫企業(yè)做內部數據挖掘,幫企業(yè)找到更精準用戶,降低營銷成本,提高企業(yè)銷售率,增加利潤等。
大數據、社會化媒體營銷真正實現了營銷模式的“量體裁衣”,這是營銷領域跨時代的進步。未來企業(yè)的競爭,將是擁有數據規(guī)模和活性的競爭,將是對數據解釋和運用的競爭。
隨著技術的發(fā)展,大數據社會化營銷將是未來營銷的主戰(zhàn)場,即將到來的大數據時代可以在任何行業(yè),任何服務上出現,由此可能產生的服務和商業(yè)模式將是無窮盡的。筆者認為,圍繞大數據至少可以演繹出6 種新的商業(yè)模式,如表1-6 所示。
表1-6 6 種新的商業(yè)模式
如今,“大數據”這一話題在國內受到投資者追捧,也不斷有高技術人才選擇這個方向創(chuàng)業(yè);但實際上國外對于“大數據”,已經走過了概念炒作階段,進入到實際的應用,產生了實際的效益。例如,美國奧巴馬政府已經開始大規(guī)模地投資大數據領域,這是大數據從商業(yè)行為上升到國家戰(zhàn)略的分水嶺,表明大數據正式提升到戰(zhàn)略層面,大數據在經濟社會各個層面、各個領域都開始受到重視。筆者相信,“大數據”將領跑新一輪互聯網投資高潮,讓資產逐步變成資本。
- 最新書評 查看所有書評
-
- 發(fā)表書評 查看所有書評
-