1. 程式人生 > >大數據公司挖掘數據價值的49個典型案例

大數據公司挖掘數據價值的49個典型案例

知識 菜單顯示 家具 工具 雲計算 art sha 數據分析 除了

對於企業來說,100條理論確實不如一個成功的標桿有實踐意義,本文的主旨就是尋找“正在做”大數據的49個樣本。力圖從企業運營和管理的角度,梳理出發掘大數據價值的一般規律:

一是以數據驅動的決策,主要通過提高預測概率,來提高決策成功率;二是以數據驅動的流程,主要是形成營銷閉環戰略,提高銷售漏鬥的轉化率;三是以數據驅動的產品,在產品設計階段,強調個性化;在產品運營階段,則強調叠代式創新。

技術分享圖片

上篇 天然大數據公司的各種套餐

從谷歌、亞馬遜、Facebook、LinkedIn,到阿裏、百度、騰訊,都因其擁有大量的用戶註冊和運營信息,成為天然的大數據公司。而像IBM、Oracle、EMC、惠普這類大型技術公司紛紛投身大數據,通過整合大數據的信息和應用,給其他公司提供“硬件軟件 數據”的整體解決方案。我們關註的重點是大數據的價值,第一類公司首當其沖。

下面就是這些天然大數據公司的挖掘價值的典型案例。

01 亞馬遜的“信息公司”

如果全球哪家公司從大數據發掘出了最大價值,截至目前,答案可能非亞馬遜莫屬。亞馬遜也要處理海量數據,這些交易數據的直接價值更大。作為一家“信息公司”,亞馬遜不僅從每個用戶的購買行為中獲得信息,還將每個用戶在其網站上的所有行為都記錄下來:頁面停留時間、用戶是否查看評論、每個搜索的關鍵詞、瀏覽的商品等等。這種對數據價值的高度敏感和重視,以及強大的挖掘能力,使得亞馬遜早已遠遠超出了它的傳統運營方式。

亞馬遜CTO Werner Vogels在CeBIT上關於大數據的演講,向與會者描述了亞馬遜在大數據時代的商業藍圖。長期以來,亞馬遜一直通過大數據分析,嘗試定位客戶和和獲取客戶反饋。“在此過程中,你會發現數據越大,結果越好。為什麽有的企業在商業上不斷犯錯?那是因為他們沒有足夠的數據對運營和決策提供支持,”Vogels說,“一旦進入大數據的世界,企業的手中將握有無限可能。”從支撐新興技術企業的基礎設施到消費內容的移動設備,亞馬遜的觸角已觸及到更為廣闊的領域。

亞馬遜推薦:亞馬遜的各個業務環節都離不開“數據驅動”的身影。在亞馬遜上買過東西的朋友可能對它的推薦功能都很熟悉,“買過X商品的人,也同時買過Y商品”的推薦功能看上去很簡單,卻非常有效,同時這些精準推薦結果的得出過程也非常復雜。

亞馬遜預測:用戶需求預測是通過歷史數據來預測用戶未來的需求。對於書、手機、家電這些東西——亞馬遜內部叫硬需求的產品,你可以認為是“標品”——預測是比較準的,甚至可以預測到相關產品屬性的需求。但是對於服裝這樣軟需求產品,亞馬遜幹了十多年都沒有辦法預測得很好,因為這類東西受到的幹擾因素太多了,比如:用戶的對顏色款式的喜好,穿上去合不合身,愛人朋友喜不喜歡…… 這類東西太易變,買得人多反而會賣不好,所以需要更為復雜的預測模型。

亞馬遜測試:你會認為亞馬遜網站上的某段頁面文字只是碰巧出現的嗎?其實,亞馬遜會在網站上持續不斷地測試新的設計方案,從而找出轉化率最高的方案。整個網站的布局、字體大小、顏色、按鈕以及其他所有的設計,其實都是在多次審慎測試後的最優結果。

亞馬遜記錄:亞馬遜的移動應用讓用戶有一個流暢的無處不在的體驗的同時,也通過收集手機上的數據深入地了解了每個用戶的喜好信息;更值得一提的是Kindle Fire,內嵌的Silk瀏覽器可以將用戶的行為數據一一記錄下來。

以數據為導向的方法並不僅限於以上領域,亞馬遜的企業文化就是冷冰冰的數據導向型文化。對於亞馬遜來說,大數據意味著大銷售量。數據顯示出什麽是有效的、什麽是無效的,新的商業投資項目必須要有數據的支撐。對數據的長期專註讓亞馬遜能夠以更低的售價提供更好的服務。

02 谷歌的意圖

如果說有一家科技公司準確定義了“大數據”概念的話,那一定是谷歌。根據搜索研究公司comScore的數據,僅2012年3月一個月的時間,谷歌處理的搜索詞條數量就高達122億條。谷歌的體量和規模,使它擁有比其他大多數企業更多的應用大數據的途徑。

谷歌搜索引擎本身的設計,就旨在讓它能夠無縫鏈接成千上萬的服務器。如果出現更多的處理或存儲需要,抑或某臺服務器崩潰,谷歌的工程師們只要再添加更多的服務器就能輕松搞定。將所有這些數據集合在一起所帶來的結果是:企業不僅從最好的技術中獲益,同樣還可以從最好的信息中獲益。下面選擇谷歌公司的其中三個亮點。

谷歌意圖:谷歌不僅存儲了搜索結果中出現的網絡連接,還會儲存用戶搜索關鍵詞的行為,它能夠精準地記錄下人們進行搜索行為的時間、內容和方式,坐擁人們在谷歌網站進行搜索及經過其網絡時所產生的大量機器數據。這些數據能夠讓谷歌優化廣告排序,並將搜索流量轉化為盈利模式。谷歌不僅能追蹤人們的搜索行為,而且還能夠預測出搜索者下一步將要做什麽。用戶所輸入的每一個搜索請求,都會讓谷歌知道他在尋找什麽,所有人類行為都會在互聯網上留下痕跡路徑,谷歌占領了一個絕佳的點位來捕捉和分析該路徑。換言之,谷歌能在你意識到自己要找什麽之前預測出你的意圖。這種抓取、存儲並對海量人機數據進行分析,然後據此進行預測的能力,就是數據驅動的產品。

谷歌分析:谷歌在搜索之外還有更多獲取數據的途徑。企業安裝“谷歌分析”之類的產品來追蹤訪問者在其站點的足跡,而谷歌也可獲得這些數據。網站還使用“谷歌廣告聯盟”,將來自谷歌廣告客戶網的廣告展示在其站點,因此,谷歌不僅可以洞察自己網站上廣告的展示效果,同樣還可以對其他廣告發布站點的展示效果一覽無余。

谷歌趨勢:既然搜索本身是網民的“意圖數據庫”,當然可以根據某一專題搜索量的漲跌,預測下一步的走勢。谷歌趨勢可以預測旅遊、地產、汽車的銷售。此類預測最著名的就是谷歌流感趨勢,跟蹤全球範圍的流感等病疫傳播,依據網民搜索,分析全球範圍內流感等病疫的傳播狀況。

03 eBay的分析平臺

早在2006年,eBay就成立了大數據分析平臺。為了準確分析用戶的購物行為,eBay定義了超過500種類型的數據,對顧客的行為進行跟蹤分析。eBay分析平臺高級總監Oliver Ratzesberger說:“在這個平臺上,可以將結構化數據和非結構化數據結合在一起,通過分析促進eBay的業務創新和利潤增長。”

eBay行為分析:在早期,eBay網頁上的每一個功能的更改,通常由對該功能非常了解的產品經理決定,判斷的依據主要是產品經理的個人經驗。而通過對用戶行為數據的分析,網頁上任何功能的修改都交由用戶去決定。“每當有一個不錯的創意或者點子,我們都會在網站上選定一定範圍的用戶進行測試。通過對這些用戶的行為分析,來看這個創意是否帶來了預期的效果。”

eBay廣告分析:更顯著的變化反映在廣告費上。eBay對互聯網廣告的投入一直很大,通過購買一些網頁搜索的關鍵字,將潛在客戶引入eBay網站。為了對這些關鍵字廣告的投入產出進行衡量,eBay建立了一個完全封閉式的優

04 塔吉特的“數據關聯挖掘”

利用先進的統計方法,商家可以通過用戶的購買歷史記錄分析來建立模型,預測未來的購買行為,進而設計促銷活動和個性服務避免用戶流失到其他競爭對手那邊。美國第三大零售商塔吉特,通過分析所有女性客戶購買記錄,可以“猜出”哪些是孕婦。其發現女性客戶會在懷孕四個月左右,大量購買無香味乳液。由此挖掘出25項與懷孕高度相關的商品,制作“懷孕預測”指數。推算出預產期後,就能搶先一步,將孕婦裝、嬰兒床等折扣券寄給客戶。塔吉特還創建了一套購買女性行為在懷孕期間產生變化的模型,不僅如此,如果用戶從它們的店鋪中購買了嬰兒用品,它們在接下來的幾年中會根據嬰兒的生長周期定期給這些顧客推送相關產品,使這些客戶形成長期的忠誠度。

05 中國移動的數據化運營

通過大數據分析,中國移動能夠對企業運營的全業務進行針對性的監控、預警、跟蹤。大數據系統可以在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。

客戶流失預警:一個客戶使用最新款的諾基亞手機,每月準時繳費、平均一年致電客服3次,使用WEP和彩信業務。如果按照傳統的數據分析,可能這是一位客戶滿意度非常高、流失概率非常低的客戶。事實上,當搜集了包括微博、社交網絡等新型來源的客戶數據之後,這位客戶的真實情況可能是這樣的:客戶在國外購買的這款手機,手機中的部分功能在國內無法使用,在某個固定地點手機經常斷線,彩信無法使用——他的使用體驗極差,正在面臨流失風險。這就是中國移動一個大數據分析的應用場景。通過全面獲取業務信息,可能顛覆常規分析思路下做出的結論,打破傳統數據源的邊界,註重社交媒體等新型數據來源,通過各種渠道獲取盡可能多的客戶反饋信息,並從這些數據中挖掘更多的價值。

數據增值應用:對運營商來說,數據分析在政府服務市場上前景巨大。運營商也可以在交通、應對突發災害、維穩等工作中使大數據技術發揮更大的作用。運營商處在一個數據交換中心的地位,在掌握用戶行為方面具有先天的優勢。作為信息技術的又一次變革,大數據的出現正在給技術進步和社會發展帶來全新的方向,而誰掌握了這一方向,誰就可能成功。對於運營商來說,在數據處理分析上,需要轉型的不僅是技巧和法律問題,更需要轉變思維方式,以商業化角度思考大數據營銷。

06 Twitter中的興趣和情緒

Twitter興趣聚類:通過過濾用戶歸屬地、發推位置和相關關鍵詞,Twitter建立了一系列定制化的客戶數據流。比如,通過過濾電影片名、位置和情緒標簽,你可以知道洛杉磯、紐約和倫敦等城市最受歡迎的電影是哪些。而根據用戶發布的個人行為描述,你甚至能搜索到那些在加拿大滑雪的日本遊客。從這個視角看,Twitter的興趣圖譜的效率優於Facebook的社交圖譜。Twitter的用戶數據所能產生的潛在價值同樣令人驚嘆。在社交媒體網站正在收集越來越多的數據的形勢下,它們或許能找到更好的方式來利用這些數據盈利,並使其取代廣告成為自身提高收入的主要方式。這些社交網站真正的價值可能在於數據本身。相信在不久的將來,如果尋找到既能充分利用用戶數據,又可合理規避對用戶隱私的威脅,社交數據所蘊藏的巨大能量將會徹底被開啟。

Twitter情緒分析:Twitter自己並不經營每一款數據產品,但它把數據授權給了像DataSift這樣的數據服務公司,很多公司利用Twitter社交數據,做出了各種讓人吃驚的應用,從社交監測到醫療應用,甚至可以去追蹤流感疫情爆發,社交媒體監測平臺DataSift還創造了一款金融數據產品。華爾街“德溫特資本市場”公司首席執行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以“1”到“50”進行打分。根據打分結果,霍廷再決定如何處理手中數以百萬美元計的股票。霍廷的判斷原則很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。一些媒體公司會把觀眾收視率數據打包到產品裏,再轉賣給頻道制作人和內容創造者。

精確的數據一旦與社交媒體數據相結合,對未來的預測會非常準。

07 特易購的精準定向

聰明的商家通過用戶的購買歷史記錄分析來建立模型,為他們量身預測未來的購物清單,進而設計促銷活動和個性服務,讓他們源源不斷地為之買單。特易購是全球利潤第二大的零售商,這家英國超級市場巨人從用戶行為分析中獲得了巨大的利益。從其會員卡的用戶購買記錄中,特易購可以了解一個用戶是什麽“類別”的客人,如速食者、單身、有上學孩子的家庭等等。這樣的分類可以為提供很大的市場回報,比如,通過郵件或信件寄給用戶的促銷可以變得十分個性化,店內的促銷也可以根據周圍人群的喜好、消費的時段來更加有針對性,從而提高貨品的流通。這樣的做法為特易購獲得了豐厚的回報,僅在市場宣傳一項,就能幫助特易購每年節省3.5億英鎊的費用。

Tesco的優惠券:特易購每季會為顧客量身定做6張優惠券。其中4張是客戶經常購買的貨品,而另外2張則是根據該客戶以往的消費行為數據分析,極有可能在未來會購買的產品。僅在1999年,特易購就送出了14.5萬份面向不同的細分客戶群的購物指南雜誌和優惠券組合。更妙的是,這樣的低價無損公司整體的盈利水平。通過追蹤這些短期優惠券的回籠率,了解到客戶在所有門店的消費情況,特易購還可以精確地計算出投資回報。發放優惠券吸引顧客其實已經是很老套的做法了,而且許多的促銷活動實際只是來掠奪公司未來的銷售額。然而,依賴於紮實的數據分析來定向發放優惠券的特易購,卻可以維持每年超過1億英鎊的銷售額增長。

特易購同樣有會員數據庫,通過已有的數據,就能找到那些對價格敏感的客戶,然後在公司可以接受的最低成本水平上,為這類顧客傾向購買的商品確定一個最低價。這樣的好處一是吸引了這部分顧客,二是不必在其他商品上浪費錢降價促銷。

特易購的精準運營:這家連鎖超市在其數據倉庫中收集了700萬部冰箱的數據。通過對這些數據的分析,進行更全面的監控並進行主動的維修以降低整體能耗。

08 Facebook的好友推薦

Facebook是社交網絡巨擎,但是在挖掘大數據價值方面,好像辦法不多,值得一提的就是好友推薦。Facebook使用大數據來追蹤用戶在其網絡的行為,通過識別你在它的網絡中的好友,從而給出新的好友推薦建議,用戶擁有越多的好友,他們與Facebook之間的黏度就越高。更多的好友意味著用戶會分享更多照片、發布更多狀態更新、玩更多的遊戲。

09 LinkedIn的獵頭價值

LinkedIn網站使用大數據在求職者和招聘職位之間建立關聯。有了LinkedIn,獵頭們再也不用向潛在的受聘者打陌生電話來碰運氣,而可以通過簡單的搜索找出潛在受聘者並聯系他們。與此相似,求職者也可以通過聯系網站上其他人,自然而然地將自己推銷給潛在的雇主。有兩個例子能夠生動呈現LinkedIn的數據價值:幾年前,LinkedIn忽然發現近期雷曼兄弟的來訪者多了起來,當時並沒引起重視,過了不久,雷曼兄弟宣布倒閉;而在谷歌宣布退出中國的前一個月,在LinkedIn發現了一些平時很少見的谷歌產品經理在線,這也是相同的道理。如果LinkedIn針對性地分析某家上

10 沃爾瑪的數據基因

早在1969年沃爾瑪就開始使用計算機來跟蹤存貨,1974年就將其分銷中心與各家商場運用計算機進行庫存控制。1983年,沃爾瑪所有門店都開始采用條形碼掃描系統。1987年,沃爾瑪完成了公司內部的衛星系統的安裝,該系統使得總部,分銷中心和各個商場之間可以實現實時,雙向的數據和聲音傳輸。采用這些在當時還是小眾和超前的信息技術來搜集運營數據為沃爾瑪最近20年的崛起打下了堅實的地基,從而發現了“啤酒與尿布”關聯。

如今,沃爾瑪擁有著全世界最大的數據倉庫,在數據倉庫中存儲著沃爾瑪數千家連鎖店在65周內每一筆銷售的詳細記錄,這使得業務人員可以通過分析購買行為更加了解他們的客戶。通過這些數據,業務員可以分析顧客的購買行為,從而供應最佳的銷售服務。沃爾瑪一直致力於改善自身的數據收集技術,從條形碼掃描,到安裝衛星系統實現雙向數據傳輸,整個公司都充滿了數據基因。2012年4月,沃爾瑪又收購了一家研究網絡社交基因的公司Kosmix,在數據基因的基礎上,又增加了社交基因。

11 阿裏小貸和聚石塔

雖然阿裏系的余額寶如日中天,但其實阿裏小貸才真正體現出了大數據的價值。早在2010年阿裏就已經建立了“淘寶小貸”,通過對貸款客戶下遊訂單、上遊供應商、經營信用等全方位的評估,就可以在沒有見面情況下,給客戶放款,這當然是對阿裏平臺上大數據的挖掘。數據來源於“聚石塔”——一個大型的數據分享平臺,它通過共享阿裏巴巴旗下各個子公司的數據資源來創造商業價值。這款產品就是大數據團隊把淘寶交易流程各個環節的數據整合互聯,然後基於商業理解對信息進行分類儲存和分析加工,並與決策行為連接起來所產生的效果。

12 西爾斯的數據大集成

在過去,美國零售巨頭西爾斯控股公司,需要八周時間才能制定出個性化的銷售方案,但往往做出來的時候,它已不再是最佳方案。痛定思痛,決定整合其專售的三個品牌——Sears、Craftsman、Lands‘End的客戶、產品以及銷售數據,使用群集收集來自不同品牌的數據,並在群集上直接分析數據,而不是像以前那樣先存入數據倉庫,避免了浪費時間——先把來自各處的數據合並之後再做分析。這種調整讓公司的推銷方案更快、更精準,可以從海量信息中挖掘價值,但是價值巨大,困難也巨大:這些數據需要超大規模分析,且分散在不同品牌的數據庫與數據倉庫中,不僅數量龐大而且支離破碎。

西爾斯的困境,在傳統企業中非常普遍,這些企業家一直想不通,既然互聯網零售商亞馬遜可以推薦閱讀書目、推薦電影、推薦可供購買的產品,為什麽他們所在的企業卻做不到類似的事情。西爾斯公司首席技術官菲裏·謝利(Phil Shelley)說:如果要制定一系列復雜推薦方案質量更高,需要更及時、更細致、更個性化的數據,傳統企業的IT架構根本不能完成這些任務,需要痛下決心,才能完成轉型。

技術分享圖片

中篇 輕公司數據創業狂歡

在這次“數據盛宴”中,是否只有大公司的狂歡?並非如此,從事大數據產業的輕公司將無處不在。新興的創業公司通過出售數據和服務更有針對性地提供單個解決方案,把大數據商業化、商品化,才是更加值得我們關註的模式。這將帶來繼門戶網站、搜索引擎、社交媒體之後的新一波創業浪潮和產業革命,並會對傳統的咨詢公司產生強烈沖擊。

13 PredPol的犯罪預測

PredPol公司通過與洛杉磯和聖克魯斯的警方以及一群研究人員合作,基於地震預測算法的變體和犯罪數據來預測犯罪發生的幾率,可以精確到500平方英尺的範圍內。在洛杉磯運用該算法的地區,盜竊罪和暴力犯罪分布下降了33%和21%。

14 Tipp24 AG的賭徒行為預測

Tipp24 AG針對歐洲博彩業構建的下註和預測平臺。該公司用KXEN軟件來分析數十億計的交易以及客戶的特性,然後通過預測模型對特定用戶進行動態的營銷活動。這項舉措減少了90%的預測模型構建時間。SAP公司正在試圖收購KXEN,“SAP想通過這次收購來扭轉其長久以來在預測分析方面的劣勢”。

15 Inrix的堵車預言

交通的參與者多種多樣,是大數據最能發揮價值的領域。交通流量數據公司Inrix依靠分析歷史和實時路況數據,能給出及時的路況報告,以幫助司機避開正在堵車的路段,並且幫他們提前規劃好行程。汽車制造商、移動應用開發者、運輸企業以及各類互聯網企業都需要Inrix的路況報告。奧迪、福特、日產、微軟等巨頭都是Inrix的客戶。

16 潘吉瓦的時尚預測

消費者追尋意見領袖的生活方式。潘吉瓦公司就是用數據分析來預測流行趨勢,以此為基礎甚至撬動全球貿易。比如,它們通過41次追蹤《暮光之城》的徽章、襪子的運輸情況,分析在這部電影中主角的服飾對流行趨勢有多大影響率,並將分析結果告知用戶,建議他們對自己的行動做出恰當的調整。

17 潘多拉的音樂推薦

美國在線音樂網站潘多拉特別聘請一些音樂專家,讓他們每個人平均花上20分鐘去分析一首歌曲,並賦予每首歌400種不同的屬性。如果你表示喜歡一首歌,程序會自動尋找跟這首歌“基因”相同的歌曲,猜測你也會喜歡並采用推薦引擎技術推薦給你。借助這種人海戰術,潘多拉網站已經分析了74萬首歌曲。

18 Futrix Health的醫療方案

Futrix Health是一家專註於用通過數據為患者制定醫療解決方案的公司,從安裝在智能手機上的個人健康應用,到診所、醫院裏醫生使用的電子健康記錄儀,甚至是革命性的數字化基因組數據,均連接到後端數據倉庫上。從而為患者制定最佳的醫院選擇、醫藥選擇。該如何將采集到醫療保健機構的大量操作信息,分析患者情況或治療效果,實施任何高效率的措施,使之更具有意義——大數據時代提供的機會,不再是簡單地收集這些數據,而是如何運用數據來更好地認知這個世界。

19 Retention Science的用戶粘性

在零售領域,創業公司Retention Science發布了一個為電子商務企業提供增強用戶粘性的數據分析及市場策略設計的平臺,它的用戶建模引擎具備自學習功能,通過使用算法和統計模型來設計優化用戶粘性的策略。平臺的用戶數據分析都是實時進行,以確保用戶行為預測總是符合實際用戶行為更新;同時,動態的根據這些行為預測來設計一些促銷策略。RS目前已獲得Baroda Ventures, Mohr Davidow Ventures, Double M Partners及一些著名天使投資人130萬美金的投資。

20 眾瀛的婚嫁後推薦

江蘇眾瀛聯合數據科技有限公司構建了這樣一個大數據平臺——將準備結婚的新人作為目標消費者,並把與結婚購物相關的商家加入其中。一對新人到薇薇新娘婚紗影樓拍了婚紗照,在實名登記了自己的信息後會被上傳到大數據平臺上。大數據平臺能根據新人在婚紗影樓的消費情況和偏好風格,大致分析判斷出新人後續消費需求,即時發送獎勵和促銷短信。比如邀請他們到紅星美凱龍購買家具、到紅豆家紡選購床上用品、到國美電器選購家用電器、到希爾頓酒店擺酒席……如果新人在紅星美凱龍購買了中式家具,說明他們偏好中國傳統文化,就推薦他們購買紅豆家紡的中式家居用品。

21 Takadu的數字馴水

水,向來是個不好管理的東西:自來水公司發現某個水壓計出現問題,可能需要花上很長的時間排查共用一個水壓計的若幹水管。等找到的時侯,大量的水已經被浪費了。以色列一家名為Takadu的水系統預警服務公司解決了這個問題。Takadu把埋在地下的自來水管道水壓計、用水量和天氣等檢測數據搜集起來,通過亞馬遜的雲服務傳回Takadu公司的電腦進行算法分析,如果發現城市某處地下自來水管道出現爆水管、滲水以及水壓不足等異常狀況,就會用大約10分鐘完成分析生成一份報告,發回給這片自來水管道的維修部門。報告中,除了提供異常狀況類型以及水管的損壞狀況——每秒漏出多少立方米的水,還能相對精確地標出問題水管具體在哪裏。檢測每千米“水路”,Takadu的月收費是1萬美元。

22 百合網的婚戀匹配

電商行業的現金收入源自數據,而婚戀網站的商業模型更是根植於對數據的研究。比如,作為一家婚戀網站,百合網不僅需要經常做一些研究報告,分析註冊用戶的年齡、地域、學歷、經濟收入等數據,即便是每名註冊用戶小小的頭像照片,這背後也大有挖掘的價值。百合網研究規劃部李琦曾經對百合網上海量註冊用戶的頭像信息進行分析,發現那些受歡迎頭像照片不僅與照片主人的長相有關,同時照片上人物的表情、臉部比例、清晰度等因素也在很大程度上決定了照片主人受歡迎的程度。例如,對於女性會員,微笑的表情、直視前方的眼神和淡淡的妝容能增加自己受歡迎的概率,而那些臉部比例占照片1/2、穿著正式、眼神直視沒有多余pose的男性則更可能成為婚戀網站上的寵兒。

23 Prismatic的新聞外衣

Prismatic是一款個性化新聞應用,只有4名創始員工,憑借互聯網數據爬蟲和社交網絡開發平臺的數據,依托亞馬遜的雲計算平臺,實現了大數據的精益創業。Prismatic不提供統一的設計精良的新聞訂閱或推薦界面,而是根據分析用戶的Facebook 或Twitter資料,為用戶做一對一的數據分析和推薦。從盈利模式來看,Prismatic不是依靠廣告費生存下來,也不是傳統的新聞媒介,而是一個披著新聞應用外衣的電子商務公司。名義上為了給用戶個性化推薦新聞而得到用戶的個人信息進行數據分析,針對性的推出推薦商品,從而從電子商務中盈利。

24 Opower的對比激勵

人類都有和同類對比的天性,例如,一家政府機構收集不同地點從事同類工作的多組員工的數據,僅僅將這些信息公諸於眾就促使落後員工提高了績效。在能源行業,Opower使用數據對比來提高消費用電的能效,並取得了顯著的成功。作為一家SaaS的創新公司,Opower與多家電力公司合作,分析美國家庭用電費用並將之與周圍的鄰居用電情況進行對比,被服務的家庭每個月都會受到一份對比的報告,顯示自家用電在整個區域或全美類似家庭所處水平,以鼓勵節約用電。Opower的服務以覆蓋了美國幾百萬戶居民家庭,預計將為美國消費用電每年節省5億美元。Opower報告信封,看上去像賬單,它們使用行為技術輕輕地說服公用事業客戶降低消耗。Opower已經推出了它的大數據平臺 Opower4 ,通過分析各種智能電表和用電行為,電力公司等公用事業單位成為Opower的盈利來源。而對一般用戶而言,Opower完全是免費的。

25 Chango和Uniqlick的點擊消費

使用新的數據技術,諸如美國的Chango公司和中國的Uniqlick公司正在數字廣告行業中探索新的商業模式——實時競拍數字廣告。通過了解互聯網用戶在網絡的搜索、瀏覽等行為,這些公司可以為廣告主提供最有可能對其商品感興趣的用戶群,從而進行精準營銷;更長期的趨勢是,將廣告投放給最有可能購買的用戶群。這樣的做法對於廣告主來說,可以獲得更高的轉換率,而對於發布廣告的網站來說,也提高了廣告位的價值。

26 眾趣的行為辯析

眾趣是國內第一家社交媒體數據管理平臺,目前國內主要的社交開放平臺在用戶數據的開放性方面仍比較保守,身為第三方數據分析公司,能夠獲得的用戶數據還十分有限,要使用這些用戶數據需獲得用戶許可。眾趣通過運營統計學等相關數據分析原理對用戶數據進行過濾,最終完成的是對一個用戶的行為、動作等個體特征的描述。這些描述可以幫助品牌營銷者了解消費者的消費習慣及需求;也可以幫助企業的領導增強對自己員工的了解。除了對個體以及群體行為特征的描述外,這些數據分析結果還可用於對用戶群體的行為預測,從而為營銷者提供一些前瞻性的市場分析。眾趣數據分析的結果只能精準到群組而無法達到個人。此類的用戶數據研究除在市場營銷領域具有一定的參考價之外,目前大多還主要用於配合一些小調研。此外,這些數據還可以實現對用戶甚至企業機構的信用評級,在金融領域也有一定程度的使用。

27 拖拉網的明天猜想

導購電商的拖拉網制作了“明天穿什麽”這一應用。在這個應用當中,眾多時裝圈權威人士輸送時裝搭配與風格單品,由用戶任意打分,根據用戶的打分偏好,拖拉網便能猜到明天她們想穿什麽,然後為她在數十萬件網購時裝中推薦單品,並且實現直通購買下單。在獲取客戶數據後,後臺分析也是各顯神通。

拖拉網加入了更多變量來考核自己的推薦模式。比如有消費者明天要參加一個聚會,不知道要穿什麽風格,也沒有看天氣預報,希望導購網站能幫她把這些場景和自己的信息組合起來,給出一整套的解決方案。於是日期、地域、場合、風格,這些都成為穿衣搭配解決方案的變量,經過不斷的組合呈現給用戶,據拖拉網數據,用戶在看到一個比較優質的搭配,並有場景性引導的時候,點擊到最後頁面完成購買的轉化率會比單品推薦高40%。

28 SeeChange的基因健康

現在人們有了把人類基因檔案序列化的能力,這允許醫生和科學家去預測病人對於某些疾病的易感染性和其他不利的條件,可以減少治療過程的時間和花費。位於舊金山的SeeChange公司創建了一套新的健康保險模式。該公司通過分析客戶的個人健康記錄、醫療報銷記錄、以及藥店的數據,來判斷該客戶對於慢性病的易感性,並判斷該客戶是否有可能從一些定制的康復套餐中獲利。SeeChange同時設計健康計劃,並設立獎勵機制鼓勵客戶主動完成健康行動,全過程都通過其數據分析引擎來監控。

29 Given Imaging的圖像診斷

以色列的Given Imaging公司發明了一種膠囊,內置攝像頭,患者服用後膠囊能以大約每秒14張照片的頻率拍攝消化道內的情況,並同時傳回外置的圖像接收器,患者病征通過配套的軟件被錄入數據庫,在4至6小時內膠囊相機將通過人體排泄離開體外。一般來說,醫生都是在靠自己的個人經驗進行病征判斷,難免會對一些疑似陰影拿捏不準甚至延誤病人治療。現在通過Given Imaging的數據庫,當醫生發現一個可疑的腫瘤時,雙擊當前圖像後,過去其他醫生拍攝過的類似圖像和他們的診斷結果都會悉數被提取出來。可以說,一個病人的問題不再是一個醫生在看,而是成千上萬個醫生在同時給出意見,並由來自大量其他病人的圖像給出佐證。這樣的數據對比,不但提高了醫生診斷的效率,還提升了準確度。

30 Entelo的“前獵頭”

真正的技術人才永遠是各大公司的搶手貨,絕對不要坐等他們向你投簡歷,因為在他們還沒有機會寫簡歷之前很可能已經被其他公司搶走了。Entelo公司能替企業家們推薦那些才剛剛萌發跳槽動機的高級技術人才,以便先下手為強。

Entelo的數據庫裏目前有3億份簡歷。而如何判斷高級人才的跳槽傾向,Entelo有一套正在申請專利的算法。這套算法有70多個指標用於判定跳槽傾向。某公司的股價下跌、高層大換血、剛被另一大公司收購,這些都會被Entelo看作是導致該公司人才跳槽的可能性因素。於是Entelo就會立刻把該公司裏的高級人才的信息推送給訂閱了自己服務的企業家們。企業家們收到的簡歷跟一般的簡歷還不一樣。Entelo抓取了這些人才在各大社交網絡的信息。這樣企業家們可以了解該人提交過哪些代碼,在網上都回答了些什麽樣的問題,在Twitter上都發表的是些什麽樣的信息。總之,這些準備“挖角”的企業家能夠看到一個活生生的目標人才站在面前。

31 FlightCaster和Passur的延誤預測

航空業分秒必爭,尤其是航班抵達的準確時間。如果一班飛機提前到達,地勤人員還沒準備好,乘客和乘務員就會被困在飛機上白白耽誤時間;如果一班飛機延誤,地勤人員就只能坐著幹等,白白消耗成本。美國一家大航空公司從其內部報告中發現,大約10%的航班的實際到達時間與預計到達時間相差10分鐘以上,30%的航班相差5分鐘以上。FlightCaster是一家提供航班延誤信息預測的公司,主要根據航空公司的航班運行情況進行預測。與航空公司所擁有的類似航班運行情況的專有信息一樣,該公司擁有大量國內航班飛行和航班實時運行狀況的歷史數據。Flightcaster的秘訣就是其對大數據分析的有效利用和使用適當的軟件工具對產出數據進行實時管理。

Passur Aerospace是專門為航空業提供決策支持的技術公司。通過搜集天氣、航班日程表等公開數據,結合自己獨立收集的其他影響航班因素的非公開數據,綜合預測航班到港時間。時至2012年,Passur公司已經擁有超過155處雷達接收站,每4.6秒就收集一次雷達上每架飛機的一系列信息,這會持續地帶來海量數據。不僅如此,經過長期的數據收集,Passur擁有了一個超過十年的巨大的多維信息載體,為透徹的分析和恰當的數據模型提供了可能。Passur公司相信,航空公司依據它們提供的航班到達時間做計劃,能為每個機場每年節省數百萬美元。

32 Climate的農業保險

一家名為氣候公司的創業企業每天都會對美國境內超過100萬個地點、未來兩年的天氣情況進行超過1萬次模擬,其數據量龐大、動態、實時。隨後,該公司將根系結構和土壤孔隙度的相關數據,與模擬結果相結合,為成千上萬的農民提供農作物保險。通過遙感獲取土壤數據,這和我們過去所熟悉的通過網絡服務獲取用戶網絡行為數據不是一回事,數據的概念得以極大的擴充。要想對每塊田地提供精準的保險服務,肯定還需要與土地數據相配套的農產品期貨、氣候預測、國際貿易、國際政治和軍事安全、國民經濟,產業競爭等等各方面的數。在如此龐雜的大數據基礎上推出的商業模式是創新的,同現有農作物保險方式相比具備極大競爭力,並且是可持續和規模化的。更妙的是,這家公司基於大數據的運營,完全沒有進行高額的網絡設施投資,只是租用了亞馬遜的公共雲服務,一個月幾萬美元而已。

33 Hiptype的記錄閱讀

幾乎所有的收費電子書都會提供部分章節讓讀者試讀,其實,出版商需要弄清楚人們讀到了哪裏、讀完後有沒有購買,以及其他各種體驗,才能賣出更多的電子書。美國創業公司Hiptype開發了一套電子書閱讀分析工具,其商業模式就在試圖解決這一難題。Hiptype自稱為“面向電子書的Google Analytics”,能夠提供與電子書有關的豐富數據。它不僅能統計電子書的試讀和購買次數,還能繪制出“讀者圖譜”,包括用戶的年齡、收入和地理位置等。此外,它還能告訴出版商讀者在看完免費章節後是否進行了購買,有多少讀者看完了整本書,以及讀者平均看了多少頁,讀者最喜歡從哪個章節開始看,又在哪個章節半途而廢,等等。Hiptype能夠與電子書整合在一起,出版商無論選擇哪種渠道,總是能夠獲得用戶數據。Hiptype收集的所有數據都是匿名的。用戶在下載了內置Hiptype服務的電子書時,會得到一個提示,可以選擇將其屏蔽。

34 安客誠的“人網合一”

網絡營銷存在一個巨大問題,如何獲知在網上使用幾個不同名稱的人是否是同一個人?安誠客推出了一種名為“觀眾操作系統”的技術方案解決了這個問題。它允許市場營銷者與你的 “數字人物”綁定,即使你由於婚姻換了名字,或者使用昵稱,或者偶爾使用中名,它也照樣能夠解答那個已經換了地址或者電話號碼的人是否是同一個人的問題。

AOS 可以匯集不同數據庫中的信息,這些數據或離線或在線,是公司可能在不同場合針對個人而收集的。通過使用AbiliTec——一種Acxiom也擁有的數字化“身份識別”技術——AOS將客戶信息刪繁就簡,得到簡單單一的結果。AOS幫助安誠客的廣告客戶使用他們的數據在Facebook上找到廣告投放目標用戶。

技術分享圖片

下篇 數據關聯、數據廢氣和黑暗數據

大數據主要不作因果判斷,主要適用於關聯分析。很多關聯分析並不需要復雜的模型,只需要具有大數據的意識。

很多機構都有數據廢氣,數據不是用完就是被舍棄,它的再利用價值也許你現在不清楚,但在未來的某一刻,它會迸發出來,可以化廢為寶。

黑暗數據就是那些針對單一目標而收集的數據,通常用過之後就被歸檔閑置,其真正價值未能被充分挖掘。如果黑暗數據用在恰當的地方,也能公司的事業變得光明。

35 數據關聯分析

某公司團隊曾經使用來自手機的位置數據,來推測美國聖誕節購物季開始那一天有多少人在梅西百貨公司的停車場停車,進而可以預測其當天的銷售額,這遠早於梅西百貨自己統計出的銷售記錄。無論是華爾街的分析師或者傳統產業的高管,都會因這種敏銳的洞察力獲得極大的競爭優勢。

對於稅務部門來說,稅務欺騙正在日益的被關註,這時大數據可以用於增加政府識別詐騙的流程。在隱私允許的地方,政府部門可以綜合各個方面的數據比如車輛的登記,海外旅遊的數據來發現個人的花費模式,使稅務貢獻不被疊加。同時一個可疑的問題出現了,這並沒有直接的證據指向詐騙,這些結論並不能用來去控告個人。但是他可以幫助政府部門去明確他們的審計和其他的審核以及一些流程。

36 數據廢氣

物流公司的數據原來只服務於運營需要,但一經再利用,物流公司就華麗轉身為金融公司,數據用以評估客戶的信用,提供無抵押貸款,或者拿運送途中的貨品作為抵押提供貸款;物流公司甚至可以轉變為金融信息服務公司來判斷各個細分經濟領域的運行和走勢。

有公司已經在大數據中有接近“上帝俯視”的感覺,美國洛杉磯的一家企業宣稱,他們將全球夜景的歷史數據建立模型,在過濾掉波動之後,做出了投資房地產和消費的研究報告。麥當勞則通過外送服務,在售賣漢堡的同時獲得了用戶的精準地址,這些地址數據匯集之後,就變成了一份絕妙的房地產業的內部數據。

37 黑暗數據

在特定情況下,黑暗數據可以用作其他用途。Infinity Property & Casualty公司用累積的理賠師報告來分析欺詐案例,通過算法挽回了1200萬美元的代位追償金額。一家電氣銷售公司,通過積累10年ERP銷售數據分析,按照電氣設備的生命周期,給5年前的老客戶逐一拜訪,獲得了1000萬元以上電氣設備維修訂單,順利地進入MRO市場。

38 客戶流失分析

美國運通以前只能實現事後諸葛亮式的報告和滯後的預測,傳統的BI已經無法滿足其業務發展的需要。於是,AmEx開始構建真正能夠預測客戶忠誠度的模型,基於歷史交易數據,用115個變量來進行分析預測。該公司表示,對於澳大利亞將於之後4個月中流失的客戶,已經能夠識別出其中的24%。這樣的客戶流失分析,當然可以用於挽留客戶。酒店業可以為消費者定制相應的獨特的個性房間,甚至可以在墻紙上放上消費者的微博的旅遊心情等等。旅遊業可以根據大數據為消費者提供其可能會喜好的本地特色產品、活動、小而美的小眾景點等等來挽回遊客的心。

39 快餐業的視頻分析

快餐業的公司可以通過視頻分析等候隊列的長度,然後自動變化電子菜單顯示的內容。如果隊列較長,則顯示可以快速供給的食物;如果隊列較短,則顯示那些利潤較高但準備時間相對長的食品。

40 大數據競選

2012年,參與競選的奧巴馬團隊確定了三個最根本的目標:讓更多的人掏更多的錢,讓更多的選民投票給奧巴馬,讓更多的人參與進來!這需要“微觀”層面的認知:每個選民最有可能被什麽因素說服?每個選民在什麽情況下最有可能掏腰包?什麽樣的廣告投放渠道能夠最高效獲取目標選民?如競選總指揮吉姆·梅西納所說,在整個競選活中,沒有數據做支撐的假設不能存在。

為了籌到10億美元的競選款,奧巴馬的數據挖掘團隊在過去兩年搜集、存儲和分析了大量數據。他們註意到,影星喬治·克魯尼對美國西海岸40歲至49歲的女性具有非常大的吸引力:她們無疑是最有可能為了在好萊塢與克魯尼和奧巴馬共進晚餐而不惜自掏腰包的一個群體。克魯尼在自家豪宅舉辦的籌款宴會上,為奧巴馬籌集到數百萬美元的競選資金。此後,當奧巴馬團隊決定在東海岸物色一位對於這個女性群體具有相同號召力的影星時,數據團隊發現莎拉·傑西卡·帕克的粉絲們也同樣喜歡競賽、小型宴會和名人。“克魯尼效應”被成功地復制到了東海岸。

在整個的競選中,奧巴馬團隊的廣告費用花了不到3億美元,而羅姆尼團隊則花了近4億美元卻落敗,其中一個重要的原因在於,奧巴馬的數據團隊對於廣告購買的決策,是經過縝密的數據分析之後才制定的。一項民調顯示,80%的美國選民認為奧巴馬比羅姆尼讓他們感覺更加重視自己。結果是,奧巴馬團隊籌得的第一個1億美元中,98%來自於小於250美元的小額捐款,而羅姆尼團隊在籌得相同數額捐款的情況下,這一比例僅為31%。

41 監控非法改建

“私搭亂建”在哪個國家都是一件鬧心的事,而且容易引起火災。非法在屋內打隔斷的建築物著火的可能性比其他建築物高很多。紐約市每年接到2.5萬宗有關房屋住得過於擁擠的投訴,但市裏只有200名處理投訴的巡視員。市長辦公室一個分析專家小組覺得大數據可以幫助解決這一需求與資源的落差。該小組建立了一個市內全部90萬座建築物的數據庫,並在其中加入市裏19個部門所收集到的數據:欠稅扣押記錄、水電使用異常、繳費拖欠、服務切斷、救護車使用、當地犯罪率、鼠患投訴等等。接下來,他們將這一數據庫與過去5年中按嚴重程度排列的建築物著火記錄進行比較,希望找出相關性。果然,建築物類型和建造年份是與火災相關的因素。不過,一個沒怎麽預料到的結果是,獲得外磚墻施工許可的建築物與較低的嚴重火災發生率之間存在相關性。

利用所有這些數據,該小組建立了一個可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統。他們所記錄的建築物的各種特征數據都不是導致火災的原因,但這些數據與火災隱患的增加或降低存在相關性。這種知識被證明是極具價值的:過去房屋巡視員出現場時簽發房屋騰空令的比例只有13%,在采用新辦法之後,這個比例上升到了70%。

42 冒煙指數

近年來,非法集資案件參與集資人數持續上升,跨省案件持續多發,涉及多個省份乃至全國的重特大案件仍時有發生,總體形勢依然嚴峻。黨中央、國務院高度重視防範和處置非法集資工作。

冒煙指數是非法集資監測預警的事實標準。“森林著火總是冒煙的,而且火勢越大煙就越大。”冒煙指數的定義來源於這個思想。通過對歷史上出現的問題企業分析,發現企業風險都是有特征的,如欺詐、市場風險、操作風險、信用風險、流動性風險等等。利用大數據挖掘技術和外源數據,對互聯網金融平臺的信息提煉出運營風險、非法特征、輿情負面性、危害性、資金交易風險、利誘性等多個維度,綜合分析計算監控對象非法集資風險相關度,後經加權最終測算的數字,即是企業的“冒煙指數”,反映風險程度。指數越高,預示企業的風險越大。

冒煙指數處於0到100分之間。對指數在20-60分段內的企業,重點監測7種信息,包括:企業工商登記情況;企業商業模式;企業高管情況;企業資金端、資產端主要來源;產品登記情況、信息披露、資金托管;廣告宣傳事項;投資者適當性;產品收益率、起投點、收益期限等關鍵要素;對指數在60分以上,80分以下的企業會被列入重點監測群體,定期匯報給監管部門。監管機構金融辦、工商、稅務等部門,采取定期掃樓的方式進行排查清理。對於超過 80分的企業,政法機關就啟動打擊處置程序。

43 天氣賬單

常言道,“天有不測之風雲”,遇到過出門旅遊、重要戶外路演、舉辦婚禮等重要時刻卻被糟糕的天氣弄壞心情甚至造成經濟損失的情況嗎?全球第一家氣象保險公司“天氣賬單”能為用戶提供各類氣候擔保。客戶登錄“天氣賬單”公司網站,然後給出在某個特定時間段裏不希望遇到的溫度或雨量範圍。“天氣賬單”網站會在100毫秒內查詢出客戶指定地區的天氣預報,以及美國國家氣象局記載的該地區以往30年的天氣數據。通過計算分析天氣數據,網站會以承保人的身份給出保單的價格。這項服務不僅個人用戶需要,一些公司,比如旅行社也很樂意參與。

一家全球性飲料企業將外部合作夥伴的每日天氣預報信息集成,錄入其需求和存貨規劃流程。通過分析特定日子的溫度、降水和日照時間等3個數據點,該公司減少了在歐洲一個關鍵市場的存貨量,同時使預測準確度提高了大約5%。

44 歷史情景再現

微軟和以色列理工學院的研究人員已開發出一款軟件,能根據過去20年《紐約時報》的文章以及其他在線數據預測傳染病或者其他社會問題可能會於何時何地爆發。

在利用歷史數據進行測試時,該系統的表現十分驚人。例如,根據2006年對安哥拉幹旱的報道,該系統預測安哥拉很可能發生霍亂。這是由於,通過此前發生的多起事件,該系統了解到在幹旱出現的幾年後霍亂爆發的可能性將上升。此外,該系統根據對2007年初非洲大型颶風的報道,再次對安哥拉發生霍亂做出預警。而在不到一周之後,報道顯示安哥拉確實發生了霍亂。在其他測試,例如對疾病、暴力事件及傷亡人數的預測中,該系統的準確率達到70%至90%。

該系統的信息來自過去22年中《紐約時報》的報道存檔,具體時間為1986年至2007年。不過,該系統也利用了網絡上的其他一些數據,了解什麽樣的事件會帶來特定的社會問題。這些信息來源提供了不存在於新聞文章但卻有價值的內容,有助於確定不同事件之間的因果關系或前後關系。例如,該系統能夠推斷盧旺達和安哥拉城市之間所發生事件的關系,因為這兩個國家都位於非洲,有著類似的GDP,其他一些因素也很相似。根據這種方法,該系統認為,在預測霍亂爆發方面,應當考慮國家或城市的位置,國土面積有多少是水域,人口密度和GDP是多少,以及近幾年是否發生過幹旱。

負責此項研發工作的Horvitz表示,近幾十年來,世界的許多方面都發生了改變,不過人類的本性和環境的許多方面仍然未變,因此軟件可以從以往的數據中了解事情發生的模式,從而預測未來會發生什麽。他表示:“對於回溯更久之前的數據,我個人很感興趣。”

此類預測工具的市場正在形成。例如,一家名為RecordedFuture的創業公司根據網上的前瞻性報道和其他信息來源預測未來事件,該公司的客戶包括政府情報部門。該公司CEOChristopherAhlberg表示,利用“硬數據”來進行預測是可行的,但從原型系統到商用產品還有很長的路要走。

45 Nike+傳感鞋

耐克憑借一種名為Nike+的新產品變身為大數據營銷的創新公司。所謂Nike+,是一種以“Nike跑鞋或腕帶+傳感器”的產品,只要運動者穿著Nike+的跑鞋運動,iPod就可以存儲並顯示運動日期,時間、距離、熱量消耗值等數據。用戶上傳數據到耐克社區,就能和同好分享討論。耐克和Facebook達成協議,用戶上傳的跑步狀態會實時更新到賬戶裏,朋友可以評論並點擊一個“鼓掌”按鈕——神奇的是,這樣你在跑步的時候便能夠在音樂中聽到朋友們的鼓掌聲。隨著跑步者不斷上傳自己的跑步路線,耐克由此掌握了主要城市裏最佳跑步路線的數據庫。有了Nike+,耐克組織的城市跑步活動效果更好。參賽者在規定時間內將自己的跑步數據上傳,看哪個城市累積的距離長。憑借運動者上傳的數據,耐克公司已經成功建立了全球最大的運動網上社區,超過500萬活躍的用戶,每天不停地上傳數據,耐克借此與消費者建立前所未有的牢固關系。海量的數據對於耐克了解用戶習慣、改進產品、精準投放和精準營銷又起到了不可替代的作用。

46 沃爾沃的工業互聯網

在沃爾沃集團,通過在卡車產品中安裝傳感器和嵌入式CPU,從剎車到中央門鎖系統等形形色色的車輛使用信息,正源源不斷地傳輸到沃爾沃集團總部。“對這些數據進行分析,不僅可以幫助我們制造更好的汽車,還可以幫助客戶們獲取更好體驗。”沃爾沃集團CIORichStrader說。這些數據正在被用來優化生產流程,以提升客戶體驗和提升安全性。將來自不同客戶的使用數據進行分析,可以讓產品部門提早發現產品潛在的問題,並在這些問題發生之前提前向客戶預警。“產品設計方面的缺陷,此前可能需要有50萬臺銷量的時候才能暴露出來,而現在只需要1000臺,我們就能發現潛在的缺陷。”

47 McKesson的動態供應鏈

在美國最大的醫藥貿易商McKesson公司,對大數據的應用也已經遠遠領先於大多數企業,將先進的分析能力融合到每天處理200萬個訂單的供應鏈業務中,並且監督超過80億美元的存貨。對於在途存貨的管理,McKesson開發了一種供應鏈模型,它根據產品線、運輸費用甚至碳排放量而提供了極為準確的維護成本視圖。據公司流程改造副總裁RobertGooby說,這些詳細信息使公司能夠更加真實地了解任意時間點的運營情況。McKesson利用先進分析技術的另一個領域是對配送中心內的物理存貨配置進行模擬和自動化處理。評估政策和供應鏈變化的能力幫助公司增強了對客戶的響應能力,同時減少了流動資金。總體來講,McKesson的供應鏈轉型使公司節省了超過1億美元的流動資金。

48 紙牌屋與電影業

《紙牌屋》最大的特點在於,與以往電視劇的制作流程不同,這是一部“網絡劇”。簡而言之,不僅傳播渠道是互聯網觀看,這部劇從誕生之初就是一部根據“大數據”,即互聯網觀眾欣賞口味來設計的產品。Netflix成功之處在於其強大的推薦系統Cinematch,該系統基於用戶視頻點播的基礎數據如評分、播放、快進、時間、地點、終端等,儲存在數據庫後通過數據分析,計算出用戶可能喜愛的影片,並為他提供定制化的推薦。為此他們開設了年Netflix大獎(點擊查看獲獎算法),用百萬美元懸賞,獎勵能夠將其電影推薦算法準確性提高至少10%的人。

未來的電影制作成本將大幅降低,一千粉絲足以使電影成功。還是像《技術元素》裏說:“目光聚集的地方,金錢必將追隨。”

49 點評與餐飲業

美國很多州政府在與餐飲點評網lep展開合作,監督餐飲行業的衛生情況,效果非常好。人們不再像以前那樣從窗口去看餐館裏的情況,而是從手機APP裏的評論!在中國的本地化O2O點評比如大眾點評、番茄點等等,消費者可以對任何商家進行評判,同時商家也可以通過這些評判來提升自己的服務能力,在環節上進行更大力度的效率優化。

未來的餐飲行業將會由互聯網和社會化媒體上所產生和承載的數據徹底帶動起來,會有越來越多的人加入點評中,餐館優勝劣汰的速度將會大幅加快。

大數據公司挖掘數據價值的49個典型案例