1. 程式人生 > >我瞭解的國內資料探勘應用現狀

我瞭解的國內資料探勘應用現狀

九年前開始接觸資料探勘,當時國內關於商務智慧(BI)的研究以及應用還比較少見。近些年隨著國內企業資訊系統的不斷完善與發展與資料的持續積累,各行各業已經普遍關心資料探勘技術的應用。 陸續給國內企業做了一些資料探勘方面的培訓,發現國內應用資料探勘的企業還是以通訊企業(移動、聯通、電信)為首,應用的深度和廣度都處於領先地位,原因主要是行業競爭比較激烈、直接,另外通訊業的資料質量和數量都還不錯。分析領域已經從8年前的客戶流失分析、話務量預測為主發展到增值套餐組合推廣、地理位置預測、網路優化等,可以說幾乎涵蓋了通訊行業的全業務。 除了通訊業,國內的銀行、保險、證券使用資料探勘技術的意願也比較強烈,這跟國際趨勢相吻合,未來幾年金融領域的資料分析應用一定會從傳統的統計分析發展到大規模資料探勘應用。 但跟國外相比,國內零售業對資料探勘的應用好像並不太熱衷,這可能與客戶資訊的完整性有關,也就是說“啤酒和尿片”的故事需要再過幾年才能在國內零售業發生。 我國政府部門中使用資料挖技術比較領先的是稅務系統,我感覺國稅總局對資訊系統建設及資料分析應用工作也越來越重視。 隨著電子商務的普及,各大商務網站已經大規模使用資料探勘技術,並且迅速從中取得商業價值。比如,國內好多網上商城已經開始使用資料探勘技術進行客戶聚類或者商品關聯推廣。 另外,我認為搜尋引擎企業使用資料探勘技術的需求也非常迫切。是從技術角度講,他們需要使用資料探勘演算法發現Web頁面之間的關聯與結構關係,更好的進行網頁推送;從商務角度講,各大搜索引擎需要取得更多的廣告收入,需要對點選流資料進行分析,以實現最大的商業利潤。 以上判斷基於個人的工作實踐及培訓經驗,難免有遺漏偏差,希望有機會接觸更多的行業更多的企業以及更多對資料探勘感興趣的朋友。更多內容參見博主開設的專門網站神州商務智慧網www.bi60.cn

相關推薦

瞭解國內資料應用現狀

九年前開始接觸資料探勘,當時國內關於商務智慧(BI)的研究以及應用還比較少見。近些年隨著國內企業資訊系統的不斷完善與發展與資料的持續積累,各行各業已經普遍關心資料探勘技術的應用。 陸續給國內企業做了一些資料探勘方面的培訓,發現國內應用資料探勘的企業還是以通訊企業(移動、聯通

Hadoop裡的資料應用-Mahout——學習筆記<三>

由於平時對資料探勘做的比較多,所以優先看Mahout方向視訊。 Mahout有很好的擴充套件性與容錯性(基於HDFS&MapReduce開發),實現了大部分常用的資料探勘演算法(聚類、分類、推薦演算法)不過資料探勘調參和業務理解是關鍵,個人覺得真正想學習的話,還是看正規機器學習的課程比較好。

資料應用的一些場景和對應演算法

資料探勘越來使用廣泛,下愛你介紹一些常見的使用場景以及對應的演算法: 1. 客戶細分:典型的分類問題 2.客戶流失預測分析:當作一個識別問題處理 3.客戶社會關係挖掘:關聯分析以及基於圖的關聯分

一小時瞭解資料②:分類演算法的應用和成熟案例解析

分類演算法的應用 本節將為大家介紹資料探勘中的分類演算法在一些行業中的代表性應用。我們將演算法應用分為表述問題和解決過程兩個階段,表述問題即需要運用資料探勘能夠理解和處理的語言來闡述業務問題,最重要的是能夠用正確且符合實際的方式把業務問題轉化成資料探勘問題,這往往

專訪唐宇迪博士:是如何邁入同濟大學校園的?淺談人工智慧,未來資料和計算機視覺是風口

1.網上很多同學對老師您的簡歷非常好奇,在百度搜索上發現大家都很關心“唐宇迪是哪個學校畢業的”?關於您的學習經歷能簡單說下嗎? 唐宇迪:幾年前第一次邁進同濟大學校園,攻讀博士學位,並加入了資料探勘專案組,以此真正開始了機器學習之旅。學習的過程有些枯燥在所難免,但是想著可以將演算法應用於實驗當中,

資料與資料化運營實戰:思路、方法、技巧與應用》第一章 什麼是資料化運營

《資料探勘與資料化運營實戰:思路、方法、技巧與應用》電子書地址:http://www.chforce.com/books/datamining-om-by-data/index.html 資料化運營實施的前提條件包括企業級海量資料儲存的實現、精細化運營的需求(與傳統的粗放型運營相對比)、資料分析

瞭解機器學習、資料、人工智慧的關係。

  人工智慧是電腦科學的一個分支,機器學習是電腦科學和統計學的交叉學科。資料探勘是機器學習和資料庫的交叉。資料探勘利用機器學習的技術來分析海量資料,人工智慧也用機器學習的方法解決問題。如:個性化推薦,就是通過機器學習的一些演算法、技術分析平臺上的各種購買,瀏覽和收藏日誌的海量資料,得到

吳裕雄 資料與分析案例實戰(12)——SVM模型的應用

import pandas as pd # 匯入第三方模組from sklearn import svmfrom sklearn import model_selectionfrom sklearn import metrics # 讀取外部資料letters = pd.read_csv(r'F:\\py

資料建築應用

基於資料探勘的建築能耗評價研究 John  E.  Seem 基於建築能耗逐日資料,通過與歷史用能情況相比,來判別對於特定某一天的建築能耗是否存在異常;並通過歷史能耗資料的平均值和標準差,來確定異常能耗與正常能耗的差異程度 Imran  Khan&n

資料在公共建築能耗分析中的應用研究

本文提出運用資料探勘技術進行公共建築的能耗分析,以提高節能決策的有效性,主要研究內容及方法如下:  ①能量利用效率的量化。針對能量利用效率存在簡單判定的不足,提出能耗分佈率的概念並給出其計算公式。  ②建立公共建築能耗分析的聚類模型。公共建築能耗分析的資料探勘應用主題有能耗預測、

資料在商用建築領域的應用

 能源與環境是當今世界的兩大熱點問題, 越來越受到世人的矚目。我國是 能源消費大國, 能源利用率低,人均能源儲備很少, 節能工作成為了國家當務 之急的重任。本文藉助新興的資料探勘技術來研究和預測建築能耗, 為本專業 在建築能耗領域的研究提供新方法和新思路, 做出跨學科研究

資料應用案例】摩拜騎行資料違章停車

案例來源:@機器之心 作者:Tianfu He、Jie Bao、Ruiyuan Li、Sijie Ruan、Yanhua Li、Chao Tian、Yu Zheng 0. 背景: 隨著汽車保有量增加,停車位供不應求,違章停車現象增加。傳統的檢測違停的方式是交警巡

看完“最老程式設計師創業札記:全文檢索、資料、推薦引擎應用” 有感

         今天早起,看完這篇文章,頗有感,想記錄一些關鍵點,以期後用! 這篇文章很不錯,但是卻讓讀者完整的經歷了在網際網路領域從草根idea到產品上線盈利的完整過程。 1、技術積累很重要。文章

專注於資料演算法研究和應用

開宗明義,B樹是為磁碟或其他直接存取輔助裝置而設計的一種平衡查詢樹。一般設計的簡單資料結構都是面向主存而設計的,主存讀取速度快但容量小;而磁碟讀取速度慢而容量大,於是針對磁碟而設計的資料結構就不同於為主存而設計的。就樹結構上來說,紅黑樹的二叉性質和高深度適合主存,而B樹正是

是學Java的,想嘗試學習大資料資料,該怎麼規劃學習路線?

個人是從Java後端開發,經過3個月的業餘自學成功轉型大資料工程師。 背景介紹完畢,開始正式一本正經回答問題: 本回答目錄: 一.大資料方向工作介紹 二.大資料工程師的技能要求 三.大資料學習路徑 四.學習資源推薦(書籍、部落格、網站)   一.大資料方向工作介紹

資料實踐與的想法之特徵工程

從一個最近的天池資料探勘比賽,記錄部分特徵工程實踐內容。 比賽連結 商鋪定位 本人渣渣,排名TOP21。 本部落格採用二分類XGBOOST模型,同時涉及部分的多分類模型。重點介紹業務特徵,對於一些科技特徵,就私藏了。 簡單分析 比賽資料給了三部分:

資料的的超級應用資料之推薦系統

資料探勘——推薦系統   大資料可以認為是許多資料的聚合,資料探勘是把這些資料的價值發掘出來,比如有過去10年的氣象資料,通過資料探勘,幾乎可以預測明天的天氣是怎麼樣的,有較大概率是正確的。 機器學習是人工智慧的核心,對大資料進行發掘,靠人工肯定是做不來的,那就得靠機器代替

資料演算法與現實生活中的應用案例

如何分辨出垃圾郵件”、“如何判斷一筆交易是否屬於欺詐”、“如何判斷紅酒的品質和檔次”、“掃描王是如何做到文字識別的”、“如何判斷佚名的著作是否出自某位名家之手”、“如何判斷一個細胞是否屬於腫瘤細胞”等等,這些問題似乎都很專業,都不太好回答。但是,如果瞭解一點點資

資料在金融行業十大應用

目前資料探勘在各行各業應用廣泛,尤其在金融、保險、電子商務和電信方面得到了很好的效果,本文對金融行業資料探勘應用做了一個簡單的總結,目的是想起到拋磚引玉的作用,歡迎各位大牛拍磚。 一:風險控制(貸款償還預測和客戶信用評價) 有很多因素會對貨款償還效能和客戶信用等級計算

資料時代下資料技術的應用

原文連結:https://mp.weixin.qq.com/s/bxSEO4gKQ-BbDWT1BNnwyw 隨著社會資訊化的迅速發展,無論是資料的變化速率,還是資料的新增種類都在不斷更新,資料研究變得越來越複雜,這意味著“大資料時代”到來。2011年,網際網路資料中心(internet dat