1. 程式人生 > >大資料分析中的挖掘技術(一)

大資料分析中的挖掘技術(一)

在大資料分析中,資料的挖掘技術是比較重要的,畢竟資料探勘是獲取資料來源的方式,我們都知道大資料分析是需要資料的,沒有資料何談分析?所以我們就需要重視大資料中的挖掘技術,下面我們就在這篇文章中給大家講述一下大資料分析中的挖掘技術。

首先我們給大家說一下大資料分析技術,大資料分析技術就是改進已有資料探勘和機器學習技術,同時開發資料網路挖掘、特異群組挖掘、圖挖掘等新型資料探勘技術。實現突破基於物件的資料連線、相似性連線等大資料融合技術。還要突破使用者興趣分析、網路行為分析、情感語義分析等面向領域的大資料探勘技術。所以大資料分析技術還是很複雜,很實用的。

而資料探勘的意義就是比較簡單的了,所謂的資料探勘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用資料中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的資訊和知識的過程。可以這麼說,資料探勘工作的好壞會直接影響到大資料分析的結果。

通常來說,資料探勘的技術以及方法有很多,我們根據挖掘任務可分為分類或預測模型發現、資料總結、聚類、關聯規則發現、序列模式發現、依賴關係或依賴模型發現、異常和趨勢發現等等。根據挖掘物件可分為關係資料庫、面向物件資料庫、空間資料庫、時態資料庫、文字資料來源、多媒體資料庫、異質資料庫、遺產資料庫以及環球網。我們根據挖掘方法分類的話,可粗分為:機器學習方法、統計方法、神經網路方法和資料庫方法。由此可見,資料探勘的方法是很多的,從側面角度看來,資料探勘是很重要的事情。

但是機器學習中,可細分為歸納學習方法、基於範例學習、遺傳演算法等。統計方法中,可細分為:迴歸分析、判別分析、聚類分析、探索性分析等。神經網路方法中,可細分為:前向神經網路、自組織神經網路等。資料庫方法主要是多維資料分析或OLAP方法,另外還有面向屬性的歸納方法。

在這篇文章中我們給大家簡單地介紹了大資料分析中的挖掘技術,我們在這篇文章中給大家說了大資料分析技術、資料探勘的意義、資料探勘的技術以及方法還有機器學習,我們會在下一篇文章中給大家介紹更多的內容,最後感謝大家的閱讀。