1. 程式人生 > >5個學習大資料的正確姿勢

5個學習大資料的正確姿勢

  資料科學這個新領域發展迅速的同時也有著較大的人才缺口,還有其可觀的薪資吸引了無數人。小編分享學習大資料的5個正確姿勢:

  一、學習動機

  

  資料科學是一個廣泛而模糊的領域,這使得它很難學習。沒有動力,你最終會中途停止對自己失去信心。所以,你需要動力去激勵自己,即使是在半夜公式已經開始變的模糊,你還是想探究關於神經網路的意義。你需要些動力來讓你發現統計、線性代數和神經網路之間的聯絡,當你在困惑“下一步我該學習什麼?”的時候。

  我痴迷於改善程式的效能,我痴迷於股票市場,我學習去愛資料。我去學習一切能讓這個專案結果更好的技能。並不是每個人都會痴迷於股市預測,但重要的是要發現你想學習的東西。

  二、實踐出真知

  

  學習神經網路、影象識別和其他尖端技術是很重要的,但大多數資料科學工作不涉及這些,而是:

  1、90%的工作將是資料清理。

  2、精通幾個演算法比知道一點許多演算法要好。

  3、如果你知道線性迴歸、k - means聚類和邏輯迴歸,可以解釋和詮釋他們的研究結果,並可以用這些完成一個專案,你將比如果你知道每一個演演算法,但不使用它們更優質。

  4、大多數時候,當你使用一種演算法,它將是庫中的一個版本(你很少會自己編碼支援向量機實現——這需要太長時間)。

  所有這些意味著最好的學習方法是在專案工作中學習,通過專案,你可以獲得有用的技能。一種方法是在一個專案中先找到一個你喜歡的資料集,回答一個有趣的問題。另一種方法是找到一個深層次的問題,例如預測股票市場,然後分解成小步驟。我先進次連線到雅虎財經的API,並爬下每日價格資料。然後我建立了一些指標,比如在過去的幾天裡的平均價格,並用它們來預測未來(這裡沒有真正的演算法,只是技術分析)。這個效果不太好,所以我學會了一些統計知識,然後用線性迴歸。 然後連線到另一個API,清理每一分鐘的資料,並存儲在一個SQL資料庫。 等等,直到演算法效果很好。

  這樣做的好處是我在一個學習環境中學習。我不僅僅學習了SQL語法,用它來儲存價格資料,還比僅僅學習語法多學習了十倍的東西。學習而不應用的知識很難被保留,當你做實際的工作的時候也不會準備好。

大資料是未來的發展方向,正在挑戰我們的分析能力及對世界的認知方式,因此,我們與時俱進,迎接變化,並不斷的成長!大資料學習群:868847735  一起討論進步學習