1. 程式人生 > >IT人的前沿技術書單:學不到老,就活不到老

IT人的前沿技術書單:學不到老,就活不到老

伸縮 以及 了解 必須 設置 plot hold 設計模式 海量數據

IT人作為這個互聯網時代的弄潮兒,我們天生就處於技術浪潮的中心地帶,技術的變革讓我們不得不掌握終生學習的能力和多元化的知識領域,技術的浪潮時而沖天而起,時而又歸於平靜,但是始終在推動著人類社會向前發展。你我,在這場技術引發的世界改革浪潮中,都置身其中,我們必須時刻準備好站在浪潮之巔的準備,準備迎接技術新世界。本文為大家選取了一些有關雲計算、大數據以及人工智能的書籍,我相信,你我都能夠成為這個世界的改變者。


《雲計算:概念、技術與架構》 —— Thomas ERL,Zaigham Mahmood,Ricardo Puttini

技術分享《計算機科學叢書·雲計算:概念、技術與架構》共包含五個部分,第一部分到第四部分主要涵蓋了雲計算基礎、雲計算機制、雲計算架構以及雲計算使用等內容,以雲計算起源為出發點,介紹了雲計算領域的基本概念。第五部分給出了案例研究結論,介紹了工業標準組織、雲計算機制與特性之間的對應關系、數據中心設施、雲計算新興技術,並給出了雲提供合同和雲商業案例模板。雲計算是利用復雜技術創新的分布式技術平臺,提供了高可擴展和彈性的環境,軟件企業可以以各種強大的方式遠程使用該平臺。軟件開發人員想要成功地在雲環境上構建系統、與雲環境集成,甚至創建雲環境,需要理解雲內部的機制、架構和模型,同時還要理解由於使用基於雲的服務所造成的商業和經濟因素。這本書理論與實踐並重,重點放在主流雲計算平臺和解決方案的結構和基礎上。除了以技術為中心的內容以外,還包括以商業為中心的模型和標準。此外,本書提供了一些用來計算與SLA相關的服務質量的模板和公式,還給出了大量的SaaS、PaaS和IaaS交付模型。


《性能之巔:洞悉系統、企業與雲計算》 —— Brendan Gregg

技術分享《性能之巔:洞悉系統、企業與雲計算》基於Linux 和Solaris 系統闡述了適用於所有系統的性能理論和方法,Brendan Gregg 將業界普遍承認的性能方法、工具和指標收集於本書之中。閱讀這本書,你能洞悉系統運作的方式,學習到分析和提高系統與應用程序性能的方法,這些性能方法同樣適用於大型企業與雲計算這類較為復雜的環境的性能分析與調優。縱觀全書,作者建立了系統性能優化的體系框架,並且骨肉豐滿。很明顯,他不僅擅長某方面的性能優化,更是全方位的專家,加之作為DTrace主要開發者,使得本書的說服力和含金量大增。本書讓我們有機會系統學習和掌握性能優化的各方面,有機會建立一種高屋建瓴的全局觀,在面對復雜系統問題時再不會手足無措,或只能盲人摸象。Linux系統演化至今,基礎的體系架構和關鍵組件並未發生多大改變,這使得這本好書即使再歷經多年,價值毫無衰減,反而歷久彌新。


《大數據時代:生活工作與思維的大變革》 —— Viktor Mayer-Sch?nberger, Kenneth Cukier

技術分享《大數據時代》是國外大數據研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為“大數據商業應用第一人”,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究 。維克托最具洞見之處在於,他明確指出,大數據時代最大的轉變就是,放棄對因果關系的渴求,而取而代之關註相關關系。也就是說只要知道“是什麽”,而不需要知道“為什麽”。這就顛覆了千百年來人類的思維慣例,對人類的認知和與世界交流的方式提出了全新的挑戰。《大數據時代》認為大數據的核心就是預測。大數據將為人類的生活創造前所未有的可量化的維度。大數據已經成為了新發明和新服務的源泉,而更多的改變正蓄勢待發。書中展示了谷歌、微軟、亞馬遜、IBM、蘋果、facebook、twitter、VISA等大數據先鋒們最具價值的應用案例。


《爆發:大數據時代預見未來的新思維》 —— AlbertLászlóBarabási

技術分享《爆發:大數據時代預見未來的新思維》是一本顛覆《黑天鵝》的驚世之作。如果說塔勒布認為人類行為是隨機的,都是小概率事件,是不可以預測的;那麽全球復雜網絡權威巴拉巴西則認為,人類行為93%是可以預測的,在大數據時代我們可以預測未來。作者巴拉巴西的研究是在人類生活數字化的大數據時代基礎上進行的,移動電話、網絡以及電子郵件使人類行為變得更加容易量化,將我們的社會變成了一個巨大的數據庫。在《爆發:大數據時代預見未來的新思維》中,巴拉巴西揭開人類行為背後隱藏的模式“爆發”,提出人類日常行為模式不是隨機的,而是具有“爆發性”的。爆發揭開了人類行為中令人驚訝的深層次的秩序,使得人類變得比預期中更容易預測得多。爆發模式的揭示,其影響力將與20世紀初期的物理學或者基因革命的影響力不相上下。


《利用Python進行數據分析》 —— Wes McKinney

技術分享本書作者Wes McKinney,資深數據分析專家,對各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,並在大量的實踐中積累了豐富的經驗。撰寫了大量與Python數據分析相關的經典文章,被各大技術社區爭相轉載。開發了用於數據分析的著名開源Python庫——pandas,廣獲用戶好評。《利用Python進行數據分析》適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程序員。將IPython這個交互式Shell作為你的首要開發環境。這本書講的是利用Python進行數據控制、處理、整理、分析等方面的具體細節和基本要點。同時,它也是利用Python進行科學計算的實用指南(專門針對數據密集型應用)。《利用Python進行數據分析》重點介紹了用於高效解決各種數據分析問題的Python語言和庫,但是沒有闡述如何利用Python實現具體的分析方法。


《深入淺出數據分析》 —— Michael Milton

技術分享《深入淺出數據分析》以類似“章回小說”的活潑形式,生動地向讀者展現出色的數據分析人員應知應會的技術:數據分析基本步驟、實驗方法、優化方法、假設檢驗方法、貝葉斯統計方法、主觀概率法、啟發法、直方圖法、回歸法、誤差處理、相關數據庫、數據整理技巧;正文之後還介紹數據分析十大要務、R工具及ToolPak工具,在充分展現目標知識以外,為讀者搭建了走向深入研究的橋梁。《深入淺出數據分析》利用Excel或0penoffice應用程序組織數據,在R應用程序中進行進一步整理,通過散點圖和直方圖找出有意義的模式,借助啟發式算法做出結論,通過實驗和假定測試預見未來,再以清楚直觀的圖形展示分析結果。無論你是研究新產品可行性的開發人員,還是評估廣告效果的市場營銷經理;無論你是向客戶呈報數據的營銷員,還是管理所有這些數據密集型部門及種種其他事務的個人企業家,這本書都能為你帶來全面的學習體驗,讓你將數據轉變為事業中有用的工具。


《Hadoop權威指南》 —— Tom White

技術分享《Hadoop權威指南》作者Tom White,被稱之為為:數學王子&Hadoop專家。身為Apache Hadoop提交者八年之久,Apache軟件基金會成員之一。全球知名雲計算公司Cloudera的軟件工程師。Tom擁有英國劍橋大學數學學士學位和利茲大學科學哲學碩士學位。本書通過豐富的案例學習來解釋Hadoop的幕後機理,闡述了Hadoop如何解決現實生活中的具體問題。第3版覆蓋Hadoop的最新動態,包括新增的MapReduce API,以及MapReduce 2及其靈活性更強的執行模型(YARN)。準備好釋放數據的強大潛能了嗎?借助於這本《Hadoop權威指南》,你將學習如何使用Apache Hadoop構建和維護穩定性高、伸縮性強的分布式系統。本書是為程序員寫的,可幫助他們分析任何大小的數據集。本書同時也是為管理員寫的,幫助他們了解如何設置和運行Hadoop集群。


《Spark快速大數據分析》 —— Holden Karau,Andy Konwinski,Patrick Wendell,Matei Zaharia

技術分享《Spark快速大數據分析》由 Spark 開發者及核心成員共同打造,講解了網絡大數據時代應運而生的、能高效迅捷地分析處理數據的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和保存海量數據的方法,學會交互、叠代和增量式分析,解決分區、數據本地化和自定義序列化等問題。《Spark快速大數據分析》是一本為Spark初學者準備的書,它沒有過多深入實現細節,而是更多關註上層用戶的具體用法。不過,本書絕不僅僅限於Spark的用法,它對Spark的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然。這本書介紹了開源集群計算系統Apache Spark,它可以加速數據分析的實現和運行。利用Spark,你可以用Python、Java以及Scala的簡易API來快速操控大規模數據集。《Spark快速大數據分析》由Spark開發者編寫,可以讓數據科學家和工程師即刻上手。你能學到如何使用簡短的代碼實現復雜的並行作業,還能了解從簡單的批處理作業到流處理以及機器學習等應用。


《數據算法:Hadoop/Spark大數據處理技巧 》 —— Mahmoud Parsian

技術分享《數據算法:Hadoop/Spark大數據處理技巧》介紹了很多基本設計模式、優化技術和數據挖掘及機器學習解決方案,以解決生物信息學、基因組學、統計和社交網絡分析等領域的很多問題。這本書還概要介紹了MapReduce、Hadoop和Spark。這本書面向了解Java基礎知識並且想使用Hadoop和Spark 開發MapReduce 算法(數據挖掘、機器學習、生物信息技術、基因組和統計領域)和解決方案的軟件工程師、軟件架構師、數據科學家和應用開發人員。《數據算法:Hadoop/Spark大數據處理技巧》還被稱為“市面上N0.1本關於Hadoop與Spark大數據處理技巧的教程”。


《機器學習》 —— 周誌華

技術分享本書作者周誌華,南京大學計算機系教授,ACM傑出科學家,IEEE Fellow, IAPR Fellow, IET/IEE Fellow, 中國計算機學會會士。國家傑出青年科學基金獲得者、長江學者特聘教授。先後擔任多種SCI(E)期刊執行主編、副主編、副編輯、編委等。中國計算機學會人工智能與模式識別專業委員會主任,中國人工智能學會機器學習專業委員會主任,IEEE計算智能學會數據挖掘技術委員會副主席。可以說是人工智能界的大牛,這是少有的華人大牛之一。

機器學習是計算機科學與人工智能的重要分支領域。本書作為該領域的入門教材,在內容上盡可能涵蓋機器學習基礎知識的各方面.。全書共16 章,大致分為3 個部分:第1 部分介紹機器學習的基礎知識;第2 部分討論一些經典而常用的機器學習方法;第3 部分為進階知識,內容涉及特征選擇與稀疏學習、計算學習理論、半監督學習、概率圖模型、規則學習以及強化學習等。

IT人的前沿技術書單:學不到老,就活不到老