1. 程式人生 > >Python 3 邂逅 AI 工程師

Python 3 邂逅 AI 工程師

課程簡介

本課程以 AI 工程師為終極目標,從 AI 職業出發,利用 Python 3 破冰 AI。

本課程從數學建模入手,詳細介紹了 Python 3 在 AI 工程中的應用,包括資料探索、資料分析與挖掘、機器學習、資料科學、自然語言處理等主題。每一小節都為讀者提供了數學知識和程式碼示例來理解,幫助讀者更好地掌握各個知識點。

認真學完本課,你會發現 AI 並不是那麼高不可攀,甚至要跟 AI 相關的技術工作說 Hello!

本課程主要包含三部分:

第一部分(第01課),基礎部分(包含預備知識與前期準備),其中簡單介紹了 Python 中重要包如 Numpy、Pandas 等;

第二部分(第02-10課),介紹四種工程師內容(資料科學家、機器學習工程師、自然語言工程師與推薦演算法工程師),以構建實戰案例的形式進行闡述,真實實現“身臨其境”;

第三部分(第11課),Tensorflow 極簡入門,開啟深度學習的大門。

作者介紹

黃海濤,筆名零壹,資深演算法工程師,目前擔任 AI 醫療專案技術負責人,CSDN 專家。前供求世界網路科技運營總監、數學碩士,數十次獲得建模獎項,全國研究生數學建模競賽一等獎得主,熱衷分享。個人微訊號:huangtaonide、微信公眾號:R-data、還有一個你。

課程內容

導讀:進入 AI 領域需做的準備

對 AI 的態度

對於 AI,不用嘲笑,也不要過譽!

人工智慧(Artificial Intelligence,英文縮寫為 AI)的話題隔一段時間就會火一把。剛結束不久的國際盛會——2018 年博鰲亞洲論壇上,首次運用的人工智慧( Artificial Intelligence,英文縮寫為AI)同聲傳譯就在關鍵時刻“掉鏈子”了:將發言外賓用英文表述的“一帶一路”翻譯成了“一條公路和一條腰帶”“道路和傳送帶”。此次 AI 同聲傳譯被吐的“槽點”還有不少,比如系統崩潰、亂碼、一會兒一個“啊、啊”,連續出現一堆“for,for,for⋯⋯”,甚至連自己的英文縮寫“ AI ”都認不出,只能翻譯成“挨”。這麼多的梗,以至於翻譯界一片唏噓和自嘲:“飯碗終於暫時保住了!”

   enter image description here  相關負責人出面解釋,博鰲論壇活動規格高,演講者的語種變化多、專業方向多、發言人數多,有各種語料知識、專業名詞、五湖四海的英語流派,再加上話筒雜訊、回聲等環境音的干擾,AI 同聲傳譯確實面臨較大挑戰。

  不過李彥巨集說得好,“對於 AI,不用嘲笑,也不要過譽”。現在需要做的,不是找 AI 的黑歷史、挖它的“槽點”、抗拒它的到來,而是要主動適應,迎接“AI 時代”的到來。對於 AI 從業者,尤其需要客觀認清技術與產業應用現狀,不斷髮現問題,解決問題,推動 AI 朝著越來越成熟的方向邁進。(資訊來源:北京科技報第004版)  

AI的趨勢

一、世界一流的人工智慧來自中國

去年7月份,國務院釋出《新一代人工智慧發展規劃》,對人工智慧的佈局發展做出全面的設計,提出到 2030 年人工智慧理論、技術與應用總體達到世界領先水平。

越來越多的傳統制造業企業希望藉助人工智慧實現轉型升級,網際網路企業則加大了人工智慧領域的佈局。

二、人工智慧行業人才最緊缺

而隨著人工智慧站上風口,相關企業、人才都變得緊俏。在國務院規劃中,必須加快培養人工智慧各層次人才,用於滿足行業發展需要。

中國人工智慧人才缺口超過 500 萬人,而目前中國人工智慧人才數量不足 5 萬人。目前,中國人工智慧方向的高校實驗室只有不到 30 個,每年輸出的人才數量遠遠小於市場需求。所以人工智慧行業在近 3 到 5 年會成為最缺人的行業。

三、行業巨頭如何在 AI 領域佈局

enter image description here

四、人工智慧的語言選擇

1956 年,人工智慧概念首次被提出,如今,人工智慧已成為最炙手可熱的產業之一!計算機二級考試加入“ Python 語言程式設計”科目!Python 程式設計確定進入浙江省資訊科技高考!小學資訊科技六年級教材也加入了 Python 內容!小學生都開始接觸 Python 語言了!!!真的是,不能讓孩子輸在起跑線上啊!!

語言的選擇

誰會成為 AI 和大資料時代的第一開發語言?這本已是一個不需要爭論的問題。如果說三年前, Matlab、Scala、R、Java 和 Python 還各有機會,局面尚且不清楚,那麼三年之後,趨勢已經非常明確了,特別是前兩天 Facebook 開源了 PyTorch 之後, Python 作為 AI 時代頭牌語言的位置基本確立,未來的懸念僅僅是誰能坐穩第二把交椅。

Python 語言從 1991 年釋出第一個版本,至今已經快 30 年了。作為一種解釋型語言,很多年裡一直打著“指令碼語言”的標籤,並因為執行速度被詬病。根據資料平臺 Kaggle 釋出的 2017 年機器學習及資料科學調查報告,在工具語言使用方面,Python 是資料科學家和人工智慧從業者使用最多的語言(見下圖)。

enter image description here

IEEE 綜覽(IEEE Spectrum)釋出的 2017 最受歡迎程式語言列表中,Python 同樣位列第一(見下圖)。

enter image description here

如果不是想成為程式碼詩人,或者語言大師,只是想用盡量簡單直接的方法,把事情做了,首選語言確實是 Python。

以理論與實踐入門 AI

人工智慧研究這個領域是有一定門檻的。對於初學者來說,一般通常的做法是直接購買一些熱門的書籍,比如“西瓜書”、“花書”、“xx天從入門到精通”、“xx天從入門到放棄”等等,但大多數書籍都是講的基礎知識,稍顯乏味和枯燥,此外內容太深奧,初學者可能看一段時間就想放棄了。因此需要一個好的方法才可以!

this is 故事:這是一個數學家通過程式碼找到女朋友的故事。

OkCupid 是一家約會網站,每個註冊使用者需要回答 350 道問題,系統根據答案自動計算使用者間的匹配程度,優先將合適的物件推薦出來。

enter image description here

麥克金雷(Mckinlay)是一位數學家,會寫程式碼的數學家。他註冊了 12 個賬號,用 Python 指令碼從 OkCupid 網站爬取了幾萬個符合他個人要求的女性。然後用貝爾實驗室的 K-Modes 演算法將這些女人分成了7類。他又寫了個程式,在和他最匹配的那類人的主頁留下腳印。這樣,當姑娘們登入之後就會發現,有個速配指數超高的男人前來關注自己。很快,麥克金雷的收件箱就被塞爆了,每天不停有美女主動前來答訕,最終麥克金雷選擇了一位美術專業的碩士生作自己的女朋友。這一年,他35歲。 麥克金雷將他的故事寫成了書,OkCupid 更是大肆宣傳,為網站帶來了千萬次曝光量。這個故事發生在 2012 年,至今仍在傳播。 

“最有用的知識是關於方法的知識” ---達爾文,作者從自身學習經歷入手,選取有價值的知識點,希望本課程的思路與方法能夠在您的職業生涯中起到正向作用!

本課程目錄












附錄:準備工作

看到這,如果你仍然對 Python 下 AI 很感興趣,那麼你就需要準備安裝 Python 環境了(具體安裝方法請自行百度,如果實在不會可以聯絡),在你開始學習 Python 之前,最重要的是,你要安裝 Python 環境。許多初學者會糾結,應該選擇 2.x 版本還是 3.x 版本的問題。在我看來,世界變化的速度在變得更快,語言的更新速度亦然,沒有什麼理由讓我們只停留在過去,而不往前看。對於越來越普及、同時擁有諸多酷炫新特性的 Python 3.x,我們真的沒有什麼理由拒絕它。如果你理解了 Life is short, you need Python 的苦衷,就應該去選擇這種面向未來的開發模式。同時選擇一個自己喜歡的 IDE 工具,在這裡推薦作者使用的 Python IDE,叫做 PyCharm,當然其他的 IDE 也都是可以的。安裝完成後即可步入學習程序。

第01課:預備知識:早期的數學建模與當今火熱的 AI
第02課:前期準備:AI 中的資料科學家入門
第03課:前期準備:AI 中的資料科學家實戰
第04課:AI 中的機器學習工程師入門
第05課:AI 中的機器學習工程師實戰(三種樸素貝葉斯)
第06課:AI 中的機器學習工程師實戰(SVM)
第07課:AI 中的自然語言處理工程師實戰(分詞與關鍵詞提取)
第08課:AI 中的自然語言處理工程師實戰(Word2vec)
第09課:AI 中的推薦演算法工程師理論入門
第10課:AI 中的推薦演算法工程師實戰
第11課:向 AI 宣戰,破冰 Tensorflow

閱讀全文: http://gitbook.cn/gitchat/column/5b433e18df17855431c9617a