簡易說人工智慧(三) 細數《美團機器學習實戰》裡的錯誤 1:開篇詞
美團的作品《美團機器學習實戰》,是工程領域非常好的一本書。也是難得的國內的人工智慧領域比較實用的作品,豆瓣評分大於7.5,這個評分在計算機領域算是不錯的書了。
但是為什麼選材如此好的作品未到8分呢,最近剛開始讀,說說從第一節公式介紹看到的問題。
1、學習人工智慧大家都知道最令人懼怕的就是公式,所以對於滿篇公式的作品大家會敬而遠之。
但是這本書就偏偏犯了這樣一個大忌,開篇第一章,就是公式堆砌。
2、如果介紹公式,畢竟都是並不複雜的公式。如果可以用通俗的語言解釋清楚來龍去脈和用途,應該會給作品加分,類似日本人寫的神書《深度學習入門:基於Python的理論與實現》,豆瓣評分直逼9分。
但是,美團的書其真的只堆砌了公式。追加一些知道了不用看,不知道的看了也不會明白的點評,肯定是拾人牙慧。
3、更重要的是,公式的介紹、算例計算都錯誤重重。下篇文章要分享的第一個問題,我連蒙帶猜看了好久,看不明白,後來一查資料。竟然是算錯了!
最近在閱讀之餘,想把將書中第一章關於公式含糊不清的點,以及錯誤。用通俗易懂的"人話"解釋給大家。
電子本作品下載:美團機器學習實踐
相關推薦
簡易說人工智慧(三) 細數《美團機器學習實戰》裡的錯誤 2:解釋NDCG
一、書中第10頁的錯誤1 二、什麼是NDCG 美團的小夥伴應該有是金融領域背景,詞典翻譯出來的四個詞兩個用了經濟學相關的詞。如果作者對這個演算法的真正本意有了解,恐怕也不會這麼翻譯。 首先,讀者要知道NDCG是用來評估一個推薦演算法的推薦結果的優劣的。就像《美團機器學習實戰》第
簡易說人工智慧(三) 細數《美團機器學習實戰》裡的錯誤 1:開篇詞
美團的作品《美團機器學習實戰》,是工程領域非常好的一本書。也是難得的國內的人工智慧領域比較實用的作品,豆瓣評分大於7.5,這個評分在計算機領域算是不錯的書了。 但是為什麼選材如此好的作品未到8分呢,最近剛開始讀,說說從第一節公式介紹看到的問題。 1、學習人工智慧大家都知道最令人懼
《美團機器學習實踐》第1章 問題建模
1.1 評估指標 評估指標用於反映模型效果。在預測問題中,要評估模型的效果,就需要將模型的預測結果f(X)f(X)f(X)和真實標註YYY進行比較,評估指標定義為f(X)f(X)f(X)和YYY的函式。 通常,線下使用的是機器學習評估指標,而線上使用的是業務指標
《美團機器學習實踐》—— 讀後總結
第一章 問題建模 第二章 特徵工程 第三章 常用模型 第四章 模型融合 第五章 使用者畫像 第六章 POI實體連結 第七章 評論挖掘 第八章 O2O場景下的查詢理解和使用者引導 第九章 O2O場景下排序的特點 第十章 推薦
美團機器學習崗面經
美團 今年由於阿里擁抱變化,縮招的訊息似乎影響了整個就業的形勢。舉個例子,據我瞭解某個實驗室去年數個BAT的offer,今年好像只有一兩個。當然大的趨勢我們無法改變,只有自己擁抱變化才行。在這個形勢之下能有一份自己滿意的工作的確很不容易,樓主經歷了不斷地挫折和失敗之後很慶
機器學習實戰讀書筆記(1)--k鄰近演算法
kNN演算法 kNN演算法概述 kNN演算法和kmeans演算法的比較 knn工作原理: 存在一個樣本資料集合(訓練樣本集),並且每個樣本都具有標籤,輸入新的樣本後,我們將樣本的特徵與訓練樣本集中的資料特徵比較,演算法提取特徵最相似的k個樣本的標籤,採用少數服從多數的
《機器學習實戰》logistic迴歸:關於’此處略去了一個簡單的數學推導‘的個人理解
正在看《機器學習實戰》這本書的朋友,在看到logistic迴歸的地方,可能會對P78頁的梯度上升演算法程式碼以及P79這裡的這句話弄的一頭霧水:“此處略去了一個簡單的數學推導,我把它留給有興趣的讀者”。這句話就是針對下面這段我貼出來的程式碼中的gradAscen
機器學習實戰—第9章:樹迴歸 程式程式碼中的小錯誤
提示:本人程式碼執行在Python3的環境下 1、程式清單9-1: 應改為: list(map(float, curLine)) 解釋:map()返回結果是一個Iterator,Iterator是惰性序列,因此通過list()函式讓它把整個序列都計算出來並返回
機器學習實戰—第5章:Logistic迴歸中程式清單5-1中的數學推導
如圖中梯度上升法給出的函式程式碼。 假設函式為: 1、梯度上升演算法(引數極大似然估計值): 通過檢視《統計學習方法》中的模型引數估計,分類結果為類別0和類別1的概率分別為: 則似然函式為: 對數似然函式為: 最大似然估計求使得對數似然函式取最大值時的引數
【機器學習實戰—第4章:基於概率論的分類方法:樸素貝葉斯】程式碼報錯(python3)
1、報錯:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xae in position 199: illegal multibyte sequence 原因:這是檔案編碼的問題,檔案中有非法的多位元組字元。 解決辦法:開啟Ch04\
《機器學習實戰》(1)kNN小結(小白教學,每行程式碼都有註釋)
最近入坑了機器學習,為了快速提高自己的機器學習的程式碼能力,入坑了《機器學習實戰》,目前只學習了第一個重要演算法:k近鄰演算法(kNN),在學習過程中發現許多相關的學習資料要麼程式碼是python2的,要麼程式碼的解釋不夠詳細,對於像我這樣的菜雞而言苦不堪言,為了後來者不踩我
機器學習實戰(6):SVM-SMO-核函式 手寫識別
SVM判斷模型只與支援向量有關: # coding=utf-8 #Created on Nov 4, 2010 #Chapter 5 source file for Machine Learing in Action #@author: Peter ##########
機器學習公開課筆記(1):機器學習簡介及一元線性迴歸
初步介紹 監督式學習: 給定資料集並且知道其正確的輸出應該是怎麼樣的,即有反饋(feedback),分為 迴歸 (Regressioin): map輸入到連續的輸出值。 分類 (Classification):map輸出到離散的輸出值。 非監督式學習: 給定資料集,並不知道其正確的輸出是什麼,
【機器學習實戰】第1章 機器學習基礎
第1章 機器學習基礎機器學習 概述機器學習就是把無序的資料轉換成有用的資訊。獲取海量的資料從海量資料中獲取有用的資訊我們會利用計算機來彰顯資料背後的真實含義,這才是機器學習的意義。機器學習 場景例如:
《機器學習實戰》第二章:k-近鄰演算法(3)手寫數字識別
這是k-近鄰演算法的最後一個例子——手寫數字識別! 怎樣?是不是聽起來很高大上? 呵呵。然而這跟影象識別沒有半毛錢的關係 因為每個資料樣本並不是手寫數字的圖片,而是有由0和1組成的文字檔案,就像這樣: 嗯,這個資料集中的每一個樣本用圖形軟體處理過,變成了寬高
《機器學習實戰》第二章:k-近鄰演算法(1)簡單KNN
收拾下心情,繼續上路。 最近開始看Peter Harrington的《Machine Learning in Action》... 的中文版《機器學習實戰》。準備在部落格裡面記錄些筆記。 這本書附帶的程式碼和資料及可以在這裡找到。 這本書裡程式碼基本是用python寫的
《機器學習實戰》第二章:k-近鄰演算法(2)約會物件分類
這是KNN的一個新例子。 在一個約會網站裡,每個約會物件有三個特徵: (1)每年獲得的飛行常客里程數(額...這個用來判斷你是不是成功人士?) (2)玩視訊遊戲所耗時間百分比(額...這個用來判斷你是不是肥宅?) (3)每週消費的冰激凌公升數(額...這個是何用意我真不知道
機器學習工作流程第一步:如何用Python做數據準備?
pandas 整數 情況 意思 編程練習 人工智能 簡單的 準備工作 標題 這篇的內容是一系列針對在Python中從零開始運用機器學習能力工作流的輔導第一部分,覆蓋了從小組開始的算法編程和其他相關工具。最終會成為一套手工制成的機器語言工作包。這次的內容會首先從數據準備開始。
python機器學習實戰(三)
方法 baidu classes getter 全部 ken array數組 app 產生 python機器學習實戰(三) 版權聲明:本文為博主原創文章,轉載請指明轉載地址 www.cnblogs.com/fydeblog/p/7277205.html 前言 這篇博客是
【機器學習實戰】第13章 利用 PCA 來簡化數據
light nan 文本 com axis 均值 ... cati 二維空間 第13章 利用 PCA 來簡化數據 降維技術 場景 我們正通過電視觀看體育比賽,在電視的顯示器上有一個球。 顯示器大概包含了100萬像素點,而球則可能是由較少的像素點組成,例如說一千個像素