機器學習(Macheine Learning)面試知識點

阿新 • • 發佈：2021-06-17

關注我的公眾號【寶哥大資料】

零、數學基礎

一、探索資料

1.1、資料質量分析

缺失值、異常值、不一致的資料、錯誤資料
資料預處理

1.2、特徵工程

1.2.1、資料特徵分析

1.2.2、歸一化、標準化、正則化

1.2.3、特徵提取、轉換和選擇

降維
- 特徵提取：通過屬性間的關係，如組合不同的屬性得到新的屬性，這樣就改變了原來的特徵空間
- 特徵選擇：從原始特徵資料集中選擇出子集，是一種包含的關係，沒有更改原始的特徵空間
特徵轉換

1.3、模型

1.3.1、模型的選擇、調優

1.3.2、模型的評估

1.4、資料視覺化

1.5、Spark ML

二、概念、理論、

機器學習的理論框架

機器學習概念,公式總結

2.1、統計方法三要素:模型+策略+演算法

2.2、判別模型與生成模型

2.3、損失函式、代價函式與目標函式

2.3、核函式

三、監督學習

監督學習中，如果預測的變數是離散的，我們稱其為分類（如決策樹，支援向量機等），如果預測的變數是連續的，我們稱其為迴歸

3.1、分類

3.1.1、分類的原理

3.1.2、Spark ML 構建分類模型

3.2、迴歸

3.2.1、 linear regression(線性迴歸)

線性迴歸python實現

 - 標準線性迴歸
 - 區域性加權線性迴歸
 - 縮減法
 	- 嶺迴歸
 	- lasso
 	- 前向逐步迴歸

3.2.2、廣義線性迴歸

3.2.3、樹迴歸

3.2.4、隨機森林迴歸

3.2.5、梯度提高樹迴歸(Gradient-boosted tree regression)

3.2.6、生存迴歸（Survival regression）

3.2.7、保序迴歸

3.2.8、Spark ML 構建迴歸模型

3.3、決策樹

python實現
Ensembles of decision trees
- random forests
- gradient-boosted trees
Isotonic regression

Linear models

四、非監督學習

根據給定已知類別標籤

的樣本，訓練出某種模型，然後對未知類別的樣本進行分類，稱為supervised learning（監督學習）。
指事先並不知道樣本的類別標籤，希望通過某種演算法來把未知類別的樣本劃分成若干類，亦稱作 unsupervised learning （無監督學習）。

4.1、聚類

4.1.1、基於劃分

4.1.1.1、k-means

效果衡量方法
- SSE, 肘部法、輪廓係數法
k-means的改進
K-Menas處理的經驗
- 列舉特徵
- 長尾特徵對特徵取log

4.1.2、層次聚類

4.1.3、基於密度聚類

4.1.3.1、Gaussian Mixture Model(GMM)

4.1.3.2、DBSCAN

4.1.3.3、Mean Shift(均值漂移)

4.1.4、基於網格

4.1.5、基於模型的方法（Model-based methods）

4.2、Apriori

4.2.1、Apriori概念及原理

4.3、FP-Growth

4.3.1、FP-Growth概念及原理

六、深度學習

深度學習與機器學習的關係

七、應用

6.1、推薦系統

八、知識點

8.1、百面機器學習，學習筆記

8.2、轉自光影流年925部落格

機器學習(Macheine Learning)面試知識點

關注我的公眾號【寶哥大資料】零、數學基礎一、探索資料 1.1、資料質量分析

【機器學習 Azure Machine Learning】Azure Machine Learning 訪問SQL Server 無法寫入問題 (使用微軟Python AML Core SDK）

問題情形使用Python SDK在連線到資料庫後，連線資料庫獲取資料成功，但是在Pandas中用 to_sql 反寫會資料庫時候報錯。錯誤資訊為：ProgrammingError: (\'42000\', \"[42000] [Microsoft][SQL Server Native Client

【機器學習 Azure Machine Learning】使用Aure虛擬機器搭建Jupyter notebook環境，為Machine Learning做準備(Ubuntu 18.04，Linux)

問題描述在Azure的VM中已經安裝好Jupyter，並且通過jupyter notebook --port 9999 已經啟動，但是通過本機瀏覽器，訪問VM的公網IP，則始終是不能訪問的錯誤。(This site can’t be reached)

【機器學習 Azure Machine Learning】使用VS Code登入到Linux VM上 (Remote-SSH)

問題描述在平常的工作習慣中，如果使用VS Code做指令碼的開發，是一個非常好用的工具，現在也可以通過VS Code的不同方式來連線到Linux VM中(ssh), 第一種是VS Code的Terminal中通過powershell視窗使用ssh命令登入。

機器學習筆記19(unspervised learning -> Word Embedding)

unspervised learning -> Word Embedding 簡單來說，目的就是將文字資訊進行編碼，變為及其可以識別的向量

機器學習五：Deep Learning深度學習1

前情提要由邏輯迴歸演算法我們引出了深度學習，請參考https://blog.csdn.net/weixin_42744909/article/details/108954890

ml-6-1-應用機器學習的建議Advice for Applying Machine Learning

應用機器學習的建議Advice for Applying Machine Learning Deciding What to Try Next 具體來講，我將重點關注的問題是假如你在開發一個機器學習系統，或者想試著改進一個機器學習系統的效能，你應如何決定

機器學習類條件隨機標籤噪聲情況下的二分類問題研究復現NIPS論文learning with noisy label（logistic & C-SVM）

論文百度網盤連結：https://pan.baidu.com/s/1XWj1YInZCuKldRpYnZTttg 密碼：u4lb UCI資料可以在論文中給的一個URL中找到，如找不到也可聯絡QQ1551904915獲取。

機器學習演算法-邏輯迴歸（三）、邏輯迴歸分類重要知識點總結

技術標籤：邏輯迴歸機器學習邏輯迴歸原理簡介： Logistic迴歸雖然名字裡帶“迴歸”，但是它實際上是一種分類方法，主要用於兩分類問題（即輸出只有兩種，分別代表兩個類別），所以利用了Logistic函式（或稱為S

李巨集毅機器學習課程——Lifelong learning學習筆記

概述 lifelong learning非常直觀，意思是機器不能前邊學後邊忘。常見的方法是對前邊的task中學習出來的引數加一個保護係數，在後面的任務中，訓練引數時，對保護係數大的引數很難訓練，而保護係數小的引數則容易一

機器學習 | 詳解GBDT梯度提升樹原理，看完再也不怕面試了

今天是機器學習專題的第30篇文章，我們今天來聊一個機器學習時代可以說是最厲害的模型——GBDT。

機器學習和深度學習知識路線及知識點總結

資料預處理 1、深度學習中的資料預處理有哪些方式？ 1、資料歸一化。包括高斯歸一化、最大最小值歸一化等。

六萬字總結機器學習面試問題

因為本文實在是總結得太好了，本著尊重作者的態度給出原文連結：https://zhuanlan.zhihu.com/p/429901476

【MindSpore:跟著小Mi一起機器學習吧！】那些我們快要遺忘的線性代數知識點

一週未見，動力不減！小Mi又帶著知識點和大家見面啦！（敲黑板~）上週小Mi帶著大家簡單地學習了機器學習的概念，還有其常見的兩個大類，監督學習和無監督學習，這次小Mi決定跟大家一起復習下機器學習中常用的線性代

深度學習面試知識點總結

一.前向神經網路深度前饋網路（Deep Feedforward Networks）是一種典型的深度學習模型。其目標為擬合某個函式f，即定義對映y=f (x;θ)將輸入x轉化為某種預測的輸出y，並同時學習網路引數θ的值，使模型得到最優

【機器學習】我在面試機器學習、大資料崗位時遇到的各種問題

自己的專業方向是機器學習、資料探勘，就業意向是網際網路行業與本專業相關的工作崗位。各個企業對這類崗位的命名可能有所不同，比如資料探勘/自然語言處理/機器學習演算法工程師，或簡稱演算法工程師，還有的稱為搜

面試機器學習、大資料崗位時遇到的各種問題

後端面試知識點大串燒!(螞蟻美團頭條騰訊面試經歷)

更多Java面試資料(作業系統,網路,zk,mq,redis,java等) :github.com/yuhaqiang12… 筆者在面過猿輔導,去哪兒,曠視,陌陌,頭條,阿里,快手,美團,騰訊之後,除了收穫一大堆面試問題,還思考到如何成為面試官眼中的\"愛技術

[JAVA]面試知識點整理

1. 背景介紹 Java 語言對我來說即熟悉又陌生的語言，原來是特別喜歡Java，就覺得它是世界最好的語言。設計的規範非常好，程式碼看起來非常完整，還有巨大的元件/jar庫。總之來說是非常強大。隨著幾年沒有接觸過它

python機器學習實現決策樹

本文例項為大家分享了python機器學習實現決策樹的具體程式碼，供大家參考，具體內容如下

機器學習(Macheine Learning)面試知識點

關注我的公眾號【寶哥大資料】

零、數學基礎

一、 探索資料

1.1、資料質量分析

1.2、特徵工程

1.2.1、資料特徵分析

1.2.2、歸一化、標準化、正則化

1.2.3、特徵提取、轉換和選擇

1.3、模型

1.3.1、模型的選擇、調優

1.3.2、模型的評估

1.4、資料視覺化

1.5、Spark ML

二、 概念、理論、

2.1、統計方法三要素:模型+策略+演算法

2.2、判別模型與生成模型

2.3、損失函式、代價函式與目標函式

2.3、核函式

三、監督學習

3.1、分類

3.1.1、分類的原理

3.1.2、Spark ML 構建分類模型

3.2、迴歸

3.2.1、 linear regression(線性迴歸)

3.2.2、廣義線性迴歸

3.2.3、樹迴歸

3.2.4、隨機森林迴歸

3.2.5、梯度提高樹迴歸(Gradient-boosted tree regression)

3.2.6、生存迴歸（Survival regression）

3.2.7、保序迴歸

3.2.8、Spark ML 構建迴歸模型

3.3、決策樹

Linear models

四、非監督學習

4.1、聚類

4.1.1、基於劃分

4.1.1.1、k-means

4.1.2、層次聚類

4.1.3、基於密度聚類

4.1.3.1、Gaussian Mixture Model(GMM)

4.1.3.2、DBSCAN

4.1.3.3、Mean Shift(均值漂移)

4.1.4、基於網格

4.1.5、基於模型的方法（Model-based methods）

4.2、Apriori

4.2.1、Apriori概念及原理

4.3、FP-Growth

4.3.1、FP-Growth概念及原理

六、 深度學習

深度學習與機器學習的關係

七、應用

6.1、推薦系統

八、知識點

8.1、百面機器學習，學習筆記

8.2、轉自光影流年925部落格

相關推薦

一、探索資料

二、概念、理論、

六、深度學習