K-近鄰11-案例2：預測facebook簽到位置

阿新 • • 發佈：2021-09-13

1 專案描述

背景：Facebook建立了一個虛擬世界，其中包括10公里*10公里共100平方公里的約10萬個地方。對於給定的座標集，您的任務將根據使用者的位置，準確性和時間戳等預測使用者下一次的簽到位置。資料被製作成類似於來自移動裝置的位置資料。
目標：預測一個人將要簽到的地方

2 資料集介紹

檔案說明 train.csv, test.csv
  row id：簽入事件的id
  x y：座標
  accuracy: 準確度，定位精度
  time: 時間戳
  place_id: 簽到的位置，這也是你需要預測的內容

官網：https://www.kaggle.com/navoshta/grid-knn/data

3 步驟分析

具體步驟：

# 1.獲取資料集
# 2.基本資料處理
# 2.1 縮小資料範圍 DataFrame.query()
# 2.2 選取有用的時間特徵
# 2.3 去掉簽到較少的地方
# 2.4 確定特徵值和目標值
# 2.5 分割資料集
# 3.特徵工程 -- 特徵預處理(標準化)
# 4.機器學習 -- knn+cv (K近鄰+交叉驗證)
# 5.模型評估

4 程式碼實現

1.獲取資料集

import pandas as pd
from sklearn.model_selection import train_test_split,GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

facebook=pd.read_csv("./data/FBlocation/train.csv")

2.基本資料處理

# 2.基本資料處理
# 2.1 縮小資料範圍
facebook_data = facebook.query("x>8.0 & x<8.5 & y>8.0 & y<8.5")
# 2.2 選擇時間特徵
# 脫敏資料，unit單位設為s時間就正常了
time = pd.to_datetime(facebook_data["time"], unit="s")
time = pd.DatetimeIndex(time)#該條語句處理後就可以直接使用time.hour
facebook_data["day"] = time.day
facebook_data["hour"] = time.hour
facebook_data["weekday"] = time.weekday
# 2.3 去掉簽到較少的地方
place_count = facebook_data.groupby("place_id").count()
place_count = place_count[place_count["row_id"]>3]
facebook_data = facebook_data[facebook_data["place_id"].isin(place_count.index)]
# 2.4 確定特徵值和目標值
x = facebook_data[["x", "y", "accuracy", "day", "hour", "weekday"]]
y = facebook_data["place_id"]
# 2.5 分割資料集
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=22)

3.特徵工程--特徵預處理(標準化)

# 3.特徵工程--特徵預處理(標準化)
# 3.1 例項化一個轉換器
transfer = StandardScaler()
# 3.2 呼叫fit_transform
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)

4.機器學習--knn+cv

# 4.機器學習--knn+cv
# 4.1 例項化一個估計器
estimator = KNeighborsClassifier()
# 4.2 呼叫gridsearchCV
param_grid = {"n_neighbors": [3, 5, 7, 9]}
# n_jobs表示用多少個CPU,-1表示所有CPU
estimator = GridSearchCV(estimator, param_grid=param_grid, cv=5, n_jobs=4)

# 4.3 模型訓練
estimator.fit(x_train, y_train)

5.模型評估

# 5.模型評估
# 5.1 基本評估方式
score = estimator.score(x_test, y_test)
print("最後預測的準確率為:\n", score)

y_predict = estimator.predict(x_test)
print("最後的預測值為:\n", y_predict)
print("預測值和真實值的對比情況:\n", y_predict == y_test)

# 5.2 使用交叉驗證後的評估方式
print("在交叉驗證中驗證的最好結果:\n", estimator.best_score_)
print("最好的引數模型:\n", estimator.best_estimator_)
print("每次交叉驗證後的驗證集準確率結果和訓練集準確率結果:\n",estimator.cv_results_)

6.結果

K-近鄰11-案例2：預測facebook簽到位置

1 專案描述背景：Facebook建立了一個虛擬世界，其中包括10公里*10公里共100平方公里的約10萬個地方。對於給定的座標集，您的任務將根據使用者的位置，準確性和時間戳等預測使用者下一次的簽到位置。資料被製作成

k近鄰7-案例：鳶尾花種類預測—流程實現

1 資料集 2 方法 sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm=\'auto\') algorithm（auto,ball_tree, kd_tree, brute） -- 選擇什麼樣的演算法進行計算

前端05-CSS-案例2：新聞頁面

<!DOCTYPE html> <html lang=\"en\"> <head> <meta charset=\"UTF-8\"> <meta name=\"viewport\" content=\"width=device-width, initial-scale=1.0\">

iPhone 13/Pro 釋出後，蘋果官網下架 iPhone 12 Pro/Max，繼續銷售 iPhone 12/mini/11/SE 2：3299 元起

9 月 15 日訊息蘋果今日凌晨正式釋出了iPhone 13系列手機，包括iPhone 13 mini、iPhone13、iPhone 13 Pro、iPhone 13 Pro Max四款機型，售價 5199 元起。隨著 iPhone 13 系列的推出，蘋果完善了其 iPhone 陣容，官網

5 K-近鄰演算法實現鳶尾花種類預測

1 再識K-近鄰演算法API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm=\'auto\') n_neighbors：

【協程】13、案例2：非同步操作mysql

示例1： # -*- coding: utf-8 -*- import aiomysql import asyncio async def test_mysql(): # 網路IO操作，連線MySQL

2.3測試演算法：使用k-近鄰演算法識別手寫數字

1 #將每個32*32影象陣列轉為1*1024特徵值陣列 2 def img2vector(filename): 3returnVect = zeros((1,1024))#初始化returnVect為1行1024列的全零陣列

機器學習：K近鄰演算法（KNN）

K近鄰演算法（KNN，K-NearestNeighbor）是機器學習或資料分析中最基礎、也是最簡單的演算法之一，這個演算法的思路就如同它字面上的意思“K個最近的鄰居”，想要得到某個樣本的某個特徵的值（一個樣本通常有多個特徵

1.2.2 - 案例103：多執行緒模擬晚餐

Java：典例Coding 1.2.2 - 多執行緒模擬晚餐（CountDownLatch類）要求實現（次序隨機）：

1.2.1 - 案例102：多執行緒漢堡店

Java Coding 1.2.1 - 多執行緒漢堡店（執行緒安全+等待喚醒+生產者/消費者）要求控制檯輸出：

2.2案例實現：仿win計算器

技術標籤：網頁搭建htmlcssjs ************************************************************ *名稱：仿windows計算器 *功能： * 1、實現單擊按鈕錄入數字 * 2、實現基礎四則運算功能，並新增必要的異常處理，例

基礎學習：瞭解 K近鄰理論

技術標籤：機器學習機器學習演算法（三）：K近鄰(k-nearest neighbors)初探 1 KNN的介紹和應用

Task03：K近鄰的實踐1--阿里雲天池

技術標籤：機器學習分類鳶尾花圖片： #Demo來自sklearn官網 import numpy as np import matplotlib.pyplot as plt

一加 7Pro 氧 OS 11 Beta 2 更新：將帶來息屏顯示功能

2月7日訊息數週前，一加為旗下的一加 7 和一加 7 Pro 推送了第一個氧 OS 11 Beta 版本，但該測試版缺少一些使用者很必要的功能，比如息屏顯示功能。

諾基亞 3.2 開始推送安卓 11 系統更新：手機配驍龍 429，2GB/3GB 記憶體

3月25日訊息外媒 9to5 Google 報道，諾基亞手機已經確認，Android 11 更新現在開始為價格實惠的諾基亞 3.2 推出。

搭載 HarmonyOS 2：華為 WATCH 3 系列 11 日零點開售，2599 起

6 月 10 日訊息華為 WATCH 3 系列智慧手錶於 6 月 2 日釋出，是該系列的第三代產品。手錶包含標準版以及 Pro 版，升級了健康管理功能，搭載鴻蒙 HarmonyOS 2 系統，將於 6 月 11 日零點開售。

華為 MatePad 11 官宣：7 月 6 日釋出，搭載鴻蒙 HarmonyOS 2

7 月 5 日訊息華為終端官方微博剛剛宣佈，將於 7 月 6 日 19:30 釋出華為 MatePad 11 平板電腦，該平板電腦搭載鴻蒙 HarmonyOS 2 作業系統。

一加 6/6T 手機推送 OxygenOS 11 Beta 2 開放測試版：優化過熱控制管理等

7 月 31 日訊息一加現在正在向一加 6 和一加 6T 智慧手機推送 OxygenOS 11 Open Beta 2 更新。新的更新不包括新的功能，但包含了對無法儲存捕獲影象的問題修復，系統穩定性改進，優化過熱控制管理，增強 5G Wi-Fi 的

《暗黑破壞神2：重製版》德魯伊11分鐘實機演示

今日(8月16日)外媒IGN公佈了《暗黑破壞神2：重製版》11分鐘實機演示，展示了使用德魯伊遊玩時的畫面以及玩法，一起來欣賞下視訊吧！

《邪惡天才2：世界統治》11月30日登陸主機惡人主角基建遊戲

開發商Rebellion宣佈基地建設遊戲《邪惡天才2：世界統治》將於11月30日發售，登陸PS4、PS5、Xbox One、XSX/S平臺。此外，遊戲還將加入XGP，時間未知。《邪惡天才2：世界統治》已於今年3月份登陸Steam。

K-近鄰11-案例2：預測facebook簽到位置

1 專案描述

2 資料集介紹

3 步驟分析

4 程式碼實現

相關推薦