K-Nearest Neighbors近鄰演算法(KNN)
阿新 • • 發佈:2018-12-12
通過KNN演算法計算唐人街探案是哪個型別的電影
import pandas as pd # 取出列表中出現次數最多的字元 def max_list(lt): temp = 0 for i in lt: if lt.count(i) > temp: max_str = i temp = lt.count(i) return max_str def fun(x, y, z, company, n): list = [] new_list = [] type = [] for i in range(len(company)): # 得到歐式距離 dis = ((company.iloc[i, 0] - x) ** 2 + (company.iloc[i, 1] - y) ** 2 + (company.iloc[i, 2] - z) ** 2) ** 0.5 # 將歐式距離全部放到list裡面 list.append(dis) # 排序得到list_ list_ = sorted(list) # 排序後將前n個放入new_list 中 for i in range(n): new_list.append(list_[i]) # 通過對於的值在list裡面找下標,然後再求出電影的型別 for i in range(n): type.append(company.iloc[list.index(new_list[i]), 3]) # 將得到的型別列表呼叫方法max_list max_str = max_list(type) print(type) return max_str # 讀取檔案獲得陣列 company = pd.read_excel(r"C:\Users\Administrator\Desktop\電影分類資料.xlsx", encoding="gbk") # 除去名字叫電影名稱和序號的兩列 company.drop(labels=['電影名稱', '序號'], axis=1, inplace=True) print(fun(23, 3, 17, company, 5))