1. 程式人生 > >python大資料分析——資料規範化

python大資料分析——資料規範化

(1)最小-最大規範化

x*=(x-min)/(max-min)

  (2)零-均值規範化

x*=(x-x的平均值)/標準差

這是當前用得最多的資料標準化方法

(3)小數定標規範化

x*=x/10的K次方

 

程式碼實現

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

datafile='D:/Code/Need/normalization_data.xls'
data=pd.read_excel(datafile,header=None)

data_nor=(data-data.min())/(data.max()-data.min())
print(data_nor)

data_nor=(data-data.mean())/(data.std())
print(data_nor)

data_nor=data/10**(np.ceil(np.log10(data.max())))#用.ceil()方法取資料中最大值對於10的對數的整數部分
print(data_nor)