Numpy, Pandas, 及Python原生的排序方法
阿新 • • 發佈:2018-12-22
在numpy中:
argsort 返回排序後的index,據此可以排序。
#---------一維情形--------------
values=np.random.permutation(10) #產生0到9的一個排列
values
Out[758]: array([6, 7, 0, 9, 5, 2, 4, 3, 8, 1])
indexer=np.argsort(values) #返回排序後的values的index
indexer
Out[761]: array([2, 9, 5, 7, 6, 4, 0, 1, 8, 3], dtype=int64)
values[indexer] #升序排列
Out[762 ]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
values[indexer][::-1] #降序排列
Out[763]: array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])
#----------------二維情形-----------
arr=np.random.randn(20).reshape(4,5)
arr
Out[764]:
array([[ 0.06508931, 0.56513883, 0.62546144, -1.28835261, -2.08906088],
[ 1.5425056 , 0.69033553, 1.60385421, - 1.52568607, -0.41737589],
[-0.91894216, 2.08802511, -0.70341454, -0.08491163, -0.17903858],
[-0.3333518 , -0.49513354, 1.56342694, 0.92744459, 0.48037342]])
arr[:,np.argsort(arr[2])] # 根據第2行從小到大排列
Out[765]:
array([[ 0.06508931, 0.62546144, -2.08906088, -1.28835261, 0.56513883],
[ 1.5425056 , 1.60385421 , -0.41737589, -1.52568607, 0.69033553],
[-0.91894216, -0.70341454, -0.17903858, -0.08491163, 2.08802511],
[-0.3333518 , 1.56342694, 0.48037342, 0.92744459, -0.49513354]])
arr[np.argsort(arr[:,0]),:] # 根據第0列從小到大排列
Out[766]:
array([[-0.91894216, 2.08802511, -0.70341454, -0.08491163, -0.17903858],
[-0.3333518 , -0.49513354, 1.56342694, 0.92744459, 0.48037342],
[ 0.06508931, 0.56513883, 0.62546144, -1.28835261, -2.08906088],
[ 1.5425056 , 0.69033553, 1.60385421, -1.52568607, -0.41737589]])
在pandas中
使用sort_index
或者sort_values
方法,預設在axis=0
上排序(即根據某一列的值得大小排序),可以通過axis=1
變成按某一行排序。by=index
,index為想要排序的列或者行的index。
frame=DataFrame(arr)
frame
frame.sort_index(by=0,ascending=False) # 根據第0列的值進行排序,降序。
Out[767]:
0 1 2 3 4
1 1.542506 0.690336 1.603854 -1.525686 -0.417376
0 0.065089 0.565139 0.625461 -1.288353 -2.089061
3 -0.333352 -0.495134 1.563427 0.927445 0.480373
2 -0.918942 2.088025 -0.703415 -0.084912 -0.179039
frame.sort_values(by=0,ascending=True) # 作用同上,升序。
frame.sort_index(by=0,ascending=False,axis=1) # 根據第0行的值進行排序,降序。
Out[768]:
2 1 0 3 4
0 0.625461 0.565139 0.065089 -1.288353 -2.089061
1 1.603854 0.690336 1.542506 -1.525686 -0.417376
2 -0.703415 2.088025 -0.918942 -0.084912 -0.179039
3 1.563427 -0.495134 -0.333352 0.927445 0.480373
frame.sort_values(by=0,ascending=True,axis=1) # 作用同上,升序。
python自帶的sort方法
a=[3,1,5,4,2]
a.sort() # 預設升序排序
a
Out[776]: [1, 2, 3, 4, 5]
a.sort(reverse=True) #reverse 改變排序方式
a
Out[782]: [5, 4, 3, 2, 1]
sort 直接對原列表進行更改,如果想返回一個副本,而不改變原列表,可以使用sorted方法:
sorted(a)
Out[792]:
[1, 2, 3, 4, 5]