Pandas之排序函数sort_values()的实现-StartMVC超轻量PHP框架

一、sort_values()函数用途

pandas中的sort_values()函数原理类似于SQL中的order by，可以将数据集依照某个字段中的数据进行排序，该函数即可根据指定列数据也可根据指定行的数据排序。

二、sort_values()函数的具体参数

用法：


DataFrame.sort_values(by=‘##',axis=0,ascending=True, inplace=False, na_position=‘last')

参数说明

参数	说明
by	指定列名(axis=0或'index')或索引值(axis=1或'columns')
axis	若axis=0或'index'，则按照指定列中数据大小排序；若axis=1或'columns'，则按照指定索引中数据大小排序，默认axis=0
ascending	是否按指定列的数组升序排列，默认为True，即升序排列
inplace	是否用排序后的数据集替换原来的数据，默认为False，即不替换
na_position	{‘first',‘last'}，设定缺失值的显示位置

三、sort_values用法举例

创建数据框


#利用字典dict创建数据框
import numpy as np
import pandas as pd
df=pd.DataFrame({'col1':['A','A','B',np.nan,'D','C'],
 'col2':[2,1,9,8,7,7],
 'col3':[0,1,9,4,2,8]
})
print(df)

>>>
 col1 col2 col3
0 A 2 0
1 A 1 1
2 B 9 9
3 NaN 8 4
4 D 7 2
5 C 7 8

依据第一列排序，并将该列空值放在首位


#依据第一列排序，并将该列空值放在首位
print(df.sort_values(by=['col1'],na_position='first'))
>>>
 col1 col2 col3
3 NaN 8 4
0 A 2 0
1 A 1 1
2 B 9 9
5 C 7 8
4 D 7 2

依据第二、三列，数值降序排序


#依据第二、三列，数值降序排序
print(df.sort_values(by=['col2','col3'],ascending=False))
>>>
 col1 col2 col3
2 B 9 9
3 NaN 8 4
5 C 7 8
4 D 7 2
0 A 2 0
1 A 1 1

根据第一列中数值排序，按降序排列，并替换原数据


#根据第一列中数值排序，按降序排列，并替换原数据
df.sort_values(by=['col1'],ascending=False,inplace=True,
 na_position='first')
print(df)
>>>
 col1 col2 col3
3 NaN 8 4
4 D 7 2
5 C 7 8
2 B 9 9
1 A 1 1
0 A 2 0

按照索引值为0的行，即第一行的值来降序排序


x = pd.DataFrame({'x1':[1,2,2,3],'x2':[4,3,2,1],'x3':[3,2,4,1]}) 
print(x)
#按照索引值为0的行，即第一行的值来降序排序
print(x.sort_values(by =0,ascending=False,axis=1))
>>>
 x1 x2 x3
0 1 4 3
1 2 3 2
2 2 2 4
3 3 1 1
 x2 x3 x1
0 4 3 1
1 3 2 2
2 2 4 2
3 1 1 3

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

python

Pandas之排序函数sort_values()的实现

文章分类

相关文章