热门搜索 :
考研考公

python pandas中describe()各项含义及求值

发布网友 发布时间:2022-04-20 03:07

我来回答

5个回答

热心网友 时间:2022-05-10 07:16

1、在pandas中,我们采用了R语言中的惯用法,即将缺失值表示为NA,它表示不可用not available。

2、pandas项目中还在不断优化内部细节以更好处理缺失数据。

3、过滤掉缺失数据的办法有很多种。可以通过pandas.isnull或布尔索引的手工方法,但dropna可能会更实用一些。对于一个Series,dropna返回一个仅含非空数据和索引值的Series。

4、而对于DataFrame对象,可能希望丢弃全NA或含有NA的行或列。dropna默认丢弃任何含有缺失值的行。

5、最后通过一个常数调用fillna就会将缺失值替换为那个常数值,若是通过一个字典调用fillna,就可以实现对不同的列填充不同的值。这样就完成了。

热心网友 时间:2022-05-10 08:34

python pandas中,对于一维数组,describe会返回一系列参数,count,mean,std,min,25%,50%,75%,max。


针对该问题,对于describe()返回值的解释如下:

1、count:返回数组的个数,如上述为4个元素,所以返回为4;

2、mean:返回数组的平均值,1 3 5 9的平均值为4.5;

3、std:返回数组的标准差;

4、min:返回数组的最小值;

5、25%,50%,75%:返回数组的三个不同百分位置的数值,也就是统计学中的四分位数。首先需要确定三个四分位数的位置,第一个四分位数Q1所在的位置是:(1+4)/4 = 1.25,同理Q2的位置是:(1+4)/4×2 = 2.5,Q3的位置是:(1+4)/4×3 = 3.75,则三个位置所对应的数分别为:

    1×0.25+3×0.75=2.5

    3×0.5+5×0.5 = 4

    5×0.75+9×0.25 = 6

即为函数返回的相应的值,其中50%对应的是中位数。

6、max:返回列表的最大值。

扩展资料:

describe()函数有三个参数可以指定,分别是percentiles, include, exclude,三者的含义如下:

1、percentiles:默认是返回四分位数,即25%,50%和75%,可以修改:describe(percentiles=[.75, 0.8]),则返回的是50%,75%,80%位置的数,可以根据需要进行相应的处理。

2、include:默认只计算数值型特征的统计量,当参数为'all'时,显示所有类型的数据;当参数为numpy.number时,返回的是数值类型的数据;当参数为numpy.object,返回的是object类型的数据;当include=['category']时,返回的是category;当include=['O']时,返回统计的是字符串型的数据。

3、exclude:include可以指定返回类型,而exclude则可以指定不返回某种类型,即返回除指定类型之外的数据。

参考资料来源:python API-describe

参考资料来源:百度百科-四分位数

热心网友 时间:2022-05-10 10:09

python pandas describe 怎么没有描述性统计了
你遇到的问题一看就是少装了包。在windows下安装pandas,只安装pandas一个包显然是不够的,它并没有把用到的相关包都打进去,这点是很麻烦的,只有等错误信息出来后才知道少了哪些包。

我总结了一下,一共需要安装如下包:
pyparsing-2.0.2.win32-py2.7.exe
matplotllib-1.3.1.win32-py2.7.exe
openpyxl-openpyxl-5d2c0c8704d2.tar.gz
setuptools-3.8.1.win32-py2.7.exe
numpy-MKL-1.8.1.win32-py2.7.exe
six-1.7.3.win32-py2.7.exe
python-dateutil-2.2.win32-py2.7.exe

热心网友 时间:2022-05-10 12:00

将数据从小到大排列,处在1/4点和3/4点的数字,类似中位数也就是50%
count 计数, mean 平均值, std 标准差, min 最小值, 25% 下四分位, 50% 中位数, 75% 上四分位, max 最大值

热心网友 时间:2022-05-10 14:08

If you go a quarter way through the list, you'll find a number that is bigger than 25% of the values and smaller than 75% of the values. That is the 25% value (pronounced "25th percentile"). The 50th and 75th percentiles are defined analgously.
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
Top