谜语
猜谜语
正文> > >

从洞末了尾学Python--pandas(数据框片断03)

时间:2018-09-24 12:29 作者:admin 编辑:admin 浏览次数:

  原题目:从洞末了尾学Python--pandas(数据框片断03)

  上壹期我们运用pandas模块完成不雅察看的选择、变量的重命名、数据典型的更换、排前言、重骈不雅察看的删摒除、和数据集儿子的吧嗒样,此雕刻期我们持续伸见pandas模块的其他新交识点。带拥有频数统计、缺违反值处理、数据映照、数据汇尽。

  壹、频数统计

  我们以被考查用户的顶出产数据为例,到来谈谈频数统计函数value_counts。

  

  频数统计,望文生义坚硬是统计某个团弄圆变量各程度的频次。

  

  此雕刻边统计的是性佩男女的人数,是壹个对立值,假设想进壹步检查男女的佰分比例,却以经度过下面的方法完成:

  

  而在R言语中,table函数坚硬是宗到频数统计的干用,佩的还供了更其敏捷的prop.table函数,却以直接寻求出产比例。

  

  如上是单变量的频数统计,假设需寻求统计两个团弄圆变量的提交叉统计表,该何以完成?不急,pandas模块供了crosstab函数,我们到来看看其用法:

  

  R言语的话,任然运用table函数即却。

  

  二、缺违反值处理

  在数据剖析或建模经过中,我们期望数据集儿子是皓净的,没拥有拥有缺违反、非日之类,但面对的还愿情景确次数据集儿子很贼脏,比如关于缺违反值我们该如哪男理?普畅通情景,缺违反值却以经度过删摒除或替补养的方法到来处理。比值先是要监控每个变量能否存放在缺违反,缺违反的比比何以?此雕刻边我们借助于pandas模块中的isnull函数、dropna函数和fillna函数。

  比值先,我们顺手工捏合壹个含缺违反值的数据框:

  

  其次,运用isnull函数反节数据集儿子的缺违反情景:

  

  最末,对缺违反数据终止处理:

  删摒除法

  dropna函数,拥有两种删摒除花样,壹种是对含拥有缺违反的行(恣意壹列)终止删摒除,另壹种是删摒除那些全是缺违反(所拥有列)的行,详细如次:

  

  

  鉴于df数据集儿子不存放内行全为缺违反的不雅察看,故没拥有拥有完成删摒除。

推荐内容
点击排行