Python应用实战-Clumper库 | 常用的数据操作函数
生活随笔
收集整理的這篇文章主要介紹了
Python应用实战-Clumper库 | 常用的数据操作函数
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
Keep
keep函數(shù)可以從原始數(shù)據(jù)中抽取符合指定條件的子集。
from?clumper?import?Clumperlist_dicts?=?[{'a':?1},?{'a':?2},?{'a':?3},?{'a':?4}](Clumper(list_dicts).keep(lambda?d:?d['a']?>=?3).collect()??#試一試去掉.collect()后的效果 ) [{'a': 3}, {'a': 4}]可以實現(xiàn)缺失值處理,以不同的方式實現(xiàn)pandas的.dropna()的功能。
from?clumper?import?Clumperdata?=?[{"a":?1,?"b":?4},{"a":?2,?"b":?3},{"a":?3,?"b":?2},{"a":?4}, ]#只保留含有b的字段 (Clumper(data).keep(lambda?d:?'b'?in?d.keys()).collect() ) [{'a': 1, 'b': 4}, {'a': 2, 'b': 3}, {'a': 3, 'b': 2}]Mutate
mutate可以在每條記錄中,創(chuàng)建新字段、改寫舊字段。
from?clumper?import?Clumperlist_dicts?=?[{'a':?1,?'b':?2},{'a':?2,?'b':?3,?'c':4},{'a':?1,?'b':?6}]#新建了c和s字段 (Clumper(list_dicts).mutate(c=lambda?d:?d['a']?+?d['b'],s=lambda?d:?d['a']?+?d['b']?+?d['c']).collect() ) [{'a': 1, 'b': 2, 'c': 3, 's': 6},{'a': 2, 'b': 3, 'c': 5, 's': 10},{'a': 1, 'b': 6, 'c': 7, 's': 14}]Sort
sort可以實現(xiàn)排序?
from?clumper?import?Clumperlist_dicts?=?[{'a':?1,?'b':?2},{'a':?3,?'b':?3},{'a':?2,?'b':?1}](Clumper(list_dicts).sort(lambda?d:?d['b'])?#默認(rèn)升序.collect() ) [{'a': 2, 'b': 1}, {'a': 1, 'b': 2}, {'a': 3, 'b': 3}]Select
select挑選每條記錄中的某個(些)字段?
from?clumper?import?Clumperlist_dicts?=?[{'a':?1,?'b':?2},{'a':?2,?'b':?3,?'c':4},{'a':?1,?'b':?6}](Clumper(list_dicts).select('a').collect() ) [{'a': 1}, {'a': 2}, {'a': 1}]Drop
剔除某個(些)字段。
from?clumper?import?Clumperlist_dicts?=?[{'a':?1,?'b':?2},{'a':?2,?'b':?3,?'c':4},{'a':?1,?'b':?6}](Clumper(list_dicts).drop('c').collect() ) [{'a': 1, 'b': 2}, {'a': 2, 'b': 3}, {'a': 1, 'b': 6}]GroupBy
根據(jù)某個(些)字段對數(shù)據(jù)集進(jìn)行分組,得到不同Group類的集合。一般與.agg()方法聯(lián)合使用。
from?clumper?import?Clumpergrade_dicts?=?[{'gender':?'男',?'grade':?98,?'name':?'張三'},{'gender':?'女',?'grade':?88,?'name':?'王五'},{'gender':?'女',?'grade':?99,?'name':?'趙六'},{'gender':?'男',?'grade':?58,?'name':?'李四'}](Clumper(grade_dicts).group_by("gender").groups==('gender',?) ) TrueUngroup
GroupBy的反操作
from?clumper?import?Clumpergrade_dicts?=?[{'gender':?'男',?'grade':?98,?'name':?'張三'},{'gender':?'女',?'grade':?88,?'name':?'王五'},{'gender':?'女',?'grade':?99,?'name':?'趙六'},{'gender':?'男',?'grade':?58,?'name':?'李四'}](Clumper(grade_dicts).group_by("gender").ungroup().groups?==?tuple() ) True總結(jié)
以上是生活随笔為你收集整理的Python应用实战-Clumper库 | 常用的数据操作函数的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python应用实战-Clumper库
- 下一篇: Python应用实战-Clumper |