Get rows based on distinct values from one column(根据一列中的不同值获取行)
问题描述
如何在COL2
中按不同值获取行?
例如,我有以下数据帧:
COL1 COL2
a.com 22
b.com 45
c.com 34
e.com 45
f.com 56
g.com 22
h.com 45
我想根据COL2
:
COL1 COL2
a.com 22
b.com 45
c.com 34
f.com 56
那么,我如何才能做到这一点?如果有人能帮上忙,我将不胜感激。
推荐答案
使用drop_duplicates
指定列COL2
检查重复项:
df = df.drop_duplicates('COL2')
#same as
#df = df.drop_duplicates('COL2', keep='first')
print (df)
COL1 COL2
0 a.com 22
1 b.com 45
2 c.com 34
4 f.com 56
您也可以只保留最后一个值:
df = df.drop_duplicates('COL2', keep='last')
print (df)
COL1 COL2
2 c.com 34
4 f.com 56
5 g.com 22
6 h.com 45
或删除所有重复项:
df = df.drop_duplicates('COL2', keep=False)
print (df)
COL1 COL2
2 c.com 34
4 f.com 56
这篇关于根据一列中的不同值获取行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!