今
日
鸡
汤
寂寂花时闭院门,美人相并立琼轩。
大家好,我是我是Python进阶者。
一、前言
前几天Python铂金有个叫【Lee】的粉丝问了一个数据分析的问题,这里拿出来给大家分享下。
现在的问题是:如何实现这里面老师所对应的国家呢?想要利用Python作数据分析,想了解来自美国的老师有多少个,怎么实现?针对这个demo,一开始我想的也比较简单,只需要统计其中国家的数量即可。
但是问题来了,如下图所示:
那么再用我的那个想法,就有点那个了!下面一起来看看Python是如何处理的吧。
二、实现过程
这里【🌑(这是月亮的背面)】大佬给出了两个解决方法,第一个是merge()方法,另外一个是join()方法。
方法一:merge()函数
代码如下:
可以看到顺利的满足了粉丝的要求
import pandas as pd
data1 = {"学校": ['哈佛', 'MIT', '清华', '早稻田'], "国家":['美国', '美国', '中国', '日本']}
data2 = {"学校": ['哈佛', 'MIT', 'MIT', '清华', '清华', '早稻田'],
"老师": ['John', 'Mike', 'Jason', '李明', '韩磊', '武田康福']}
data1 = pd.DataFrame(data1)
data2 = pd.DataFrame(data2)
print(data1)
print(data2)
data2.merge(data1, how='left').value_counts('国家')
print(data2.merge(data1, how='left').value_counts('国家'))
print(data2.merge(data1, how='left'))
不过这还不够,粉丝后来又提需求了,如下所示:
不慌,直接将value_counts()函数去掉即可,如下:
如此,完美的满足了粉丝的需求:
方法二:join()
代码如下:
join原来是用index做key连接的,这样也是可以满足粉丝的需求的。
总结
大家好,我是Python进阶者。这篇文章基于粉丝提问,在实际工作中运用Python工具实现了数据批量分组的问题,在实现过程中,巧妙的运用了pandas.merge()函数和pandas.join()函数,顺利的帮助粉丝解决了问题,加深了对该函数的认识。