寂寂花时闭院门,美人相并立琼轩。

大家好,我是我是Python进阶者。

一、前言

前几天Python铂金有个叫【Lee】的粉丝问了一个数据分析的问题,这里拿出来给大家分享下。


盘点一道使用pandas.merge()和pandas.join()函数实战应用题目_人工智能

现在的问题是:如何实现这里面老师所对应的国家呢?想要利用Python作数据分析,想了解来自美国的老师有多少个,怎么实现?针对这个demo,一开始我想的也比较简单,只需要统计其中国家的数量即可。


但是问题来了,如下图所示:


那么再用我的那个想法,就有点那个了!下面一起来看看Python是如何处理的吧。

二、实现过程

这里【🌑(这是月亮的背面)】大佬给出了两个解决方法,第一个是merge()方法,另外一个是join()方法。

方法一:merge()函数

代码如下:


盘点一道使用pandas.merge()和pandas.join()函数实战应用题目_人工智能_02

可以看到顺利的满足了粉丝的要求

import pandas as pd
data1 = {"学校": ['哈佛', 'MIT', '清华', '早稻田'], "国家":['美国', '美国', '中国', '日本']}
data2 = {"学校": ['哈佛', 'MIT', 'MIT', '清华', '清华', '早稻田'],
    "老师": ['John', 'Mike', 'Jason', '李明', '韩磊', '武田康福']}

data1 = pd.DataFrame(data1)
data2 = pd.DataFrame(data2)

print(data1)
print(data2)

data2.merge(data1, how='left').value_counts('国家')
print(data2.merge(data1, how='left').value_counts('国家'))
print(data2.merge(data1, how='left'))

不过这还不够,粉丝后来又提需求了,如下所示:


不慌,直接将value_counts()函数去掉即可,如下:


盘点一道使用pandas.merge()和pandas.join()函数实战应用题目_编程语言_03

如此,完美的满足了粉丝的需求:


盘点一道使用pandas.merge()和pandas.join()函数实战应用题目_人工智能_04

方法二:join()

代码如下:


盘点一道使用pandas.merge()和pandas.join()函数实战应用题目_编程语言_05

join原来是用index做key连接的,这样也是可以满足粉丝的需求的。

总结

大家好,我是Python进阶者。这篇文章基于粉丝提问,在实际工作中运用Python工具实现了数据批量分组的问题,在实现过程中,巧妙的运用了pandas.merge()函数和pandas.join()函数,顺利的帮助粉丝解决了问题,加深了对该函数的认识。


盘点一道使用pandas.merge()和pandas.join()函数实战应用题目_人工智能_06