实战篇：盘点Pandas中的factorize()函数妙用

原创

Python进阶者 2022-05-01 23:27:34 ©著作权

©著作权归作者所有：来自51CTO博客作者Python进阶者的原创作品，请联系作者获取转载授权，否则将追究法律责任

大家好，我是皮皮。

一、前言

前几天在Python白银交流群有个叫【蛋蛋】的粉丝问了一个Pandas处理的问题，这里拿出来给大家分享下，一起学习下。

实战篇：盘点Pandas中的factorize()函数妙用_Python库

实战篇：盘点Pandas中的factorize()函数妙用_Python3_02

一开始我都没理解她的意思，以为只是简单的替换而已，之前【月神】给了一个代码，当时也写文章记录了，代码如下：

df['col2'] = df['col1'].map({1:"开心", 2:"悲伤", 3:"难过", 4:"泪目"})
df

实战篇：盘点Pandas中的factorize()函数妙用_Python库_03

不过很不巧，这个不是她想要的结果，她想要的结果是同样的几个都是1，然后其余的就是2,3,4，我还是没反应过来，不过【月神】一下子就get到她的意思了，真是太神了。

这里【月神】给出了解答，使用pd.factorize(data['a'])[0]完美地解决了这个问题。

实战篇：盘点Pandas中的factorize()函数妙用_Python入门_04

这个类似于onehot编码，对类型进行了数字编码，如果想要把nan也编码，加一个参数na_sentinel=None。

这样一来，就完美地解决了问题。

实战篇：盘点Pandas中的factorize()函数妙用_Python开发_05

关于pd.factorize()函数的定义如下：

pandas.factorize(values, sort=False, order=None, na_sentinel=-1, size_hint=None) Encode input values as an enumerated type or categorical variable

简单来说，它可以实现将字符串特征转化为数字特征。

大家好，我是皮皮。这篇文章主要分享了Pandas中数据处理的问题，主要讲解了pd.factorize()函数的应用，它可以实现将字符串特征转化为数字特征，针对该问题给出了具体的解析和代码演示，帮助粉丝顺利解决了问题。

实战篇：盘点Pandas中的factorize()函数妙用_Python基础_06

最后感谢粉丝【蛋蛋】提问，感谢【月神】和【皮皮】给出的具体解析和代码演示，感谢【dcpeng】、【冫马讠成】等人参与学习交流。

小伙伴们，快快用实践一下吧！如果在学习过程中，有遇到任何问题，欢迎加我好友，我拉你进Python学习交流群共同探讨学习。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯