吴流的博客_python数据分析_51CTO博客

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

# python数据分析

使用pandas模块帮助朋友处理mysql中的重复数据

接到朋友求助，说自己一个数据库里的某个表有大量重复数据，使用mysql语句处理的速度太慢，每次只能处理1W条数据，总共800W条数据需要处理，耗时耗力。分开处理也会有大量的遗漏数据需要二次三次处理，最后得到的数据还是会不准确，很显然用mysql语句处理不怎么好。我想到了python中有一个模块pandas是专门用来处理海量数据的，马上网上查下该模块是否有相关的方法，果然，pandas里的drop_

pandas

python

原创 2019-06-11 14:54:26 1785 阅读

数据分析基本模块的使用记录

第一堂课importpandasaspda#importnumpyasnpyimportmatplotlib.pylabaspyldata=pda.read_csv("D:/yali/books.csv")print(data.sort_values(by="comment"))#按指定参数排序print(data.shape)#查看数据统计print(data.describe())#data.

笔记

使用记录

原创 2018-11-09 00:20:37 405 阅读