Python数据分析步骤 python数据分析方法

转载

mob64ca14005461 2023-09-12 18:17:03

文章标签 Python数据分析步骤解决方法数据 python 文章分类 Python 后端开发

1，表头或是excel的索引如果是中文的话，输出会出错

Python数据分析步骤 python数据分析方法_Python数据分析步骤

解决方法：python的版本问题！换成python3就自动解决了！当然也有其他的方法，这里就不再深究

2，如果有很多列，如何输出指定的列？

需求情况：有的时候，数据很多，但是只要仅仅对部分列的数据进行分析的话，要怎么做？

解决方法：

df = pandas.read_excel('1.xls',sheetname= '店铺分析日报')
df = df.loc[:,['关键词','带来的访客数','跳失率']] #访问指定的列

一行读取数据，第二行访问指定列

3，如何为数据框添加新的列？

需求情况：有一个表格，里面的列是单价，数量，想再输出一个总价的列，或是对一些数据进行总结

解决方法：直接上代码

from pandas import read_csv;
import pandas;
df = read_csv("1.csv", sep="|");
#把计算结果添加为一个新的列
df['result'] = df.price*df.num    
print (df)

4，如何对百分号的数值进行计算，再将其输出

需求情况：比较蛋疼的一个情况，电商很多数据都是百分比的，带有百分号，不能进行直接的计算，需要对其进行转换，然后再输出

解决方法：

from pandas import read_csv;
import pandas;
df = read_csv("1.csv", sep="|");
f = df['跳失率'].str.strip("%").astype(float)/100;
f.round(decimals=2)  #保留小数点后面2位
f_str = f.apply(lambda x: format(x, '.2%'));  #再转换成百分号并且保留2位数（精度可以调整）
df['跳失率'] = f_str

5，如何获取导入的数据有几行和几列（数值）

需求情况：有的时候需要写一个通用脚本，比如随机抽样分析，程序自动获取行和列的话，写出来的脚本通用性明显会很强

解决方法：

df.columns.size  
df.iloc[:, 0].size  #获取行数

6，如何对数据进行排序

需求情况：这个就不用说了，到处都要用到

解决方法：

df['跳失率'].size  
newDF = df.sort(['曝光量', '带来的访客数'], ascending=[True, False]);  #多重排序

7，如何删除指定的列？

需求情况：同样，十几列的数据，如果你想获取指定的输出数据，可以用方法2，但是如果想要获取的数据列比较多，只有1-2行不想要，这样就可以用指定删除列的方法了

解决方法：

df.columns.delete(1)

一行代码搞定！

总结：整体来说的，python的语法在做数据分析还是相当简单的，很多的需求基本上就是一行代码搞定！

8，如何添加整行数据？

df.append([1,2,34,,5])

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Python用open函数解码 python open 函数

下一篇：python判断两个日期大小 python判断日期合法

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯