python将客户的数据一直保存的方法:1、使用【with open()】新建对象写入数据;2、使用pandas包保存,代码为【import pandas as pd #导入pX Q o 7andas】。


python将客户的数据一直保存的方法:

一、open函数保存

使用with open()新建对象s } j 0 @

写入数据(这里使用的是爬v r .取豆瓣读书中一本书的豆瓣短评作为例子1 h g a W 8 ])

import requestsq s % @ 7 O
from l5 R y L M w = {xml import etree
#发送Request请求
url = 'https://book.doz # 6 = A [ Y ouban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKij k X 9t/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/C H s D53B B Z 9 e7.36'}
#解析HTML
r = req_ e * 6 h i W k Kues) } ? T 4ts.get(url, headers=head)
s = etree.HTML(r.text)
co# l | S W 8 x .mments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在写代码的时候可以将读取的内容打印一下
#保存数据open函数
wit5 # y | ~ g wh oh 1 Y Kpen('D:/PythonWorkSpace/Tes~ ` HtData/pi) k 0 v ? 1 onglun.txt','w',encoding='utf-8') ah ms f:#使用with open()新建对象f
for i in comments:
pg B { 4rn - O / O fint(i)
f.write(i+'\n')#写入数据,文件保存在上面指定的目录,加\n为了换行更方便阅读

这里& X % :指的注! + x 3 K L意的是: open函数的打开模式

参数用法

rread只读。若不存在文件会报错。

wl D # ( q t D 1 #write只写。若不存在文件会自动新建。

aapend附加到文件末尾。

rb, wb, ab操作二进制

r+读写模式打开

二、pandas包保存

说道Pandas不得不说一下与之相关的两个数据分析工具包(注意:pandas0 x j t ? 、numpy和matplotlib都需要事先安装e u t - g # I | C,详细安装可见之前的博文关于pip方式安装包)

numpy: (Numerical Python的简称),是高性能科学计算和数据分析的基础包

pandas:基于Numpy创建的1 Z w yPython包,含有使数据分析工作变得更加简单的高级数据结构和操作工具

matplotlib:是一个用于创建出版质量图表的绘图包(主要是m + | , t [ N2D方面)

impoX w 2 ?rt pandas as pd #导入pan- O 6 2das

import nu7 U U C Lmpy as np #导入numpy

import m= b h Z ^atplotlib.pypolt as plt #导入matplotlib

接下来就演示pa} l J 5 R ( B !ndas保存数据到CSV和ExX ; g % ? C qcel

#8 Y +导入包
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4))#创建随机值
#print(df.head(2))#查看数据框的头部数据,默认不写为前5行6 y C O L | 0 h,小于5行时全部显示;也可以自定义查看几行
print(df.tail(& 7 J #))##查看数据框的尾部数据,默认不写为倒数5行,小于5行时全部显示;也可以自定义查看倒数几行
df.to_csv('D:/Pf J [ /ythonWorkSpace/TestData/PandasNumpy.csv')#存储到CSV中
#df.to_excel('D:/PythonWorkSpace/Teo G S 4 estData/PaK * H L g x ^ }ndasNumpy.xlsx')#存储到Excel中(需要提前导入库 pip install openpyxl)

实例中保存豆S * B瓣读书的短评代码如下:

import requests
from lxml import etree
#发送Request请求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.w P ~2661.94 Safari/537.36'}
#解析_ ^ = G L P $ WHTML
r = requests.get(urz % J C P kl, headers=head)
s = etree.HTML(r.text)
comments = s.A ) A f 4 f [xpath('//div[@class=L M n -"comment"]/p/text()')
#print(str(commenu | { ! F - u ^ wts))#在写代码的时候可以将读取的内容打印一下
'''
#保存数据open函数
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f
for i in comments:
print(i)
f.write(i+'\nq - | b w (')#写入& n { ^ l R R w数据,文件保存在上面指定的目录,加\n为了换行更方便阅读
'''
#保存数据pand8 ? x x o ? E ~as函数 到CSU x $ i Z h A mV 和Excel
import pandas as pd
df = pd.DataFrame(comments)
#print(df.head())#head()默认为前5行
df.to_csv('D:/PythonWorkSpace/TestData/N E ` 1 & ePandasNumpyCSV.csv')
#df.to_excb ? / { - L 7 nel('D:/PythonWorkSpace/TestData/PandasNumpyEx.xlsx')