text =file.readlines()  # 结果为str类型
for line in text:#遍历文件
print("开始爬取评论")
name = line.split()[0]


加了个功能自动遍历网址目录进行爬取

然后接下来就是多爬取数据,然后进行数据清洗,清洗部分不符合格式要求的数据

最后分析可视化等等