python医学应用代码简单 python 医学论文

转载

mob6454cc65110a 2023-06-08 20:30:32

文章标签 python医学应用代码简单 python 数据分析数据挖掘自然语言处理 文章分类 Python 后端开发

文章分段，文本结构化

import re

data = []
for line in open('方剂学--完整版.txt',encoding='utf8'):
    data.append(line.strip())

print(data[:20])

数据结构：

python医学应用代码简单 python 医学论文_python

处理过程，用正则表达式：

f = open('方剂学--完整版.txt',encoding='utf8')
text = f.read()
f.close()
#构造正则串
pattern = """\n(.*?)\n【组成】(.*?)\n【功用】(.*?)\n【主治】(.*?)\n"""
text_list = re.findall(pattern=pattern,string=text)
print(text_list[:5])

python医学应用代码简单 python 医学论文_数据挖掘_02

用pandas转化为Dataframe结构，可视化程度高：

import pandas as pd

df_drug = pd.DataFrame(text_list,columns=['name','组成','功用','主治'])
df_drug.head(3)

python医学应用代码简单 python 医学论文_数据分析_03

保存结果：

df_drug.to_excel('方剂学_完整版.xlsx',index=None)

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Python输出从大到小得数 python输出大写字母个数

下一篇：hive判断中文正则表达式 hive正则匹配中文字符

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python医学应用代码简单 python 医学论文

python医学应用代码简单 python 医学论文

51CTO博客