互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊

原创

你说对不对鸭 2021-12-28 17:57:00 ©著作权

文章标签 python 人工智能大数据智慧医疗互联网+ 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者你说对不对鸭的原创作品，请联系作者获取转载授权，否则将追究法律责任

智慧医疗英文简称WIT120，是最近兴起的专有医疗名词，通过打造健康档案区域医疗信息平台，利用最先进的物联网技术，实现患者与医务人员、医疗机构、医疗设备之间的互动，逐步达到信息化。
随着计算机科学技术的飞速发展，现已有非常多的 AI 方法手段应用于医疗服务行业，进而让患者享受安全、便利、优质的诊疗服务！
本文将从大数据+爬虫技术出发，运用Python语言打造优质、便捷、高效的诊疗服务平台，让患者不用为不知挂号哪个诊室而苦恼。

互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊_python

1 项目简介

1.1 项目概述

本项目主要是基于Python语言打造智慧医院项目之智能分诊，旨在让患者轻松、便捷地了解其病情的就诊科室，进而实现“人人健康，健康人人”的项目初衷。具体而言，本项目实现过程用到了Python爬虫基础以及正则表达式等相关内容，最后达到的效果是患者输入自己的疾病症状，随即给出疾病对应的就诊科室。

总之，本项目产品是一个比较便捷高效的智能分诊系统；接下来将详细阐述项目产品的创造过程。

1.2 前期准备

因为需要提前了解到各个病情所对应的就诊科室，所以运用了Python爬虫技术获取各种各样的病情对应的科室等信息。

也就是说，需要提前找好一个网站，从这个网站中获取我们想要的信息

在这里，我找到的是一个名为寻医问药的网站，接下来的操作都是基于它来实现的

互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊_大数据_02

智能分诊系统的打造用到python语言及部分第三方库

在这里：

Python环境：3.8.2

python编译器：JetBrains PyCharm 2018.1.2 x64

第三方库及模块：requests、re模块、Pyinstaller库等

因为本文大量用到了正则表达式，实际上是比较复杂的，之前做过一篇关于正则表达式的文章，这里给出链接：
javascript:void(0)

2 项目分析

2.1 代码详解

导入用到的模块及第三方库

import requests
import re

获取到目标网页并做正则表达式处理

def get_data(url):
    # 请求网页
    resp = requests.get(url)
    # 对于获取到的 HTML 二进制文件进行 'gb2312' 转码成字符串文件
    html = resp.content.decode('gb2312')
    # 正则表达式获取期望字符串
    tag_div = re.findall(r'<div class="illness-ks clearfix">.*?(.*?)<ul class="mod-ill-list pt5">', html, re.S | re.I)[0]
    tag_a = re.findall(r'<a.*?</a>', tag_div)

url = 'http://zzk.xywy.com/'
get_data(url)

互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊_人工智能_03 在这里实际上已经将搜索范围减到了很小，但为了更精确获取我们想要的信息，运用否循环我们先来看一下（提前分析HTML源代码得到该网站的信息条数为392，故这里循环392次）

for i in range(392):
        print(i)
        chapter_url = re.findall(r'>(.*?)</a>', tag_a[i])  # [0]
        print(chapter_url)

互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊_python_04

通过此运行结果我们得到，比如下标为0的数据、下标为9的数据……都是科室名称而其他都是科室对应的接诊症状

也就是说，接下来我们利用两次for循环将目标锁定到每一具体科室及其接诊症状

这里以呼吸科为例，其科室及症状对应下标为0~9之间，在得到的chapter_url1字符串中再运用正则表达式提取信息

for huxi in range(9):                # 呼吸科
        chapter_url1 = re.findall(r'>(.*?)</a>', tag_a[huxi])
        for huxia in chapter_url1:
            print(huxia)
            if '' == huxia:
                huxiKS = re.findall(r'>(.*?)</a>', tag_a[0])[0]
                print('建议您的就诊科室为：',huxiKS)

互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊_python_05 同理，锁定每一科室及其接诊症状的下标范围，比如消化内科(9,18)、心内科(18,28)……

for xiaohua in range(9,18):          # 消化内科
        chapter_url2 = re.findall(r'>(.*?)</a>', tag_a[xiaohua])
        for xiaohuaa in chapter_url2:
            if symptom == xiaohuaa:
                xiaohuaKS = re.findall(r'>(.*?)</a>', tag_a[9])[0]
                print('建议您的就诊科室为：', xiaohuaKS)
    for xinnei in range(18,28):            # 心内科
        chapter_url3 = re.findall(r'>(.*?)</a>', tag_a[xinnei])
        for l in chapter_url3:
            if symptom == l:
                xinneiKS = re.findall(r'>(.*?)</a>', tag_a[18])[0]
                print('建议您的就诊科室为：',xinneiKS)

按照这一思路将网站内涉及到的26个科室全部写出来，最后再通过用户输入症状得出对应的结果

symptom = input("请输入您的症状：")

互联网+智慧医疗：基于Python打造智慧医院项目之智能分诊_智慧医疗_06

2.2 总观代码

import requests
import re

def get_data(url):
    # 请求网页
    resp = requests.get(url)
    # 对于获取到的 HTML 二进制文件进行 'gb2312' 转码成字符串文件
    html = resp.content.decode('gb2312')
    # 正则表达式获取期望字符串
    tag_div = re.findall(r'<div class="illness-ks clearfix">.*?(.*?)<ul class="mod-ill-list pt5">', html, re.S | re.I)[0]
    tag_a = re.findall(r'<a.*?</a>', tag_div)
    # print(tag_a)
    # for i in range(392):
    #     print(i)
    #     chapter_url = re.findall(r'>(.*?)</a>', tag_a[i])  # [0]
    #     print(chapter_url)

    # print(tag_a)
    symptom = input("请输入您的症状：")
    for huxi in range(9):                # 呼吸科
        chapter_url1 = re.findall(r'>(.*?)</a>', tag_a[huxi])
        for huxia in chapter_url1:
            # print(huxia)
            if symptom == huxia:
                huxiKS = re.findall(r'>(.*?)</a>', tag_a[0])[0]
                print('建议您的就诊科室为：',huxiKS)
    for xiaohua in range(9,18):          # 消化内科
        chapter_url2 = re.findall(r'>(.*?)</a>', tag_a[xiaohua])
        for xiaohuaa in chapter_url2:
            if symptom == xiaohuaa:
                xiaohuaKS = re.findall(r'>(.*?)</a>', tag_a[9])[0]
                print('建议您的就诊科室为：', xiaohuaKS)
    for xinnei in range(18,28):            # 心内科
        chapter_url3 = re.findall(r'>(.*?)</a>', tag_a[xinnei])
        for l in chapter_url3:
            if symptom == l:
                xinneiKS = re.findall(r'>(.*?)</a>', tag_a[18])[0]
                print('建议您的就诊科室为：',xinneiKS)
    for xueye in range(28,36):               # 血液科
        chapter_url4 = re.findall(r'>(.*?)</a>', tag_a[xueye])
        for xueyea in chapter_url4:
            # print(l)
            if symptom == xueyea:
                xueyeKS = re.findall(r'>(.*?)</a>', tag_a[28])[0]
                print('建议您的就诊科室为：',xueyeKS)
    for neifenmi in range(36,44):            # 内分泌科
        chapter_url5 = re.findall(r'>(.*?)</a>', tag_a[neifenmi])
        for neifenmia in chapter_url5:
            if symptom == neifenmia:
                neifenmiKS = re.findall(r'>(.*?)</a>', tag_a[36])[0]
                print('建议您的就诊科室为：',neifenmiKS)
    for shenjingnei in range(44,53):           #  神经内科
        chapter_url6 = re.findall(r'>(.*?)</a>', tag_a[shenjingnei])
        for shenjingneia in chapter_url6:
            if symptom == shenjingneia:
                shenjingneiKS = re.findall(r'>(.*?)</a>', tag_a[44])[0]
                print('建议您的就诊科室为：',shenjingneiKS)
    for shennei in range(53,61):           # 肾内科
        chapter_url7 = re.findall(r'>(.*?)</a>', tag_a[shennei])
        for shenneia in chapter_url7:
            if symptom == shenneia:
                shenneiKS = re.findall(r'>(.*?)</a>', tag_a[53])[0]
                print('建议您的就诊科室为：',shenneiKS)
    for yichuanbing in range(61,77):       # 遗传病科
        chapter_url8 = re.findall(r'>(.*?)</a>', tag_a[yichuanbing])
        for yichuanbinga in chapter_url8:
            if symptom == yichuanbinga:
                yichuanbingKS = re.findall(r'>(.*?)</a>', tag_a[61])[0]
                print('建议您的就诊科室为：',yichuanbingKS)
    for waike in range(77,87):                # 外科
        chapter_url9 = re.findall(r'>(.*?)</a>', tag_a[waike])
        for waikea in chapter_url9:
            if symptom == waikea:
                waikeKS = re.findall(r'>(.*?)</a>', tag_a[77])[0]
                print('建议您的就诊科室为：',waikeKS)
    for guke in range(87,95):                # 骨外科
        chapter_url10 = re.findall(r'>(.*?)</a>', tag_a[guke])
        for gukea in chapter_url10:
            if symptom == gukea:
                gukeKS = re.findall(r'>(.*?)</a>', tag_a[87])[0]
                print('建议您的就诊科室为：',gukeKS)
    for shenjingwai in range(95,104):                 # 神经外科
        chapter_url11 = re.findall(r'>(.*?)</a>', tag_a[shenjingwai])
        for shenjingwaia in chapter_url11:
            if symptom == shenjingwaia:
                shenjingwaiKS = re.findall(r'>(.*?)</a>', tag_a[95])[0]
                print('建议您的就诊科室为：',shenjingwaiKS)
    for xinxiongwai in range(104,112):                 # 心胸外科
        chapter_url12 = re.findall(r'>(.*?)</a>', tag_a[xinxiongwai])
        for xinxiongwaia in chapter_url12:
            if symptom == xinxiongwaia:
                xinxiongwaiKS = re.findall(r'>(.*?)</a>', tag_a[104])[0]
                print('建议您的就诊科室为：',xinxiongwaiKS)
    for gandanwai in range(112,120):                 # 肝胆外科
        chapter_url13 = re.findall(r'>(.*?)</a>', tag_a[gandanwai])
        for gandanwaia in chapter_url13:
            if symptom == gandanwaia:
                gandanwaiKS = re.findall(r'>(.*?)</a>', tag_a[112])[0]
                print('建议您的就诊科室为：',gandanwaiKS)
    for miniao in range(120,129):                 # 泌尿外科
        chapter_url14 = re.findall(r'>(.*?)</a>', tag_a[miniao])
        for miniaoa in chapter_url14:
            if symptom == miniaoa:
                miniaoKS = re.findall(r'>(.*?)</a>', tag_a[120])[0]
                print('建议您的就诊科室为：',miniaoKS)
    for gangchang in range(129,138):                 # 肛肠科
        chapter_url15 = re.findall(r'>(.*?)</a>', tag_a[gangchang])
        for gangchanga in chapter_url15:
            if symptom == gangchanga:
                gangchangKS = re.findall(r'>(.*?)</a>', tag_a[129])[0]
                print('建议您的就诊科室为：',gangchangKS)
    for zhengxing in range(138,147):                 # 整形科
        chapter_url16 = re.findall(r'>(.*?)</a>', tag_a[zhengxing])
        for zhengxinga in chapter_url16:
            if symptom == zhengxinga:
                zhengxingKS = re.findall(r'>(.*?)</a>', tag_a[138])[0]
                print('建议您的就诊科室为：',zhengxingKS)
    for er in range(147,156):                 # 儿科
        chapter_url17 = re.findall(r'>(.*?)</a>', tag_a[er])
        for era in chapter_url17:
            if symptom == era:
                erKS = re.findall(r'>(.*?)</a>', tag_a[148])[0]
                print('建议您的就诊科室为：',erKS)
    for fuchan in range(156,203):                 # 妇产科
        chapter_url18 = re.findall(r'>(.*?)</a>', tag_a[fuchan])
        for fuchana in chapter_url18:
            if symptom == fuchana:
                fuchanKS = re.findall(r'>(.*?)</a>', tag_a[156])[0]
                print('建议您的就诊科室为：',fuchanKS)
    for pifu in range(204, 221):  # 皮肤科
        chapter_url19 = re.findall(r'>(.*?)</a>', tag_a[pifu])
        for pifua in chapter_url19:
            if symptom == pifua:
                pifuKS = re.findall(r'>(.*?)</a>', tag_a[204])[0]
                print('建议您的就诊科室为：', pifuKS)
    for zhongyi in range(223, 247):  # 中医科
        chapter_url20 = re.findall(r'>(.*?)</a>', tag_a[zhongyi])
        for zhongyia in chapter_url20:
            if symptom == zhongyia:
                zhongyiKS = re.findall(r'>(.*?)</a>', tag_a[223])[0]
                print('建议您的就诊科室为：', zhongyiKS)
    for wuguan in range(247, 274):  # 五官科
        chapter_url21 = re.findall(r'>(.*?)</a>', tag_a[wuguan])
        for wuguana in chapter_url21:
            if symptom == wuguana:
                wuguanKS = re.findall(r'>(.*?)</a>', tag_a[248])[0]
                print('建议您的就诊科室为：', wuguanKS)
    for nan in range(274, 292):  # 男科
        chapter_url22 = re.findall(r'>(.*?)</a>', tag_a[nan])
        for nana in chapter_url22:
            if symptom == nana:
                nanKS = re.findall(r'>(.*?)</a>', tag_a[274])[0]
                print('建议您的就诊科室为：', nanKS)
    for chuanran in range(292, 311):  # 传染科
        chapter_url23 = re.findall(r'>(.*?)</a>', tag_a[chuanran])
        for chuanrana in chapter_url23:
            if symptom == chuanrana:
                chuanranKS = re.findall(r'>(.*?)</a>', tag_a[292])[0]
                print('建议您的就诊科室为：', chuanranKS)
    for jingshen in range(311, 327):  # 精神科
        chapter_url24 = re.findall(r'>(.*?)</a>', tag_a[jingshen])
        for jingshena in chapter_url24:
            if symptom == jingshena:
                jingshenKS = re.findall(r'>(.*?)</a>', tag_a[311])[0]
                print('建议您的就诊科室为：', jingshenKS)
    for jizhen in range(328, 342):  # 急诊科
        chapter_url25 = re.findall(r'>(.*?)</a>', tag_a[jizhen])
        for jizhena in chapter_url25:
            if symptom == jizhena:
                jizhenKS = re.findall(r'>(.*?)</a>', tag_a[328])[0]
                print('建议您的就诊科室为：', jizhenKS)
    for zhongliu in range(343, 350):  # 肿瘤科
        chapter_url26 = re.findall(r'>(.*?)</a>', tag_a[zhongliu])
        for zhongliua in chapter_url26:
            if symptom == zhongliua:
                zhongliuKS = re.findall(r'>(.*?)</a>', tag_a[343])[0]
                print('建议您的就诊科室为：', zhongliuKS)

url = 'http://zzk.xywy.com/'
get_data(url)