题记:看过我的头条的都知道,我写文章,相比其他人而言,在格式和语言上,比较规范化,因为我认为,写头条文章不仅仅是为了个人,它更多是传播知识,因此也希望更多朋友给与我鼓励和支持,关注+转发自己有用的知识,当然如果我文章有问题,也希望你能指出了,谢谢!

声明:目前该项目的开发语言是采用Pythonweb框架是Flask,开发工具是Pycharm,个人是Java开发,如果看了我之前的文章的朋友,应该知道我是什么样的人。

需要了解的知识点

1、准备语料库

相似度:1、正则/规则:适用没有数据

     2、字符串相似

2、文本转为向量 :

1、one-hot编码

         2、counter vector

         3、Tf-idf

         4、Word2vec

         5、Seq2seq

3、相似度计算:1、欧式距离

       2、余弦公式

1、首先创建一个问答系统类

import numpy as np  # 用于 数组转换import jieba  # 用于中文分词from sklearn.metrics.pairwise import cosine_similarity   # 机器学习库,这里用于余弦相似度计算from flask import Flask  # Web 应用框架class askSystem():    def __init__(self, corpus):        self.corpus = corpus    # 建立词典    def creat_dic(self):        all_question = ""        for question in self.corpus:            all_question += question        word_from_question = list(jieba.cut(all_question))        dictionaries = word_from_question        print(dictionaries)        return dictionaries    # 问题转换为向量    def transform_vector(self,date,dictionaries):        vector_list = []        for wd in dictionaries:            if wd in list(jieba.cut(date)):                vector_list.append(1)            else:                vector_list.append(0)        return np.array(vector_list).reshape(1, -1)    # 余弦相似度计算    def cosine_simi(self,date1,date2,dictionaries):        similar_list = cosine_similarity(self.transform_vector(date1,dictionaries), self.transform_vector(date2,dictionaries))        similar_num = similar_list[0][0]  #相似度        return similar_num    def question_for_web(self, user_question,dictionaries):        question_dict = {}        similar_list = []        for key in self.corpus:            similar_num = self.cosine_simi(user_question,key,dictionaries)            similar_list.append(similar_num)            question_dict[similar_num] = self.corpus[key]  # 相似度若相等,因为字典key值不能重复,会导致匹配答案不准确        if max(similar_list) == 0:            answer = "这就问题我再想想!"        else:            answer = question_dict[max(similar_list)]        return answer

2、Web框架启动类

from flask import Flaskfrom flask_cors import CORSimport askSystemapp = Flask(__name__)CORS(app)  # 解决跨域问题@app.route('/')def hello_world():    return 'Hello World!'@app.route("/question/")def question_for_web(user_question):    corpus = {        "课程是线上课程还是线下课程?": "线上课程为主",        "课程有助教吗?": "为提高服务效率和质量,课程都配备专业的全职助教。",        "我没有基础应该从哪个课开始学?": "大周老师的Python基础集训营非常适合你哦,"                           "可以在这里学习:http://aijiaoai.greedyai.com/info/5",        "学习周期是多久?": "如果你没有基础的话两个月可以搞定",        "课程的学习方式是什么呢?": "无需安装环境,在线直接写代码、看视频、看漫画,趣味性学习",        "课程的优势是什么呢?": "全网覆盖最全的Python基础知识体系练与学的深度结合,"                            "每一个知识点都配有练习项目,生动有趣、授课方式多样,视频、文字、图片、在线代码编辑,"                            "在聊天与娱乐中学习",        "课程的有效期是多久呢?": "我们把有效期确定为1年,1年内可无限次学习",        "课程有优惠吗?": "我们定价为开课后是599,现在是针对老学员预售199,开课后恢复原价"    }    askSys = askSystem.askSystem(corpus)    answer = askSys.question_for_web(user_question,askSys.creat_dic())    return answerif __name__ == '__main__':    app.run(host='0.0.0.0' ,port=5000)

3、测试结果

java 客服即时通讯 java实现智能客服_在线客服坐席系统java

测试结果1

java 客服即时通讯 java实现智能客服_项目案例:在线拍卖系统_02

测试结果2