python将字符串转换成ascii python将字符串转换成元组

转载

恋上一只猪 2023-08-10 22:04:07

文章标签 python将字符串转换成ascii python list 字符串元组 文章分类 Python 后端开发

一、问题引入

最近在做问答系统项目时，发现一个很有意思的小问题。

目的：我把txt里的内容读取出来，以元组对形式保存在列表中统一格式，然后再保存到sqlite3里。

txt里问题和答案都数据str类型，读取出来很容易就直接上代码了。

txt格式（三个为例）：
LABEL:QUESTION:ANSWER
26:张三老师:电气学院的张三老师的研究方向是电气工程,今年预计招收3名学生
27:张三老师的研究方向:电气学院的张三老师的研究方向是电气工程
28:请问张三老师是做什么的:电气学院的张三老师的研究方向是电气工程

from itertools import islice

f = open('ceshi.txt','r',encoding = 'utf-8')
for line in islice(f,1,None):   # 跳过第一行数据
    label = line.split(':')[0]
    question = line.split(':')[1]
    answer = line.split(':')[2]

二、问题深入

上面我们拿到了question和answer数据，那么怎么把两个字符串组成元组呢？（即（question,answer）形式）

1、第一次尝试

第一反应就是使用tuple()

tuple(question+ ',' + answer)

一开始就单纯的想着直接tuple强制转化

然后输出结果是这样

图片版：

python将字符串转换成ascii python将字符串转换成元组_python将字符串转换成ascii

文字版：

(‘张’, ‘三’, ‘老’, ‘师’, ‘,’, ‘电’, ‘气’, ‘学’, ‘院’, ‘的’, ‘张’, ‘三’, ‘老’, ‘师’,‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘是’, ‘电’, ‘气’, ‘工’, ‘程’, ‘,’, ‘今’, ‘年’, ‘预’,‘计’, ‘招’, ‘收’, ‘3’, ‘名’, ‘学’, ‘生’, ‘\n’)
(‘张’, ‘三’, ‘老’, ‘师’, ‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘,’, ‘电’, ‘气’, ‘学’, ‘院’, ‘的’, ‘张’, ‘三’, ‘老’, ‘师’, ‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘是’, ‘电’, ‘气’, ‘工’, ‘程’, ‘\n’)
(‘请’, ‘问’, ‘张’, ‘三’, ‘老’, ‘师’, ‘是’, ‘做’, ‘什’, ‘么’, ‘的’, ‘,’, ‘电’, ‘气’, ‘学’, ‘院’, ‘的’, ‘张’, ‘三’, ‘老’, ‘师’, ‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘是’, ‘电’, ‘气’, ‘工’, ‘程’, ‘\n’)

这和我想要得到（question,answer）格式，不一样。上网找解决方法。

2、第二次尝试

查了网上一些方法得出的结论是这样的

from itertools import islice

f = open('ceshi.txt','r',encoding = 'utf-8')
for line in islice(f,1,None):   # 跳过第一行数据
    label = line.split(':')[0]
    question = line.split(':')[1]
    question1 = []
    question1.append(question)
    answer = line.split(':')[2]
    answer1 = []
    answer1.append(answer)
    couple = tuple(question1)+tuple(answer1)

输出结果：

图片版：

python将字符串转换成ascii python将字符串转换成元组_元组_02

文字版：

(‘请问张三老师是做什么的’, ‘电气学院的张三老师的研究方向是电气工程\n’)
(‘张三老师招生人数’, ‘电气学院的张三老师今年预计招收3名学生\n’)
(‘张三老师要几个人’, ‘电气学院的张三老师今年预计招收3名学生\n’)

这样写确实达到了我们想要的目的，但是结尾处有\n。还需要写行代码解决掉。这么看虽然问题解决了，但是代码效率不是特别高。

3、第三次尝试

这次和同学讨论，直接给出了以下比较讨巧的方法

from itertools import islice

f = open('ceshi.txt','r',encoding = 'utf-8')
for line in islice(f,1,None):   # 跳过第一行数据
    label = line.split(':')[0]
    question = line.split(':')[1]
    answer = line.split(':')[2]
    couple = (question,answer[:-1])

只需要加上最后一行就可以

输出结果：

图片版：

python将字符串转换成ascii python将字符串转换成元组_字符串_03

文字版：

(‘张三老师’, ‘电气学院的张三老师的研究方向是电气工程,今年预计招收3名学生’)
(‘张三老师的研究方向’, ‘电气学院的张三老师的研究方向是电气工程’)
(‘请问张三老师是做什么的’, ‘电气学院的张三老师的研究方向是电气工程’)
(‘张三老师招生人数’, ‘电气学院的张三老师今年预计招收3名学生’)
(‘张三老师要几个人’, ‘电气学院的张三老师今年预计招收3名学生’)

这样很好的达到我们想要元组对的目的。