目前越来越多的科学研究开始运用技术手段,其中应用较多的是模型建立和数据分析,这就离不开计算机语言的使用,Python以其简单易学的特性,配合高度的适用性,在科研领域发挥越来越重要的作用,基于Python的毕业论文越来越多,本文就针对Python在科研领域的使用,给大家说说基于Python的毕业论文该怎么写。
一、应用Python的毕业论文方向
二、基于Python毕业论文选题
一、应用Python的毕业论文方向
应用Python的毕业论文方向大致有两个,一个是将Python作为科研工具,进行网站的数据爬取,这里的Python不是论文理论基础,更偏重于工具式的使用;另一个方向就是Python算法的理论研究,使用Python作为代码实现方式,进行软件算法设计,进行管理系统、交互平台、数据分析、机器学习、识别工具等等,属于算法实现类的论文方向。
1、应用Python爬取数据
很多论文,尤其是人文社科类论文,需要大量社会数据,但通过调查问卷等方式获取的数据量小,而且某些数据如网站交易量、网站浏览量无法实地获取,这时候就可以利用Python的灵活适用的特点,在网站上快速获取、整理相关数据,人称“爬虫”。
这里Python的应用比较初级,学习起来难度不高,数据获取比较灵活,能够极大提高论文写作效率,对论文数据量的增加效果也十分显著。
本文针对网站数据获取做一个简单操作介绍,并提供简易代码。
需要注意的是,从网站上使用Python获取数据,需要保证不涉及个人信息,不非法进入他人网站,严格遵循《网络安全法》要求,一般来说,官方网站的公开信息,就可以随意爬取,不涉及法律法规问题,而且数据也比较真实可靠。
(1)获得网页内容
import requests #访问链接
from lxml import etree #解析网页
import time # 设置停顿时间
import pandas as pd #存储数据
# 基础访问函数
def get_url(url):
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'}
response = requests.get(url, headers=header)
html = etree.HTML(response.content.decode('utf-8'))
return html
(2)爬取文本内容
数据一般是表格形式呈现,表头可能有日期、机构、类别等等,选择相应信息进行获取。
# 获取文本链接和信息
def get_detail(url, name, info_group):
html = get_url(url)
# 获取表格信息
info html.xpath(".//div[@id='content_body_xxgk']//td[@class='gongkai_font_gray']/text()")
info_group.append(info)
# 获取标题
items_head = ''.join(html.xpath(".//div[@id='xxgk_content_redheadbg']//h1/text()"))
# 获取文本
items_text = html.xpath(".//div[@id='xxgk_content_div']//p/text()")
# 存储文本
fileName = 'result/文本数据/' + name + '.txt'
with open(fileName, 'a', encoding="utf-8") as f:
f.write(items_head)
f.write('\n\n')
for text in items_text:
f.write(text)
f.write('\n\n')
return info_group
# 获取文本链接
items_data = []
for url in url_group:
items_data = get_items(url, items_data)
print(url)
time.sleep(1)
print(len(items_data))
# 获取并存储文本
info_group = []
for data in items_data:
name = data[0]
href = data[2]
url = base_url + href[1:]
info_group = get_detail(url, name, info_group)
print(url)
time.sleep(1)
print(len(items_data))
最后将获取的数据存到excel即可,这个方法可以用很短的时间获取大量数据,只要将代码调整到对应网站页面即可。
2、基于Python算法实现
基于Python的算法实现类的毕业论文首先一定要根据自己的能力确定好论文难度,因为目前Python算法的使用也十分广泛,在几乎所有网页、软件、app设计都有应用,Python能够实现的内容也是相当充足,进行毕业论文的内容选定一定要根据自身对Python的了解和能力,选择适合难度的选题。
在选题时,可以参照“算法+场景+问题”的形式,一般论文的题目也是这个格式,能够清晰地表现出利用Python算法的某个方向,针对某种情况,实现了什么功能。
可以多阅读一些Python的文献,了解Python算法应用应该怎样写。