题图:南山竹海(20190713 15:16)
阅读本文大概需要 3 分钟。
GitHub 自有黄金屋、颜如玉。
之前浏览了几个项目,觉得非常实用,今天整理出来分享给大家,看着用吧!
1. 喜欢看电影、下载电影,但讨厌各种广告和点击跳转?
这有一个基于 Pyqt5 的电影天堂电影搜索工具,再也不用忍受找电影期间的各种广告,以及各种页面跳转了。
项目地址:https://github.com/lt94/MovieHeavens
操作简介:
Python3 movies.py
如果想打包给别人使用:
# only python3 is supported
pip install pyinstaller
# -w 不能省略,不然会运行过程中会控制台界面
pyinstaller -F -w ./movies.py ./movieSource/MovieHeaven.py ./movieSource/fake_user_agent.py
然后会在当前文件夹生成俩个目录,其中dist目录有个可执行的程序。
程序界面如下:
2. 想做金融分析,量化交易吗?
这有一个免费、开源的 Python 财经数据接口包 TuShare。
主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。
考虑到 Python pandas 包在金融量化分析中体现出的优势,Tushare 返回的绝大部分的数据格式都是 pandas DataFrame 类型,非常便于用 pandas、NumPy、Matplotlib 进行数据分析和可视化。
当然,如果您习惯了用 Excel 或者关系型数据库做分析,您也可以通过 Tushare 的数据存储功能,将数据全部保存到本地后进行分析。应一些用户的请求,从 0.2.5 版本开始,Tushare 同时兼容 Python 2.x 和 Python 3.x,对部分代码进行了重构,并优化了一些算法,确保数据获取的高效和稳定
文档链接:http://tushare.org/index.html
3. 想听的歌在网易云音乐因没有版权而听不了?
因为版权导致喜欢的歌听不了,它可以让你用一个网页就能听到多个网站的在线音乐,支持各种平台-,这就是 listen1。
作者建立项目的初衷:
当我发现找个想听的歌因为版权听不了,需要打开好几个网站开始搜索,来回切换让我抓狂的时候,我知道是时候该做点什么了。
妈妈再也不用担心我找不到我想听的歌了。这里包含了网易云音乐,虾米,QQ音乐, 酷狗音乐,酷我音乐的曲库,够全够大了吧。
搜歌,听歌,就用 Listen1。
项目地址:https://github.com/listen1/listen1_chrome_extension
项目主页:http://listen1.github.io/listen1/
最新的重要通告:
Listen1的用户,有个坏消息希望和大家分享。Listen1最近收到了QQ音乐的DMCA Takedown Notice, 主要代码库已经因为此原因而临时关闭。悲观一点看,Listen1项目可能会在今年内彻底消失。
Listen1诞生的初衷从不是和大公司的争夺版权利益,而是为了给予热爱音乐的人更好的收听体验,所以,Listen1是开源,免费的,并且不接受任何形式的捐助。正是因为有热爱音乐的Listen1的你们,Listen1才发展到今天这一步。不管结果如何,Listen1团队感谢所有支持过这个项目的人们。
友情提示,如果有时间请尽快下载。
4. 想用程序来帮你总结文章主旨大意吗?
这就是 python-goose,Goose 最初是一个用 Java 编写的文章提取器,最近(2011年8月)被转换为scala项目。本项目则使用 Python 重写。该软件的目的是获取任何新闻文章或文章类型的网页,不仅提取文章的主体,而且提取所有元数据和主要的图像。
Goose将尝试提取以下信息:
-
一篇文章的正文
-
文章的主要图片
-
文章中嵌入的所有 YouTube / Vimeo 电影
-
元描述
-
元标记
项目地址:https://github.com/grangier/python-goose
示例代码:
>>> from goose import Goose
>>> from goose.text import StopWordsChinese
>>> url = 'http://www.bbc.co.uk/zhongwen/simp/chinese_news/2012/12/121210_hongkong_politics.shtml'
>>> g = Goose({'stopwords_class': StopWordsChinese})
>>> article = g.extract(url=url)
>>> print article.cleaned_text[:150]
香港行政长官梁振英在各方压力下就其大宅的违章建筑(僭建)问题到立法会接受质询,并向香港民众道歉。
梁振英在星期二(12月10日)的答问大会开始之际在其演说中道歉,但强调他在违章建筑问题上没有隐瞒的意图和动机。
一些亲北京阵营议员欢迎梁振英道歉,且认为应能获得香港民众接受,但这些议员也质问梁振英有
5. 想做敏感词过滤?
这有一个基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式, textfilter。
项目地址:https://github.com/observerss/textfilter
用于过滤敏感词的实用模块,示例代码:
from filter import DFAFilter
gfw = DFAFilter()
gfw.parse("keywords")
print "待过滤:售假人民币 我操操操"
print "过滤后:", gfw.filter("售假人民币 我操操操", "*")
test_first_character()
# 运行结果
# 待过滤:售假人民币 我操操操
# 过滤后: 售假**币 ****```
阅读原文可访问文中的链接。
(完)
专注于Python技术分享
欢迎转发