jsonpath是类似xpath的路径查找工具,可以方便地从JSON数据里查找到数据。
jsonpath_ng支持JSON数据的读写操作。
当传输大量内存,以至于超出内存大小,一般http服务器会报500错误,这时可以使用Streaming流的方式来传输内容,类似ChatGPT和视频流那样的输出方式,flask里要用到生成器和直接响应。
pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。
在查询数据时,字符串匹配经常用到模糊匹配,这时就要用到模糊匹配算法,如Levenshtein Distance 算法,计算编辑距离,这里Python的thefuzz包实现了模糊匹配功能。
Ollama支持embedding models嵌入模型,从而支持RAG(retrieval augmented generation)应用,结合文本提示词,检索到文档或相关
flask_login 是一个 Flask 扩展,用于在 Flask web 应用中实现用户会话管理。它允许你跟踪哪些用户已经登录,并管理他们的登录状态。flask_login
Dash是一个低代码数据框架,用Python实现可视化交互界面,不用写Javascript,开源,支持回调、HTML组件等功能。
captcha是pyhton的一个模块,用来生成图片和音频验证码。
docxtpl是一个用于生成Microsoft Word文档的模板引擎库。它结合了docx模块和Jinja2模板引擎,使用户能够使用Microsoft Word模开发的语法对其进行修改。
textdistance是Python的第三方库,用于计算文本之间的相似度或距离。它提供了30+个算法,简单易用。
similarities 实现了多种相似度计算、匹配搜索算法,支持文本、图像,python3开发。
TextRank算法可以用来从文本中提取关键词和摘要(重要的句子)。TextRank4ZH是针对中文文本的TextRank算法的python算法实现。TextRank4ZH的缺点: 依赖于词性标注:TextRank4ZH在进行摘要和关键词提取时使用了中文的词性标注,这可能导致一些错误的分析结果,尤其是对于不确定词性或无法准确标注的词汇。 对于长文本效果不佳:由于TextRank4ZH是基于图模型的
seaborn是一个基于matplotlib进行高级封装的可视化库,相比之下,绘制图表更为集成化、绘图风格具有更高的定制性。
DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器,也能收发数据包,还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大,内置无数人性化设计和便捷功能。它的语法简洁而优雅,代码量少,对新手友好。
在Python官网来看,Python 3.8.18之后,就不再支持Windows7。对应Anaconda的版本就是anaconda3-2021.05。
通过python-docx的章节属性,就可以更改纸张方向、纸张尺寸。更改纸张方向,分两步,第一步是设置section的orientation属性为LANDSCAPE,第二步是设置section的宽高互换。
Python的concurrent.futures模块可以很方便的实现多进程、多线程运行,减少了多进程带来的的同步和共享数据问题。Executor是一个抽象
pandas不兼容问题sqlalchemy 2.0以上版本。
注意:dask不兼容sqlalchemy 2.0版本以上。
polars使用rust实现,内部使用arrow列存储格式,支持并行数据处理,比pandas快,分两种模式eager和lazy。适合中、小型数据处理,大型数据建议用Spark。
Pandas使用pivot_table()方法和crosstab()方法实现透视表。
时间序列数据是指在时间间隔不变的情况下收集的时间点数据,可以用来分析事物的长期发展趋势,并对未来进行预测。
中文分词、词频统计并制作词云图是统计数据常用的功能,这里用到了三个模块快速实现这个功能。
Python-pptx库是一个用于创建、更新和读取Microsoft PowerPoint .pptx 文件的Python库。它允许我们使用Python脚本自动化PowerPoint文件的创建一个非常方便自动化处理PPTX的工具。
【代码】Pandas数据导入和导出:CSV、Excel、MySQL SQL。
Pypandoc使用pandoc来进行各种文本格式的转换。
Mojo面向 AI 开发者的新型编程语言,无缝支持CPU、GPU,兼容Python,跟Python类似的语法,但是比Python快68000倍。目前Mojo仅支持Ubuntu,暂不支持Windows和Mac,可以在。
使用socket模块的connect_ex来判断端口是否打开,如果表示连接成功,端口打开,否则端口关闭。
Pytest是一个基于python的测试框架,用于编写和执行测试代码。pyt
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号