本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes1 简介尽管有那么多花里胡哨的debug工具和方式供我们选择,但不得不承认,在大多数情况下,print()才是最方便的代码调试方式?,通过手动在程序中的关键位置书写合适的打印语句,可以很快速地帮助我们了解到程序运行的过程,发现问题所在。而icecream            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-05 12:07:37
                            
                                87阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            至此,终于迎来了离线ocr的终极大结局,命令行后面参数既支持图像文件、图像文件夹,还支持PDF图像类型的文件,既支持通过json文件进行参数配置,又支持帮助文档,easyOCR包既支持允许字符集(也即仅支持字符集中的识别,例如在验证码识别场合),也支持排除字符集,还支持批处理尺寸大小、线程数目、分段结构保留(支持paragraph时,ocr结果就没有原来单句时的识别概率值了)等。#!/home/s            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-09 15:56:51
                            
                                175阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文旨在说明这些新的机制在底层是如何工作的。如果你只是对怎么使用这些功能感兴趣,那我建议你可以忽略这篇文章,而是去看一下内置的 asyncio 模块的文档。如果你对底层的概念感兴趣,关心这些底层功能如何能构建你自己的 asyncio 模块,那你会发现本文会有有意思。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-10 14:44:48
                            
                                105阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            说明ocr的用途还是比较广的,可以将大量的图片转为文字。如果从NLP的角度来说,这算是数据的清洗和提取吧。本篇使用cnocr做一些简单的应用。内容1 关于数据处理使用深度学习来识别字符,哪怕是手写字符也有不低的成功率。但是这个前提是图片是规整的,干净的。通常我们获得的图片格式比较多,所以第一步事实上是要索引蕴含相关目标的图片区域。所以,类似时间序列的分割,或者是数据表格的分割,机器学习的第一步总是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-24 10:27:02
                            
                                50阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Python入门(中)简介Python 是一种通用编程语言,其在科学计算和机器学习领域具有广泛的应用。如果我们打算利用 Python 来执行机器学习,那么对 Python 有一些基本的了解就是至关重要的。本 Python 入门系列体验就是为这样的初学者精心准备的。本实验包括以下内容:列表 
  列表的定义列表的创建向列表中添加元素删除列表中的元素获取列表中的元素列表的常用操作符列表的其他方法元组            
                
         
            
            
            
            一.复习Python是一种解释型语言,解释器可以交互式使用,将python语言解释给计算机能明白的机器语言。Python是一种真正的编程语言,编译型Python程序的书写是紧凑而易读的表达式 数据持久化doc命令cd \         回到c盘根下
cd test    进入test
dir           查看当前盘下的指令
在路径栏下直接输入cmd 可以直接进入当前路径
pyth            
                
         
            
            
            
            Python LOGGING使用方法 1. 简介 使用场景 日志的严重程度 由高到低| Level|| : || CRITICAL|| ERROR|| WARNING|| INFO|| DEBUG|logging默认的严重程度是WARNING,即在这个严重程度或以上的日志才会被记录。 有两种常用的记            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2018-12-27 21:56:00
                            
                                136阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            1、连接数据库pip install pyodbc 成功后就可以用了首先要import pyodbc1)直接连接            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2022-09-28 16:36:49
                            
                                296阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Python multiprocessing使用方法
## 介绍
在Python中,multiprocessing是一个用于实现多进程编程的模块。使用multiprocessing可以让我们更好地利用多核处理器的优势,加快程序的执行速度。本文将介绍如何使用Python的multiprocessing模块进行多进程编程。
## 流程
下面是使用multiprocessing进行多进程编程的基            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-08-03 10:32:08
                            
                                96阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ## 使用 Python pyad 的方法指导
在现代开发中,操作 Windows Active Directory (AD) 的需求越来越普遍,而 Python 的 `pyad` 库使得这一过程大大简化。通过这篇文章,我将带领你了解如何使用 `pyad` 进行 Active Directory 操作的基本方法,这对于刚入门的小白尤为重要。
### 整体流程
在使用 `pyad` 之前,我们            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-09-13 05:43:18
                            
                                126阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Python 中 `lsof` 的使用方法
在 Linux 和 macOS 系统中,`lsof`(list open files)是一个强大的命令行工具,它可以列出系统中当前打开的文件及其相关信息。文件在 Linux 系统中具有广泛的含义,它包括常规文件、目录、链接、以及套接字等。很多时候,我们需要通过 Python 来调用 `lsof`,以便在程序中获取相关信息。本文将介绍 `lsof`            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-10-05 04:46:55
                            
                                86阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 使用 PyBluez 实现蓝牙通信
蓝牙技术为设备间的无线通信提供了便捷的解决方案,Python 通过 PyBluez 库使得蓝牙通信的实现变得简单易行。本文将介绍 PyBluez 的基本使用方法,带您实现蓝牙设备的发现、连接以及数据传输。
## 什么是 PyBluez?
PyBluez 是一个 Python 模块,使得 Python 开发者能够利用蓝牙协议进行无线通信。它支持多种蓝牙协            
                
         
            
            
            
            # 如何使用filetype库在Python中实现文件类型判断
## 一、流程概述
首先我们来看一下整件事情的流程,可以用表格展示步骤:
```mermaid
gantt
    title 实现文件类型判断流程
    section 步骤
    获取文件路径       :a1, 2022-01-01, 1d
    判断文件类型       :a2, after a1, 1d            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-05-30 03:31:44
                            
                                133阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Python Hashmap 使用方法
在 Python 中,Hashmap 通常称为字典(Dictionary),是一种以键值对存储数据的容器。字典在查找和存储数据时具有很高的效率,时间复杂度平均为 O(1)。本文将介绍 Python 字典的基本使用方法,并通过示例代码加以说明。
## 创建字典
字典的创建非常简单,可以使用花括号 `{}` 或者 `dict()` 函数。以下是两种方法            
                
         
            
            
            
            由于近期突然想要搞一个跨平台的小项目,用于在手机与电脑上使用,所以在网上找了一些开发类似跨平台项目比较好的解决方案。而跟据Kivy官网上对其理念的说明,让我有了一些心动,所以就此写下自己在Kivy上的学习。既算是记笔记,也算是再次开始写博客的一个借口吧。Kivy是一套Python在UI上的框架。其主要用于现在越来越火的新型用户接口的开发。(新型用户接口指多点触控) Ki            
                
         
            
            
            
            # 使用Python cvxpy的方法指南
作为一名经验丰富的开发者,我将教导你如何使用Python库cvxpy来进行优化问题的求解。下面是整个流程的步骤表格:
| 步骤 | 描述 |
| ------ | ------ |
| 1 | 安装cvxpy库 |
| 2 | 导入cvxpy库 |
| 3 | 定义优化问题 |
| 4 | 添加约束条件 |
| 5 | 求解优化问题 |
首先,你需            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-06-20 04:16:07
                            
                                829阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            现在用JWT 加密太火了,怎么能不跟上潮流?否则销售都不好意思出去吹牛逼!PyJWT是一个Python库,用来编码/解码JWT(JSON Web Token)的1.定义:根据维基百科的定义,JSON WEB Token(JWT,读作 [/dʒɒt/]),是一种基于JSON的、用于在网络上声明某种主张的令牌(token)。JWT通常由三部分组成: 头信息(header), 消息体(payload)和            
                
         
            
            
            
            # Python Lock 使用方法
## 介绍
在编写多线程程序时,为了避免多个线程同时访问和修改共享资源而导致的数据不一致问题,我们需要使用线程锁(Lock)来保护共享资源的访问。
Python中的`threading`模块提供了Lock类,它是线程锁的一种实现方式。Lock对象有两种状态,分别是锁定(locked)和非锁定(unlocked)。一把锁一次只能被一个线程锁定,其他线程在锁            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-08-22 08:22:21
                            
                                462阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Python BERT 使用方法
BERT(Bidirectional Encoder Representations from Transformers)是一种预训练的自然语言处理模型,其能够有效理解上下文信息。通过深度学习,BERT 可以在众多的 NLP 任务中提升性能,例如情感分析、问答系统和命名实体识别等。本文将介绍如何在 Python 中使用 BERT,并提供相关的代码示例。
#            
                
         
            
            
            
            # Python Lucene使用方法
## 简介
Python Lucene是一个用于全文搜索的开源库。它是Java Lucene的Python绑定,提供了丰富的搜索功能和高效的索引机制。本文将介绍Python Lucene的使用方法,并通过代码示例展示其强大的搜索能力。
## 安装
在开始之前,我们需要先安装Python Lucene。可以通过以下命令使用pip安装:
```mark            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-07-24 03:40:34
                            
                                779阅读
                            
                                                                                    
                                1评论