快速寻找文件
根据文件名字匹配, 根据文件内容匹配            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-03 17:24:24
                            
                                99阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            介绍     接上篇,【搜索引擎(五)】局部敏感哈希,本篇介绍的也是一个不精确的算法,用来不精确地排除重复元素。    利用布隆过滤器,可以大大降低排重的时间。但是在实际中它的作用有限,还要结合其他的技巧才能达到较好的效果。另外,它本身不作为索引,如果不加处理地加以使用,在搜索引擎的快响应(小于1s)的目标中就不能扮演            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-17 22:42:31
                            
                                64阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文件—>首选项—>设置。点击打开settings.json文件,输入一下内容即可。{    "search.exclude": {                "**/node_modules": true,        "**/bower_components": true,        "build/": true,        "temp/": t...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-04-24 11:37:12
                            
                                4495阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            列表对比Linux系统下常用压缩与解压缩命令的区别压缩命令特点解压缩命令zip可压缩目录,不删除原文件unzipgzip删除原文件,可指定压缩比gunzipbzip2删除源文件bunzip2xz压缩比更大unxztar命令的语法与常用选项有哪些?各选项的作用是什么?语法:tar 选项 打包后的名字 打包的文件或目录
常用选项:
	-c:创建打包文件
	-f:指定打包名
	-v:显示打包过程
	-            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-09-21 23:18:05
                            
                                128阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            
   一、安装及配置 
  推荐下载 
      wget http://fossies.org/unix/misc/pure-ftpd-1.0.34.tar.gz 
  下载phpweb管理组件 
      wget http://www.yiyou.org/docs/PureAdmin_03_php/PureAdmin-0.3.            
                
         
            
            
            
            Gnu awk作者在FreeBSD邮件列表中回答”GNU grep为什么比BSD grep要快“,提到了用到了Boyer-Moore算法,虽然不知道是什么,但感觉很厉害的样子~我猜想grep有多快呢?所以想比较下下python,sed与grep:测试文本:20w行,21M大python普通正则匹配:复制代码代码如下:#!/usr/bin/python3
import re
f=open('/tmp            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-30 21:36:11
                            
                                92阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1. 在当前目录下查找所有txt后缀文件# find ./ -name "*.txt" 2.在当前目录下的dir0目录及子目录下查找txt后缀文件# find ./ -path "./dir0*" -name "*.txt" 3.在当前目录下的dir0目录下的子目录dir00及其子目录下查找txt后缀文件# find ./ -path "*dir00*" -name "*.txt" 4.在除dir            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-03-12 22:20:18
                            
                                678阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            文件过滤简介定义:文件过滤是一种根据文件类型对文件进行过滤的安全机制。文件过滤功能可以降低机密信息泄露和病毒文件进入公司内部网络的风险,还可以阻止占用带宽和影响员工工作效率的文件传输。目的:机密信息和病毒往往存在于特定的文件类型中,例如机密信息一般保存在文档文件中,病毒信息一般附着在可执行文件中。因此文件过滤通过阻断特定类型文件的传输,可以降低机密信息泄露和内网感染病毒的风险。如果想进一步降低机密            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-25 15:29:19
                            
                                3阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ## Python 过滤文件
在进行文件处理时,我们常常需要对文件进行过滤,即根据一定的条件筛选出需要的文件。Python提供了丰富的工具和库来实现文件过滤的功能,本文将介绍一些常用的方法和技巧。
### 使用 `os` 模块过滤文件
Python的 `os` 模块提供了一系列用于文件和目录处理的函数。其中,`os.listdir()` 函数可以列出指定目录中的所有文件和子目录。我们可以使用            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-08-21 05:52:52
                            
                                665阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Python读写文件及过滤            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-05 12:48:12
                            
                                112阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            本文实例讲述了python实现搜索本地文件信息写入文件的方法。分享给大家供大家参考,具体如下:主要功能:在指定的盘符,如D盘,搜索出与用户给定后缀名(如:jpg,png)相关的文件,然后把搜索出来的信息(相关文件的绝对路径),存放到用户指定的文件(如果文件不存在,则建立相应的文件)中先卡看运行效果吧:运行效果的前部分:运行效果的后部分:写入信息后的文件:代码部分:#在指定的盘符,如D盘,搜索出与用            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-15 14:59:02
                            
                                79阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            学习不断,进步不止。本次,我跟着视频学习的是使用requests抓取猫眼top100榜单内容,并写入到文件。首先,这是一个简单的抓取内容,抓取的是静态网页,不涉及js的渲染,难度较低。跟着学,有以下几点精益和收获。也有几点需要指出的。模块化思维抓一条,写一条,循环。(之前一直是,抓完,再一次性写入。这样对内存的占用会比较大)正则表达式yield用法requests的异常处理。(之前最多判断一下状态            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-13 12:35:34
                            
                                60阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            本节书摘来自异步社区《Python Cookbook(第2版)中文版》一书中的第1章,第1.10节,作者[美]Alex Martelli , Anna Martelli Ravenscrof , David Ascher ,高铁军 译,更多章节内容可以访问云栖社区“异步社区”公众号查看。1.10 过滤字符串中不属于指定集合的字符任务给定一个需要保留的字符的集合,构建一个过滤函数,并可将其应用于任何            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-27 13:35:43
                            
                                30阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            body: <!-- 列表过滤 --> <div class=""> <!-- 模糊查询 --> <input type="text"            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-02-26 09:59:12
                            
                                90阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文实例讲述了Python实现的本地文件搜索功能。,具体如下:
偶尔需要搜索指定文件,不想每次都在windows下面去搜索,想用代码来实现搜索,而且能够收集搜索结果,于是有了下面的代码。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-03 09:52:36
                            
                                126阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            '''
    #利用python查找word文档中的关键词,支持多个文档和多个关键词
'''
# 导入所需库
import os,re
from docx import Document
global ur
ur = "D:/test_doc" #全局变量读取输入路径
# key_word = '模糊查询' #全局变量读取关键字
def get_doc_path (path) :            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-01 01:37:59
                            
                                231阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            图片是Word的一种特殊内容,这篇文章主要内容是如何利用python-docx批量提取Word中的图片,以及如何在Word国插入图片。1.提取Word中的图片并保护成指定格式docx好像并没有直接获取图片的方法,网上的资料也很少,有用的资料我就找到这一篇:如何从pythondocx段中获取图像(Inlineshape)说实话,这篇文章我看的不是太懂,而且这个方法只能获得内联的图片,什么是内联的图片            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-05 15:21:15
                            
                                79阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            代码布局有的时候框架给的过滤器不够用,需要自定义一些过滤器,所以就需要我们自己来定义一些过滤器等自定义代码放置的路径某个app特用(独有)的 - app 目录下的 templatetags文件夹内(文件夹内需要有__init__.py文件)公用的 - 再创建一个新的app,然后在新的app中创建templatetags(固定的单词写法)文件夹,但是需要在setting文件中的INSTALL_APP            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-28 17:54:07
                            
                                23阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            原标题:「每日一练」巧用Python对字符串进行筛选无论是哪一门语言,都会经常用到正则表达式,无论是网络爬虫,还是数据处理等都经常会用到数据匹配,那么你会在Python中用正则表达式对字符串进行筛选吗?往下看,就是这么简单!案例a = "not 404 found 5.6 张三 99 深圳",每个词中间是空格,用正则过滤掉英文和数字,最终输出"张三 深圳"先上代码~运行效果题目详述第一行:impo            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-27 18:35:38
                            
                                55阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 过滤器(filter),filter有两个形参,第一个参数返回一个布尔值,
# 如果返回True则当前迭代值会被选中,否则不选
a = [1, 2, -3, -4, 5, 0.3, -5, 0]
print('element in a list:')
print(a)
#选择大于0的元素
a = list(filter(lambda x: x > 0, a))
print('eleme            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-26 16:33:47
                            
                                122阅读