刚学完Python和爬虫,想实践一下,于是选定目标为这个学期使用的在线编程网站网站如图,要爬取的是第二部分,Python语言练习 **思路分析:** 课程看的是MOOC上北京理工大学嵩天老师的课程,这个网站与课程中给出的几个实例有所不同。该网站需要用异步XHR爬取。由于在爬取该网站的过程中没有涉及到对标签的解析,或者遍历,所以并不需要使用BeautifulSoup库,使用request库获取网页内
转载 2024-02-05 20:30:26
54阅读
文章目录1.轮廓发现1.1发现轮廓1.2绘制轮廓2.操作步骤2.1阈值法获取轮廓2.2使用Canny边缘检测获取轮廓完整代码 1.轮廓发现轮廓发现是基于图像边缘提取的基础寻找对象轮廓的方法,所以边缘提取的阈值选定会影响最终轮廓发现结果。1.1发现轮廓在此步骤中我们会使用到findContours这个API,其原型为:cv2.findContours(image, mode, method[, c
转载 2023-12-10 11:30:23
20阅读
.源码来源网络#!/usr/bin/env Python import time import sys if len(sys.argv) > 1: INTERFACE = sys.argv[1] else: INTERFACE = 'eth0' STATS = [] print 'Interface:',INTERFACE def rx():
转载 2023-07-03 21:15:27
92阅读
1. Cookie为什么要使用Cookie呢?Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib库保存我们登录的Cookie,然后再抓取其他页面就达到目的了。1.1 Opener当你获取一个URL你使用一个opener(一个ur
转载 2023-08-22 16:46:50
43阅读
psutil用Python来编写脚本简化日常的运维工作是Python的一个重要用途。在Linux下,有许多系统命令可以让我们时刻监控系统运行的状态,如ps,top,free等等。要获取这些系统信息,Python可以通过subprocess模块调用并获取结果。但这样做显得很麻烦,尤其是要写很多解析代码。在Python获取系统信息的另一个好办法是使用psutil这个第三方模块。顾名思义,psutil
(1)       控制浏览器①控制浏览器窗口大小set_window_size(宽,高)打开浏览器全屏maximize_window()②控制浏览器后退back()、前进forward()③模拟浏览器刷新refresh()(2)       简单元素操作①清除文本clear()
转载 2023-11-05 16:28:59
128阅读
经过一段时间的爬虫学习,结合自己所学的一些东西做一个小小的爬虫项目,写的不好的地方请见谅毕竟是菜鸟目标爬取豆瓣热门电视剧评分、名称、和连接并生成csv(可以用Excel打开)文件准备工作运行平台:windows10 IDE:PyCharm requests、json库(使用pip进行安装)第一步:分析要爬取的网页 进入豆瓣热门电视剧选项按下F12点击Network刷新一下 这时你会发现下面有许多东
#-*- coding:utf-8 -*- # author:Han #获取一个文件的路径 #python2.7.10 只支持英文目录,中文目录有待继续研究 import os def getAllPath(path,space = ''): #获取到所有的目录 filesList=os.listdir(path) for fileName in filesList:
转载 2023-06-26 11:24:54
158阅读
Python进行数据分析时,按照日期进行分组汇总也是被需要的,比如会找到销量的周期性规律。 那么在用Python进行数据统计之前,就需要额外增加一步:从指定的日期当中获取星期几。比如2022年2月22日,还正好是正月廿二星期二,于是乎这一天登记结婚的人特别多。本文就以2022-02-22为例,演示Python获取指定日期是“星期几”的6种方法!
获取内存信息 使用psutil获取物理内存和交换内存信息,分别使用: >>> psutil.virtual_memory() svmem(total=8589934592, available=2866520064, percent=66.6, used=7201386496, free=216178688, active=3342192640, inactive=2650341
转载 2023-07-02 17:15:07
130阅读
Python三种文件行数读取的方法:  #文件比较小 count = len(open(r"d:\lines_test.txt",'rU').readlines()) print count #文件比较大 count = -1 for count,line in enumerate(open(r"d:\lines_test.txt",'rU')): pass count += 1
前言大家早好、午好、晚好吖~环境使用]:Python 3.8Pycharm谷歌浏览器谷歌驱动模块使用]:requests >>> pip install requestsrejsonselenium >>> pip install selenium==3.141.0 <需要浏览器和浏览器驱动>工具、软件安装教程 点击 蓝色字体 自取 ,我都放在这里了
一、利用thinter库import tkinter as tk root = tk.Tk() print(root.winfo_screenwidth()) print(root.winfo_screenheight()) root.destroy() 标准库不用pip install这段代码的运行测试:E:\py>python tp2.py 1920 1080 
转载 2023-06-19 15:32:16
175阅读
os.path.abspath()os.path.abspath() : 获取文件或目录的绝对路径 print(os.path.abspath('./')) C:\Users\###\Desktop\myproject\data print(os.path.abspath('aa.ini')) C:\Users\###\Desktop\myproject
转载 2023-06-19 17:40:41
101阅读
方法一:一般情况下使用socket.gethostbyname()的方式就可以获取本机IP地址,不排除偶尔的时候获取不到(比如没有正确设置主机名称),示例代码如下:复制代码 import socket获取本计算机的名称 hostname = socket.gethostname() 获取本计算机IP ip = socket.gethostbyname(hostname) print(ip) 复制代
#!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 import re u = urllib2.urlopen('http://zhangzhipeng2023.cn/ip.txt') r = u.readlines() result = 'result_ip_address' with file(result,'w')as
转载 2023-06-14 15:27:14
74阅读
Python Tkinter Entry 属性和方法介绍1. Entry1.1标准属性1.2方法2. Entry属性和方法说明程序2.1 窗口代码2.2 属性和方法代码 1. EntryEntry提供了用户输入内容的功能,也可以作为显示使用。Entry的属性有:1.1标准属性background, bd, bg, borderwidth, cursor, exportselect
 import socket import fcntl import struct def get_ip_address(ifname): s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) inet = fcntl.ioctl(s.fileno(), 0x8915, struct.pack('256s', b
转载 2023-07-03 22:47:55
220阅读
Python获取秒级时间戳与毫秒级时间戳方法import time import datetime current_time = time.time() print (current_time) #原始时间数据 >>> 1515036769.15 print (int(current_time)) #秒
搞技术的大都比较纯粹,比较实在,除了工资之外基本就没有别的收入了(少部分人能接外包赚外块)。或许是迫于生活的压力,或许是不甘于固定的工资,或许是出于技术人骨子里的好奇,亦或是这几年关于理财投资的大力宣传、门槛降低,理财越来越被我们所接受,并开始尝试股票、基金、P2P、XX宝等各种理财产品,本文所讲与P2P有关,但不打广告,只讲技术,顺便说明:投资有风险,理财需谨慎,我们赚钱不容易,不能给打了水漂。
  • 1
  • 2
  • 3
  • 4
  • 5