客户端代码import socket #网路编程模块 import struct #把2的32次方的位的正反数组封装成4个字节的模块 sk=socket.socket() #创建对象 import os sk.connect(("127.0.0.1",80))#连接服务端 filepath="./SQLyog.7z" #路径 ll=os.path.getsize(filepath)#得到文件的总
转载 1天前
12阅读
requests库虽然Python的标准库中 urllib模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests宣传是 “HTTP for Humans”,说明使用更简洁方便。安装和文档地址:利用pip可以非常方便的安装:pip install requests中文文档:http://docs.python-requests.org/zh_CN/la
整型 int 与浮点型 float整型也叫做整数型,在python3里属于数字类型的一种,另一种数字类型是浮点型 float.整型其实也就是数学概念里整数的概念了,比如 10,20,-10,0浮点型就是带小数的数字类型,比如 0.3,-5.2,3.141592653对于数字类型目前学到的内容不多,常用的可能会用到数学运算,如下表所示:算数运算符:假设变量: a=10, b=20运算符描述实例+加-
 1、检查robots.txt让爬虫了解爬取该网站时存在哪些限制。最小化爬虫被封禁的可能,而且还能发现和网站结构相关的线索。 2、检查网站地图(robots.txt文件中发现的Sitemap文件)帮助爬虫定位网站最新的内容,而无须爬取每一个网页。网站地图提供了所有网页的链接,我们仍需对其谨慎处理,因为该文件经常存在缺失、过期或者不完整的问题。 3、估算网站大小爬取效率
转载 11天前
13阅读
正则表达式实际上爬虫一共就四个主要步骤:明确目标(要知道你准备在哪个范围或者网站去搜索)爬(将所有的网站的内容全部爬下来)取(去掉对我们没用处的数据)处理数据(按照我们想要的方式存储和使用)正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式匹配规则re模块一般使用步骤使用compile()函数将正则表达式的字符串形式编译为一个Pattern对象注意:re对特
原创 2020-04-13 20:37:54
868阅读
Retrieving Data over HTTP Python 内置了 sockets 可以实现与网络连接并通过 Python 提取数据的功能。 socket 是可以提供双向连接的,我们可以对同一个 socket 进行读写操作。比方说,A 对 socket 写入信息,并且将其发送给 socket ...
转载 2021-04-10 22:36:56
85阅读
2评论
​(Artificial Neural Network,ANN)人工神经网络模型,以数学和物理的方法对人脑神经网络进行简化、抽象和模拟。​​本次只是一个简单的神经网络入门,涉及神经元模型和BP神经网络。​​这里简单了解一下机器学习的三要素,分别是模型、策略与算法。​​​模型​包括非随机效应部分(被解释变量和解释变量之间的关系,多为函数关系)和随机效应部分(扰动项)。​​​策略​是指如何设定最优化的
转载 2022-03-16 15:38:48
127阅读
    网络数据获取(爬取)分为两部分:1、抓取(抓取网页)· urlib内建模块,特别是urlib.request· Requests第三方库(中小型网络爬虫的开发)· Scrapy框架(大型网络爬虫的开发)2、解析(解析网页内容)· BeautifulSoup库· re模块(正则表达式)或者第三方API抓取和解析。   Requests库(ht
(Artificial Neural Network,ANN)人工神经网络模型,以数学和物理的方法对人脑神经网络进行简化、抽象和模拟。本次只是一个简单的神经网络入门,涉及神经元模型和BP神经网络。这里简单了解一下机器学习的三要素,分别是模型、策略与算法。模型包括非随机效应部分(被解释变量和解释变量之间的关系,多为函数关系)和随机效应部分(扰动项)。策略是指如何设定最优化的目标函数,常见的目标函数有
原创 2020-12-24 16:14:24
180阅读
(Artificial Neural Network,ANN)人工神经网络模型,以数学和物理的方法对人脑神经网络进行简化、抽象和模拟。本次只是一个简单的神经网络入门,涉及神经元模型和BP神经网络。这里简单了解一下机器学习的三要素,分别是模型、策略与算法。模型包括非随机效应部分(被解释变量和解释变量之间的关系,多为函数关系)和随机效应部分(扰动项)。策略是指如何设定最优化的目标函数,常见的目标函数有
原创 2021-01-19 14:50:05
421阅读
本书简介:本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。 
转载 2021-02-04 12:45:04
108阅读
2评论
Retrieving Data over HTTP Python 内置了 sockets 可以实现与网络连接并通过 Python 提取数据的功能。 socket 是可以提供双向连接的,我们可以对同一个 socket 进行读写操作。比方说,A 对 socket 写入信息,并且将其发送给 socket ...
转载 2021-04-28 21:43:33
156阅读
2评论
对于Python语言来说,一个较为擅长的领域就是网络数据采集,实现网络数据采集的程序通常称之为网络爬虫或蜘蛛程序。
原创 2021-05-24 10:50:56
143阅读
(Artificial Neural Network,ANN)人工神经网络模型
转载 2022-03-16 15:37:09
90阅读
Python给人的印象是抓取网页非常方便,提供这种生产力的,主要依靠的就是urllib、requests这两个模块。网络数据采集之urlliburllib库官方文档地址:https://docs.python.org/3/library/urllib.htmlurllib库是python的内置HTTP请求库,包含以下各个模块内容:(1)urllib.request:请求模块(2)urllib.er
原创 2020-04-13 20:12:30
1070阅读
创建一个udp客户端程序的流程是简单,具体步骤如下:创建客户端套接字发送/接收数据关闭套接字代码如下:#coding=utf-8from socket import *#1. 创建套接字udpSocket = socket(AF_INET, SOCK_DGRAM)#2. 准备接收方的地址sendAddr = ('192.168.1.103', 8080)#3. ...
原创 2021-07-07 10:20:52
92阅读
场景在实践机器学习算法过程中,有的数据源可以通过网络获取。于是,想利用Python代。文章涵盖以下3方面内容:
创建一个udp客户端程序的流程是简单,具体步骤如下:创建客户端套接字发送/接收数据关闭套接字代码如下
原创 2022-03-23 17:47:00
60阅读
上一篇说完了如何爬取一个网页,以及爬取中可能遇到的几个问题。那么接下来我们就需要对已经爬取下来的网页进行解析,从中提取出我们想要的数据。 根据爬取下来的数据,我们需要写不同的解析方式,最常见的一般都是HTML数据,也就是网页的源码,还有一些可能是Json数据,Json数据是一种轻量级的数据交换格式,
原创 2021-06-04 19:10:41
176阅读
  • 1
  • 2
  • 3
  • 4
  • 5