目录一、实验(实训)目的二、实验(实训)原理或方法三、仪器设备、材料四、实验(实训)步骤五、实训记录及结果<----------------------------------------------------------------------------------------------------------------------->一、实验(实训)目的 &nbs
看了好几个园子里的朋友的回复,觉得有不少朋友对BI和数据仓库的概念还没有一个比较完整的了解。不过能够来到这里作客真的非常欢迎。1.《数据仓库》W.H.Inmon著,王志海 等译(注:这本书可以说是我的入门书,堪称经典,就是比较枯燥)2.《数据仓库设计》Claudia Imhoff,Nicholas Galemmo,Jonathan G.Geiger著,于戈,鲍玉斌,王大玲 等译(注:感觉不错的一本
转载 2024-01-08 13:09:52
75阅读
# 使用 Python 通过豆瓣 API 获取书籍数据 在这篇文章中,我们将学习如何使用 Python 通过豆瓣 API 获取书籍数据。整个过程将从申请 API 到获取数据并进行可视化分析。下面我将列出整个流程以及每一步的详细解释和代码实现。 ## 流程概述 | 步骤 | 描述 | |-------|-----------------
原创 8月前
688阅读
文章目录前言一、数组的定义和访问1.1 容器概述1.2 数组概念1.3 数组的定义1.4 数组的初始化1.5 数组的访问二、数组原理内存图2.1 内存概述2.2 Java虚拟机的内存划分2.3 数组在内存中的存储一个数组内存图两个数组内存图两个变量指向一个数组三、数组操作的常见问题3.1 数组越界异常3.2 数组空指针异常四、数组练习4.1 数组遍历4.2 数组获取最值4.3 数组翻转五、IDE
文章目录第一章 MongoDB 简介1 易于使用2 易于扩展3 功能丰富4 性能卓越第二章 MongoDB 基础知识1 文档2 集合3 数据库4 MongoDB shell5 数据类型第三章 创建、更新和删除文档1 插入并保存文档2 删除3 更新4 写入安全机制第四章 查询1 find 使用2 查询条件3 特殊类型查询4 $where 查询5 游标 第一章 MongoDB 简介1 易于使用面向文
转载 2023-11-11 20:03:27
54阅读
文章目录1、列表的查询2、列表的增加3、列表中的删除4、列表的修改5、列表遍历6、列表的嵌套7、元组的定义8、元组的相关操作9、字典的定义10、字典的增加11、字典的删除12、字典的修改13、字典的查询14、字典的遍历15、集合的定义16、集合的相关操作 1、列表的查询index:从左至右查询元素在列表中所处的位置,如果查询到该元素返回其第一次出现所在位置的正向下标,如果不存在则报错count:
Python爬虫(5):豆瓣读书练手爬虫 我们在之前的文章中基本上掌握了Python爬虫的原理和方法,不知道大家有没有练习呢。今天我就来找一个简单的网页进行爬取,就当是给之前的兵书做一个实践。不然不就是纸上谈兵的赵括了吗。好了,我们这次的目标是豆瓣图书Top250,地址是:https://book.douban.com/top250?start=0准备爬一个网页我们至少要知道自己需要什么
Scrapy官方介绍是An open source and collaborative framework for extracting the data you need from websites.In a fast, simple, yet extensible way.意思就是一个开源和协作框架,用于以快速,简单,可扩展的方式从网站中提取所需的数据。 环境准备本文项目使用环境及工
转载 2024-08-17 11:23:52
163阅读
在今天的博文中,我们来聊聊“大数据分析豆瓣电影数据分析”的过程。我将带你一步步走过从环境预检到迁移指南的整个流程,希望对你有帮助。 ## 环境预检 首先,我们要对我们的环境进行预检。合理的硬件和软件配置是成功的基础。以下是我们需要的系统要求: | 组件 | 最低配置 | 推荐配置 | | ----------- | ----------
# 根据ISBN获取豆瓣书籍信息的Python实现指南 在现代的数字时代,获取书籍信息的方式变得愈加便捷。今天,我们将学习如何使用Python编程语言,根据ISBN(国际标准书号)从豆瓣获取书籍信息。以下是我们将要深入探讨的步骤: ## 流程概述 | 步骤 | 描述 | |------|-------------
原创 7月前
243阅读
https://book.douban.com/top250 判断是不是“ 出版年:” //*[@id="info"]//span[@class="pl"]/text() 因为id="info"里面的span有嵌套的span,所以: 2个//的含义: bookstore//book 选择属于 boo
转载 2017-12-01 10:58:00
139阅读
2评论
主要实现了从豆瓣获取想读的书信息,并将信息存放到excel表格中。
原创 2023-02-15 15:44:27
570阅读
今天就和大家分享一本牛逼的Git书籍——《Pro Git》本书在豆瓣上评价极高,9.3的高分,本书的作者是GitHub的员工,内容主要侧重于各种场合中的惯用法和底层原理的讲述,书中还针对不...
转载 2021-08-30 14:05:13
753阅读
因为工作需要需要做一些与大数据开发有关的工作,加之网上的知识过于分散,经常往图书馆跑。看了很多与数据相关的书籍,认为以下基本比较不,错推荐给大家。因为本人接触大数据不足一年,肯定会有一些错误的观念,有错误的地方欢迎在文章下方的评论中评论。1、《解惑大数据 》人民邮电出版社, 2013,丁圣勇,樊勇兵,闵世武编著。此书综合讲解有关大数据的相关术语和概念,看此书的技术要求较低,非常适合想学习
原创 2016-11-20 17:36:20
10000+阅读
最近因为业务需要,要将豆瓣上的图书以及影视信息抓取下来,网页抓取其实很简单,很快就完成,但是系统还没上线就发现了问题,豆瓣会根据请求分析客户的行为,判断是否是机器人,如果判断为机器人,将要求输入验证码,最终导致抓取不到数据。要解决这个问题,主要就两个思路,一个是识别验证码,当要求输入验证码时,识别图片中的验证码;另外一方案是伪装成正常访问,绕过豆瓣的分析程序。前一种方案受限于验证码识别率太低,很难
讲实话,要看书只能看看架构师思维相关的数据,开拓一下思路就行,看看别人的看法和观念。架构师需要积累的技术不要从书上来,去官网看他的说明书,一切纯讲技术类的书籍都有滞后性。正在用的技术要时常关注一下他官网爆出的问题及版本差异,尤其是bugfix。简单推荐几本: 《亿级流量网站架构核心技术》书总结并梳理了亿级流量网站高可用和高并发原则,通过实例详细介绍了如何落地这些原则。本书分为四部分:概述
学习大数据并不是一蹴而就的事情,及时工作多年的开发工程师都需要不断的补充新鲜的知识内容。目前学习大数据知识可以通过视频和图书两种方式学习,视频的优势在于能够将老师的个人开发经验传授给学习者,而图书的优势在于能够随时翻阅,内容比较丰富。这里为大家零基础学习大数据的8本经典图书,希望同学们能够通过不同的学习途径充分掌握大数据开发技能。1、大数据时代   《大数据时代》是国外大数据系统研究的先河之作
利用爬虫获取豆瓣上可能喜欢的书籍 标签: 爬虫 Python 1.目标 博主比較喜欢看书,购物车里面会放很多书,然后等打折的时候开个大招。然而会遇到一个问题,就是不知道什么书是好书,不知道一本书究竟好不好,所以经常会去豆瓣读书看看有什么好书推荐,只是这样效率比較低。近期学习了爬虫的基础知识。有点手痒
转载 2017-07-31 09:41:00
67阅读
2评论
除了基础知识外,一些碎片化的场景也是需要我们去学习进阶的,今天给大家推荐一些适合前端开发学习的书籍,包含:CSS、HTML、JS、框架、Node.js、TypeScript、设计模式、计算机网络、数据结构与算法、计算机基础系列无论是自学前端还是想要进阶的前端从业者,都可以了解到适合自己的知识。大家可根据自己的需求以及基础去选择阅读。CSS推荐1. CSS 世界、CSS 新世界CSS世界三部曲(《C
转载 2023-08-30 23:01:15
88阅读
# 豆瓣Top250大数据可视化教程 ## 1. 整体流程 以下是实现豆瓣Top250大数据可视化的整体流程: | 步骤 | 描述 | | ---- | ---- | | 1. 数据抓取 | 使用Python编写爬虫程序,从豆瓣网站抓取Top250电影数据 | | 2. 数据清洗 | 对抓取到的数据进行清洗,过滤掉无用信息 | | 3. 数据存储 | 将清洗后的数据存储到数据库中 | | 4
原创 2023-08-10 03:53:41
174阅读
  • 1
  • 2
  • 3
  • 4
  • 5