昨天我们已经计算好了RSRS指标策略,今天把光大证券的研报复现一下。由于计算比较耗时,我们会把计算的中间结果的dataframe保存下来。我们使用hdf5保留数据结果,这里有一个小tip,有点奇怪。我使用put的时候,使用的key,在判断是否存在于store.keys()里,需要变成“/key”。 store = pd.HDFStore('cache.h5') key_to_store = 'ca
转载 2024-04-03 09:30:31
31阅读
# 网络爬虫简介及R语言中的应用 ## 1. 网络爬虫简介 网络爬虫是一种通过自动化程序来访问网页并提取其中信息的技术。它可以帮助用户获取大量的数据,从而进行数据分析、挖掘和应用。网页爬虫通常需要通过网络请求来获取页面内容,然后通过解析网页源代码来提取所需的信息。 ## 2. R语言中的rvest包 在R语言中,有一个非常强大的网络爬虫包叫做rvestrvest包提供了一系列函数来帮助用
原创 2024-04-30 04:23:11
121阅读
R语言数据分析 听课笔记第三部分搏术目录R语言数据分析 听课笔记第三部分搏术观数以形:一维数据作图茎叶图直方图小提琴图箱线图小提琴图 + 箱线图观数以形:二维数据作图观数以形:高维数据作图三维散点图脸谱图平行坐标图11章 相随相伴,谓之关联关联规则 I关联规则 II关联规则 III分类:既是世间法,自当有分别近邻法, k-最近邻分类算法R语言实现树模型(决策树) CART算法R语言实现随机森林算法
转载 2023-09-14 13:22:06
115阅读
一.基础知识首先载入tidyverse包# install.packages("tidyverse") library(tidyverse)这一行代码加载了tidyverse的核心R包。在几乎所有的数据分析任务中,你都会用到这些R包。这行代码还会告诉你tidyverse中的哪些函数与基础R包(或者已加载的其他R包)中的函数有冲突。本文使用r语言自带的数据框,mpg来操作1.绘制基础散点图:mpg
  R语言网络爬虫工具中比较常用的包有RCurl、XML、rvest等,本文以新浪财经频道A股交易数据的抓取为例简单总结一下rvest包的用法。install.packages('rvest') library(rvest)url <- 'http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_FuQuanMarketHistory/stoc
文章目录包检查可用R语言的包1. 获取包含R包的库位置2. 获取已安装的所有软件包列表3. 获取当前在R环境中加载的所有包4. 安装一个新的软件包有两种方法安装:5. 加载包到当前R环境6. 卸载包包R语言的包是R函数,编译代码和样本数据的集合。 它们存储在R语言环境中名为“library”的目录下。默认情况下,R语言在安装期间安装一组软件包。 随后添加更多包,当它们用于某些特定目的时。 当我们启
转载 2023-05-18 22:26:36
204阅读
R语言网络爬虫初学者指南(使用rvest包) 钱亦欣 发表于 今年 06-04 14:50 5228 阅读 R语言网络爬虫初学者指南(使用rvest包) R语言网络爬虫初学者指南(使用rvest包) 钱亦欣 发表于 今年 06-04 14:50 5228 阅读 作者 SAURAV KAUSHIK 译
转载 2017-10-28 20:46:00
717阅读
2评论
R语言利用rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。安装这个包:install....
原创 2021-07-13 13:50:27
578阅读
  R语言利用rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。 安装这个包:install.packages('rvest') read_html():下载网页; html_nodes():获得指定名称的网页元素、节点; html_text():获得指定名称的网页元素、节点里面的文本; html_at
原创 2021-07-29 14:18:52
563阅读
文章目录什么是“POSIX"POSIXct和POSIXlt的区别POSIXltPOSIXlt类的属性关于时区POSIXct有趣的实验更多参考 什么是“POSIX"  R语言中有两个时间类对象,POSIXct和POSIXlt。对于我这种非专业的人员来说,看到这个名称是懵的,不知道这是什么单词的首字母缩写。在网上搜了一下才知道。“POSIX”的全称为“Portable Operating Syste
转载 2023-08-04 20:46:11
67阅读
# R语言中的td包:数据分析新工具介绍 R语言作为一种强大的统计计算和图形绘制工具,广泛应用于数据分析、数据可视化和科学研究中。在众多的R包中,`td`包以其简洁易用的特性,成为了数据分析中不可或缺的工具之一。本文将介绍`td`包的基本功能和应用示例,让读者能够快速上手并利用该包处理数据。 ## 什么是td包? `td`包是一个用于进行高效数据操作和分析的R包。它提供了一系列函数,用于简化
原创 2024-09-12 06:37:38
45阅读
本课目标:编写代码用R爬取链家小区的数据 红框部分是我们要爬取的数据 一、打开爬虫环境并运行爬虫代码打开RSelenium(打开cmd并输入以下代码,注意chromedriver.exe和selenium-server-standalone要输入自己文件对于的路径)具体R环境配置参见第2课:R爬虫环境配置java -Dwebdriver.chrome.driver="C:U
读者可以不用看这段 (用python来编写脚本简化日常的运维工作是python的一个重要用途,在linux中,可以用ps,top,free这样的命令查看,在python中,获取系统信息的一个好办法就是psutil这个第三方模块,它是python的系统监控及进程的管理工具,是一个系统很强大的跨平台的系统管理库,目前psutil支持的系统有linux,window os X等) 爬虫一、request
分享一个大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到人工智能的队伍中来!点击浏览教程都说Python爬虫功能强大,其实遇到动态加载或者登陆网站Python还是很困难,对于大部分的一些普通爬虫,R语言还是很方便。这里介绍R语言rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。安...
原创 2021-07-08 17:41:57
2718阅读
分享一个大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到人工智能的队伍中来!点击浏览教程都说Python爬虫功能强大,其实遇到动态加载或者登陆网站Python还是很困难,对于大部分的一些普通爬虫,R语言还是很方便。这里介绍R语言rvest包爬虫,主要用到函数:read_html()、html_nodes()、html_text()和html_attrs()。安...
原创 2021-07-06 18:06:47
785阅读
对象的创建(五步)类加载检查虚拟机遇到一条 new 指令时,首先将去检查这个指令的参数是否能在常量池中定位到这个类的符号引用,并且检查这个符号引用代表的类是否已被加载过、解析和初始化过。如果没有,那必须先执行相应的类加载过程。分配内存根据java堆是否完整,分为两种:1,指针碰撞,标记-整理,复制2,空闲列表,标记-清除分配线程安全:1,CAS+失败重试: CAS 是乐观锁的一种实现方式
在处理“python 解析所有的td”问题时,涉及到从 HTML 中解析所有 `` 标签,并将其提取出来进行进一步的数据处理。这篇博文记录了整个解决过程,涵盖了环境准备、分步指南、配置详解、验证测试、排错指南和扩展应用。 ## 环境准备 在开始本项目之前,确保您的环境具备以下的软件和硬件要求。 ### 软硬件要求 - **操作系统**: Windows, macOS或Linux - **P
原创 6月前
42阅读
朋友让我用R语言的rvest库写一个通用的视频爬虫代码示例。首先,我需要回忆一下rvest库的主要功能,它主要是用来做网页抓取和解析的,类似于Python的BeautifulSoup。但是视频爬虫的话,可能需要处理动态加载的内容,或者找到视频的直链地址,这可能有点挑战性,但是总体来说还是需要点水平的。
原创 5月前
58阅读
从今天开始学爬虫,现在就来分享一个简单完整(具有启发意义)的实例吧。文章结构如下:爬虫问题描述requests库的使用beautifulsoup4库的使用爬取软科中国大学排名1 爬虫问题概述    爬虫即(常用Python)从各个网站/页提取用户感兴趣的各类数据,并做进一步的信息挖掘的程序。爬虫程序实现的步骤主要为:①通过网络链接获取网页内容;②对获取的网页内容进行处理,这俩步骤分别使用reque
## R语言Rvest包:Web数据抓取利器 在数据分析和机器学习中,数据是至关重要的。然而,获取和整理数据经常是一个费时费力的任务。为了解决这个问题,R语言提供了许多强大的包,其中之一是`rvest`包。这个包可以帮助我们从网页上抓取数据,并进行解析和处理。本文将介绍`rvest`包的基本用法,并提供一些实用的代码示例。 首先,我们需要安装`rvest`包。使用以下代码可以安装最新版本的`r
原创 2023-07-01 04:25:50
230阅读
  • 1
  • 2
  • 3
  • 4
  • 5