热门 最新 精选 话题 上榜
脸谱图和星图类似,但它却比星图可以表示更多的数据维度。用脸谱来分析多维度数据,即将P个维度的数据用人脸部位的形状或大小来表征。脸谱图在平面上能够形象的表示多维度数据并给人以直观的印象,可帮助使用者形象记忆分析结果,提高判断能力,加快分析速度。目前已应用于多地域经济战略指标数据分析,空间数据可视化等领域。       脸谱图一般采用15个指标,各指标代表的面部
简单线性:用一个量化验的解释变量预测一个量化的响应变量多项式:用一个量化的解决变量预测一个量化的响应变量,模型的关系是n阶多项式多元线性:用两个或多个量化的解释变量预测一个量化的响应变量多变量:用一个或多个解释变量预测多个响应变量Logistic:用一个或多个解释变量预测一个类别型响应变量泊松:用一个或多个解释变量预测一个代表频数的响应变量Cox比例风险:用一个或多个解释变量预测一个事件发生的时间
基本 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 seq,from:to,sequence:等差序列 rep:重复 NA:缺失值 NULL:空对象 sort,order,unique,rev:排序 unlis
爬虫,我的简单理解就是通过写定的程序,利用计算机的高速的优势,批量高效的获取数据的一种机制。通常我们访问网站是通过浏览器,而爬虫就是通过程序访问网站,也就是让程序伪装成浏览器进行访问。 Request伪装浏览器发送请求应用实例import requests res = requests.get( print(res.url) # print(res.text) # 查看整个网页(h
“让代码看起来更舒服”,看到这个标题,也许你会条件反射地以为我要讲“重构”或者“编码规范”等等。噢,可爱的开发人员,我们暂且不谈技术,只谈体验。让我们来装扮一下每天都要面对的Visual Studio,让代码看起来更舒服。 下图展示了Visual Studio 2008默认的编辑器,为了让代码更加容易辨识,Visual Studio用不同的颜色将各种关键词区分开来。默认的配色方案固然无可
机器学习中的一些方法如决策树,随机森林,SVM,神经网络由于对数据没有分布的假定等普通线性回归模型的一些约束,预测效果也比较不错,交叉验证结果也能被接受。下面以R中lars包包含数据集diabetes为例说明机器学习中的回归方法。 一、数据集及交叉验证办法描述    Diabetes数据集包含在R的lars包中,数据分为x,y,x2三个部分,因变量为y,数据是关于糖尿病的血液化
算法四:支持向量机       说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,个人感觉再怎么写也不可能写得比他更好的了。这也正如青莲居士见到崔颢的黄鹤楼后也只能叹“此处有景道不得”。不过我还是打算写写SVM的基本想法与libSVM中R的接口。一、SVM的想法       回到我们最开始讨论的KNN算法
[root@controller ~]# vim /etc/httpd/conf/httpd.conf ServerName controller #修改主机名* 创建/usr/share/keystone/wsgi-keystone.conf文件的软链接ln -s /usr/share/keystone/wsgi-keystone.conf /etc/httpd/conf.d/ * 启动Apa
近年来, 我参加了几次R培训的授课,也接触了不少R初学者。看到很多人对R很感兴趣,但学习起来却不得门道,着实着急。今天,我讲述自己如何学习R的一些个人体会,供R初学者参考。首先,根据我个人学R的经历,参加培训不是学R必须的,另外,如果您曾参加过R培训,却未习得学R的方法,那么培训就浪费了!开篇之前,我想讲讲自己是如何接触R以及中国人民大学吴喜之老先生与R的故事。1、我最早接触R是2012年在澳洲访
R中read.table详解 source:http://wnfdsfy.diandian.com/post/2011-10-17/5856100R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX pl
框架页有Frame、Iframe、Frameset 3个标记,初学者容易将三者混淆,下面分别讲解三者的区别。10.4.1  Frameset与Frame的区别首先讲解Frameset与Frame之间的区别。<Frameset></Frameset>用来划分框架,每一个框架由<Frame></Frame>标记。<Frame>&lt
2月前
394阅读
平常搜索文件一般会直接这样搜,不过如果文件太多的话会很慢,而且没法搜索文件内容。 这里分享几个好用的文件搜索工具。EverythingEverything是一个免费Windows桌面搜索引擎,可以在NTFS卷上快速地根据名称查找文件和目录 https://www.voidtools.com/zh-cn/比如搜索 WeChat 很快找到对应文件。 搜索中文也一
逻辑回归也称作logistic回归分析,是一种广义的线性回归分析模型,属于机器学习中的监督学习。其推导过程与计算方式类似于回归的过程,但实际上主要是用来解决二分类问题(也可以解决多分类问题)。通过给定的n组数据(训练集)来训练模型,并在训练结束后对给定的一组或多组数据(测试集)进行分类。其中每一组数据都是由p 个指标构成。--从别人那里搬运来的(1)逻辑回归所处理的数据逻辑回归进行分类给数据来判断
很多朋友会问我:趋势线该怎么画?怎么样使用?趋势线在交易中属于使用比较频繁的技术指标;今天这篇文章主要讲怎么在MT4上画趋势线。MT4软件是99%的外汇交易者在使用的交易软件。这个软件的功能、便利性都要比国内的文华财经和博弈大师更好。趋势线是技术分析简单的技术指标之一,画趋势线的目的是为了进行价格分析,找到价格在未来的运行支撑或阻力,用以做出交易的决策。文章较长,建议收藏阅读,如果觉得有收获,可以
ridge regression可以用来处理下面两类问题:一是数据点少于变量个数;二是变量间存在共线性。当变量间存在共线性的时候,最小二乘回归得到的系数不稳定,方差很大。这是因为系数矩阵X与它的转置矩阵相乘得到的矩阵不能求得其逆矩阵,而ridge regression通过引入参数lambda,使得该问题得到解决。在R语言中,MASS包中的函数lm.ridge()可以很方便的完成
自适应过滤法 目录 [隐藏]1自适应过滤法概述 2自适应过滤法的预测公式 3自适应过滤法优点 4自适应过滤法的应用 [ 编辑] 自适应过滤法概述   在进行生产预测时,常用到的移动平均法存在如下一些问题:对于简单移动平均数所取移动期限n的不同,其预测结果也不同。为了使预测准确,必须选择最优权数,但是时间数列是逐期变化的,欲最优,也必须依据预测值和实际观
目录目录目录前言(一)牛顿迭代法的分析1.定义2.条件3.思想4.误差(二)代码实现1.算法流程图2.源代码feval()函数float_num()函数牛顿迭代法(三)案例演示1.求解:\(f(x)=x^3-x-1=0\)2.求解:\(f(x)=x^2-115=0\)3.求解:\(f(x)=x^3-x^2-x+1\)4.求解:\(f(x)=x^4-4x^2+4=0\)作者:Mark日期:2019/
一、方差(variance):衡量随机变量或一组数据时离散程度的度量。                                概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。 统计中的方差(样本
上一次笔记刚刚谈过多元正态分布检验的STATA操作,方法相对单一,本次笔记继续这个这个话题,这次换用R。不是说R是靠程序命令来完成操作的吗?是的,不妨先来一段感受一下:setwd("D:/Temp") library(foreign) multivnorm <- read.dta("Multivariate.dta") U <-t(multivnorm[3:4]) library(mv
按语:当数据含有离群点(Outliar)或者强影响点(influential observation)时,稳健回归(Robust Regression)会比普通最小二乘法(OLS)的表现要更优异。稳健回归也可以用来检测数据中的强影响点。 提示: 本文旨在介绍与稳健回归相关的R命令,因此,并未全面覆盖稳健回归的相关知识,也不涉及数据清洗、数据检测、模型假设和模型诊断
32、人口金字塔33、漏斗图34、箱纸图32、人口金字塔人口金字塔在本质上是一堆条形图 人口金字塔是一种特殊的旋风图步骤:①创建“年龄”计算字段:右击空白->创建计算字段 新建完成的年龄在度量内是错误的,我们需要把它拖到维度内。展示:年龄->行,Counts->文本 这时完美解决此数据源数据为NULL的问题。②创建年龄数据桶(间隔10)和创建2个字段(为金字塔两边“男”“女”)
文章目录第一章测试题第二章测试题第三章测试题第四章测试题第五章测试题第六章测试题第七章测试题第八章测试题第九章测试题第十章测试题第十一章测试题第十二章测试题第十三章测试题 第一章测试题1.下面哪种统计软件是免费、开源的第二章测试题第三章测试题第四章测试题第五章测试题第六章测试题第七章测试题第八章测试题第九章测试题第十章测试题第十一章测试题第十二章测试题第十三章测试题
王老师管理咨询-消除企业浪费,为客户提高第三方企业咨询服务和落地改善方案。四象限工作分析法的由来:波士顿咨询集团法(又称波士顿矩阵、四象限分析法、产品系列结构管理法等)是由美国大型商业咨询公司——波士顿咨询集团(Boston Consulting Group)首创的一种规划企业产品组合的方法。 第Ⅰ象限:既紧急又重要的事项紧急是指必须马上做的事项;重要是指对公司、部门或者个人有重大影响
算法优势:适用于绝大多数的数据类型,简洁和快速算法劣势:需要知道准确的 k 值,并且不能处理异形簇,比如球形簇,不同尺寸及密度的簇,环形簇等。一、分析目标以数据集字段进行客户分群二、流程数据获取,毕业年份、性别、年龄、交友数量、关注的热点词(原本是一个list是否关注了这些运动或者热点词,已经以哑变量展开)数据探索确认数据结构:整体都是数值型的,1、性别是分类变量,这样的话该变量不能被K
常见分布统计学中有很多常见的分布,在此对这些分布进行梳理。离散型随机变量分布1.离散型均匀分布若随机变量有n个不同值,具有相同概率,则我们称之为离散均匀分布,通常发生在我们不确定各种情况发生的机会,且认为每个机会都相等,例如:投掷骰子等.离散型均匀分布离散型均匀分布-维基百科2.两点分布/伯努利分布伯努利分布是二项分布在n=1时的特例。一次随机试验,成功概率为p,失败概率为q=1-p。伯努利分布3
R 各种文档查询R Package Documentation (rdrr.io)1 MARS方法earth function - RDocumentationMultivariate Adaptive Regression Splines (sonic.net)理论回归算法 - 多元自适应回归(MARS) - 《Deeplearning Algorithms Tutorial(深度学习算法教程)
CART树:该树的生成就是递归的构建二叉决策树的过程,对回归树用平方误差最小化准则,对分类树用gini指数最小化准则,进行特征选择,生成二叉树。(1)回归树假设X和Y分别为输入和输出变量,Y为连续变量,给定数据集D={(x1,y1),(x2,y2),...(xn,yn)}假设输入空间划分为M个单元R1,R2,...,RM,并且在每个单元Rm上有一个固定的输出cm,于是回归树模型可以表示为:当输入空
随着基于过程的作物生长模型(Process-based Crop Growth Simulation Model)的发展,R语言在作物生长模型和数据分析、挖掘和可视化中发挥着越来越重要的作用。想要成为一名优秀的作物模型使用者与科研团队不可或缺的人才,除了掌握对作物模型相关知识之外,还要掌握模型的快速模拟和高效数据分析能力。Decision Support Systems for Agrotechn
在本章中,抽样单元不一定是基本单元。一、基本了解(一)整群抽样(cluster sampling)1、整群抽样方法的定义先将总体划分为若干群,然后以群为抽样单元,抽样时从总体中随机抽取一部分群,并对入选群的所有基本单元进行调查。2、群的定义由若干个有联系的基本单元所组成的集合称为群。因此,群内单元通常具有相似性。3、抽取群的方式:①各群的规模相等时,采用等概率抽样;②各群的规模不等时,常采用不等概