​在港科大拿到PhD,做的是Bioinformatics方面的东西。Bioinformatics这个领域很乱,从业者水平参差不齐,但随着相关技术(比如Microarray, Genotyping)的进步,这个领域一直风风光光。因为我本科是学计算机电子技术方面的,对这些技术本身并没有多大的兴趣,支持我一路走过来的一个重要原因是我感受到统计学习(Statistical learning)的魅力。正如本
转载 2012-12-21 12:48:00
49阅读
第一章 统计学习方法概论统计学习的主要特点是(1)平台--------计算机及网络息论、计算理论、最优化理论以及计算机
1.统计学习是关于计算机基于数据构建概率统计模型并运用模型
文章目录1 基本配置1.1 基本模块1.2 绘图设置2 基本统计量3 基本分布3.1 离散型分布3.2 离散型分布示例3.2.1 伯努利分布3.2.2 二项分布3.2.3 泊松分布3.3 连续型分布3.4 连续型分布示例3.4.1 正态分布3.4.2 均匀分布3.4.3 指数分布3.4.4 t分布3.4.5 卡方分布3.4.6 F分布3.4.7 对数正态分布3.4.8 韦伯分布 1 基本配置1.
我毕业于美国一个统计学专业排名前10名的公立大学。今年6月刚刚毕业。从大二上第一门统计专业课算起,已经和统计学打了三年的交道了。我从最开始by chance进的专业,到觉得这个专业无聊,再到开始对这个专业不讨厌,最后到现在觉得这个专业很性感,决定和统计学继续把交道打下去,其实中间还蛮曲折的。自己是属于非常努力的那种学生,但是因为天赋有限,所以“努力”让自己在整个专业中的成绩稳定在中上游,“缺乏天赋
转载 2022-07-08 14:04:17
186阅读
统计学习 关于计算机针对数据构建概率统计模型,并通过模型对数据进行分析和预测 统计学习的分类 基本分类:监督学习,无监督学习,强化学习,半监督学习,自主学习 监督学习(superised learning): 从标注数据中学习预测模型,本质是输入到输出的映射的统计规律 无监督学习(unsuperis ...
转载 2021-09-30 12:44:00
361阅读
2评论
一、模型评估和模型选择1、训练误差与测试误差2、过拟合和模型选择经验风险最小化会出现过拟合问题。二、正则化与交叉验证1、正则化模型选择的典型方法是正则化。正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项。正则化符合奥卡姆剃刀原理。2、交叉验证另一种常用的模型选择方法是交叉验证cross validation随机将数据集切分成三部分:训练集,验证集,测试集。验证集用于多模型的选择。交叉验证的基本想法是重复地使用数据,吧给定的数据切分,将切分的数据集合为训练集与测试集,反复训练,测试,模型选择。(1)简单交叉验证(2)S折交叉验证(3)留一交叉验证三、泛化能力四、生成模型与判别模型1
转载 2012-12-19 22:34:00
126阅读
2评论
统计学习方法概论题统计学习方法概论实现统计学习方法的步骤统计
原创 2022-11-01 16:57:14
176阅读
这本斯坦福经典教材,由三位统计学大师完成。
转载 2023-05-08 13:24:53
172阅读
算法是指学习模型的具体计算方法。统计学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的计算方法来求解最优模型。这时,统计学习问题归结为最优化问题,统计学习的算法成为求解最优化问题的算法。如果最优化问题有显式的解析解,这个最优化问题就比较简单,但通常解析解不存在,这就需要用数值计算的方法求解,如何保证求到全局最优解,并使求解的过程非常高效,就成为一个重要问题。...
原创 2022-03-15 14:06:33
143阅读
统计学习是基于数据构建概率统计模型并运用模型对数据进行预测与分析,统计学习方法包
原创 2023-04-19 07:01:13
102阅读
统计学习及监督学习概论 1、统计学习 统计学习研究的对象是数据(同类数据应具有一定的统计规律性),从数据出发提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据(未知新数据)的分析与预测中去。对数据的预测与分析是通过构建概率统计模型实现的。 统计学习由监督学习(supervised le ...
转载 2021-10-28 16:39:00
125阅读
2评论
统计学习方法笔记 1201、统计学习方法总结 一、总结 一句话总结: 本书共介绍了10种主要的统计学习方法:【感知机】、【k近邻法】、【朴素贝叶斯法】、【决策树】、【逻辑斯谛回归与最大熵模型】、【支持向量机】、【提升方法】、【EM算法】、【隐马尔可夫模型】和【条件随机场】. 1、10种统计学习方法特
算法是指学习模型的具体计算方法。统计学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的计算方法来求解最优模型。这时,统计学习问题归结为最优化问题,统计学习的算法成为求解最优化问题的算法。如果最优化问题有显式的解析解,这个最优化问题就比较简单,但通常解析解不存在,这就需要用数值计算的方法求解,如何保证求到全局最优解,并使求解的过程非常高效,就成为一个重要问题。...
原创 2021-08-04 13:56:26
112阅读
4、朴素贝叶斯法http://www
引言 为什么抛硬币一面朝上的概率是0.5,这里的概率又是什么意思呢?关于怎么样理解概率,统计学有两大学派。频次学派认为,概率是经过多次试验结果的收敛,也就是说,在实验次数足够大时,可以认为结果的均值就是概率。而多次实验的结果又形成了一个分布,统计检验的目的就是验证你的数据集是否服从于某个常见的分布, ...
转载 2021-09-09 10:30:00
66阅读
2评论
复习的主要内容:第一章:监督学习与非监督学习第二章:贝叶斯、最小风险杯贝叶斯公式、先验概率 后验概率 得出风险数值概率密度估计 极大似然估计第三章:线性模型(基本且经典)单变量线性回归、多变量线性、逻辑回归
1.1 统计及其应用领域1.1.1 统计学定义(1)统计学:是搜集、处理、分析、解释数据并从数据中得出结论的科学。(2)统计学是关于数据的科学,它所提供的是一套有关数据搜集、处理、分析、解释并从数据中得出结论的方法,统计研究的是来自各领域的数据。(3)数据搜集:也就是取得统计数据;(4)数据处理:是将数据用图表等形式展示出来;(5)数据分析:则是选择适当的统计方法研究数据,并从数据中提取有用信息进
复习的主要内容:第一章:监督学习与非监督学习第二章:贝叶斯、最小风险杯贝叶斯公式、先验概率 后验概率 得出风险数值概率密度估计 极大似然估计第三章:线性模型(基本且经典)单变量线性回归、多变量线性、逻辑回归第四章:神经网络
  • 1
  • 2
  • 3
  • 4
  • 5