王立威王立威,在北京大学教授主要研究领域为机器学习。在包括COLT, NIPS,JMLR, PAMI等权威会议期刊发表论文60余篇。2010年入选 AI’s 10 to Watch,是首位获得该奖项的亚洲学者。2012年获得首届国家自然科学基金优秀青年基金,新世纪优秀人才。任 NIPS 等权威会议 Area Chair,和多家学术期刊编委。以下为王立威教授所做的现场演讲的第一部分,主要覆盖了机器学
对信息准则的认识Knowledge of information standards【摘要】为了在一组可供选择的模型中选取一个最优的模型,常常需要对统计模型的拟合程度进行衡量,本文介绍了几种衡量统计模型拟合优良性信息准则标准,通过对其概念的一般性认识可以帮助我们学习模型选择方面的知识。【关键词】信息准则;AIC;BICAbstract:In order to select theoptimal o
R语言数据挖掘实战系列(5)——挖掘建模一、分类与预测分类和预测是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。1.实现过程(1)分类分类是构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别。分类模型建立在已有类标记的数据集上,模型在已有样本上的准确率可以方便地计算,所以分类属于有监督的
R语言数据挖掘实战系列(4)——数据预处理 数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。一、数据清洗1.缺失值处理 一般来说,缺失值的处理包括两个步骤,即缺失数据的识别和缺失值处理。在R语言
R语言数据挖掘实战系列(3)三、数据探索 通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。数据质量分析 数据质量分析的主要任务是检查原始数据中是否存在
R语言数据挖掘实战系列(2)二、R语言简介R语言是一种为统计计算和图形显示而设计的语言环境,具有免费、多平台支持,同时可以从各种类型的数据源中导入数据,具有较高的开放性以及高水准的制图功能。R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包。R在数据分析、数据挖掘领域具有特别优势。R安装R可在其主页(https://www.r-project.org/)上获得,根据所选择的平台
R语言数据挖掘实战(1)一、数据挖掘基础数据挖掘:从数据中“淘金”,从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘的任务利用分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。数据挖掘建模过程定义挖掘目标,即
修改XAMPP中MySQL数据库的密码XAMPP只为开发者服务,不可将其用于生产环境。首先,MySQL管理员(root)未设置密码,用户可以直接通过phpmyadmin访问mysql服务器,修改数据库中的数据,或者通过网络访问。为确保MySQL数据库的安全,必须为MySQL管理员(root)设置密码,其方法如下:以root用户的身份登录phpmyadmin,在phpmyadmin的权限中设置roo
Windows10常用快捷键
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号