机器学习十讲--第八讲-维度灾难 原创 MoooJL 2021-07-20 09:20:58 博主文章分类:机器学习 ©著作权 文章标签 机器学习 文章分类 机器学习 人工智能 ©著作权归作者所有:来自51CTO博客作者MoooJL的原创作品,请联系作者获取转载授权,否则将追究法律责任 赞 收藏 评论 分享 举报 上一篇:机器学习十讲--第九讲-深度学习 下一篇:机器学习十讲--第七讲-最优化 提问和评论都可以,用心的回复会被更多人看到 评论 发布评论 全部评论 () 最热 最新 相关文章 Linux常用命令精讲 1.Linux命令概述shell程序b.shell是Linux中用户与内核之间的翻译官,当用户登录Linux时,Linux会自动加载一个shell程序,在Linux中shell程序对应的文件在/bin/bash2.Linux命令的分类内部命令:是集成于Shell解释器程序(如Bash)内部的一些特殊指令,也称为内建(Built-in)指令。内部命令属于shell的一部分,所以没有单独对应的系统文件 常用命令 python第八节:函数 函数函数是一段封装的代码块,实现某个具体的功能,一般如果一段代码重复率很高,可以考虑封装成函数。函数定义和调用:用关键字def定义,可以有return表达式,也可以没有。应给函数指定描述性名称,且只在其中使用小写字母和下划线。等号两边不要有空格。def function_name(parameter_0,parameter_1='default value')函数的调用就是在函数体外用 函数名( 传递参数 python 函数 函数调用 *args 【CSS】第九讲:CSS基本选择器(1) 本文讲了部分CSS选择器 选择器 属性值 基本语法 机器学习十讲--第九讲-深度学习 机器学习 《机器学习十讲》学习报告八 维度灾难: 随着维度的增多,问题的复杂性(或计算代价)呈指数型增长的现象 基于距离的机器学习模型 稀疏度与过度拟合 过度拟合:模型对已知数据拟合较好,新的数据拟合较差 高维空间中样本变得极度稀疏,容易造成过度拟合问题 计算复杂度:决策树 随着维数的增加。计算复杂度指数增长 只能求近似解得到局部最优解 机器学习 机器学习十讲--第二讲-回归 import pandas as pd data = pd.read_csv("input/abalone_dataset.csv") print(data.shape) #绘图中文字体 import matplotlib as mpl mpl.rcParams['font.sans-serif'] 机器学习 机器学习十讲--第一讲 import pandas as pd #绘图中文字体 import matplotlib as mpl mpl.rcParams['font.sans-serif']=['SimHei'] # #指定默认字体 SimHei为黑体 mpl.rcParams['axes.unicode_minus'] 机器学习 《机器学习十讲》学习报告十 强化学习: 智慧决策的过程,通过过程模拟和观察来不断学习,提高决策能力 策略:在特定状态下应该怎么采取行动 目的:找到最佳策略,即能够获得最大奖励的策略 数学模型: 策略和目标: 在马尔科夫决策过程中,最终需要求解一个策略,他是行动和状态之间的映射 分为确定性策略和随机性策略 目标:最大化累计奖励的 机器学习 机器学习十讲--第六讲-降维 机器学习 机器学习十讲--第三讲-分类 import pandas as pd raw_train = pd.read_csv("input/chinese_news_cutted_train_utf8.csv",sep="\t",encoding="utf8") raw_test = pd.read_csv("input/chinese 机器学习 机器学习十讲--第七讲-最优化 机器学习 机器学习十讲--第五讲-聚类 机器学习 《机器学习十讲》学习报告九 深度学习应用领域全面突破:机器翻译 语音识别等 神经元与感知机 多层感知机 多个神经元以全连接层次相连 网络称为前馈神经网络 也称多层感知机 多层感知机能够逼近任何函数 误差函数 梯度计算:后向传播BP: 前向传播计算误差,后向传播计算梯度 机器学习与深度学习之间差别 机器学习 《机器学习十讲》学习报告七 机器学习的优化目标 一,梯度下降法 batch梯度下降法: 随机梯度下降SGD 线性衰减然后保持为常数 梯度爆炸和悬崖 解决方法:梯度阶段 启发式梯度截断干涉以减少步长 二,动量法 在参数更新时考虑历史梯度信息 Nesterov动量法 机器学习 《机器学习十讲》学习报告四 一,模型提升方法 模型误差来源: 逼近误差 估计误差:训练到的函数与模型空间最好的函数的距离 线性到非线性模型: 线性回归:多项式回归 支持向量机 决策树:空间划分的思想来处理非线性数据 决策树的生成: 从根节点开始,选择对应特征 选择节点特征分割点 二,节点特征和分割点的选择 不纯度:表示落在当前 机器学习 《机器学习十讲》学习报告五 数学基础:凸函数与Jensen不等式 凸函数:弦在弧上 聚类:样本没有类别标签,一种典型的无监督学习方法 相同类的样本之间距离较近 不同类的样本之间距离较远 K-means模型 模型求解: 交替迭代法: 固定c优化r, 固定r优化c, 固定c,优化r 固定r,优化c K-Means算法流程 1,随机 机器学习 《机器学习十讲》学习报告一 一,大数据的基本公式: 机器学习就是在获得很多组的x数据和y数据以后获得F映射的一个过程 深度学习是机器学习的一部分,就是在获得data后提取出x数据的过程 如果数据y用来模仿人类的行为,例如自动驾驶等,就称其为人工智能 二,机器学习方法分类: 1,有监督学习 就是数据y包含已经有的结果标签 用处: 机器学习 《机器学习十讲》学习报告二 回归: 指用一个或多个自变量预测因变量的数学方法 一元线性回归: 模型为y=w1x+w0 目标是所有样本落在直线附近 多元线性回归: 多重共线性:变量之间存在较强的共线性,对参数估计得不准确,造成过度拟合的现象 LASSO系数压缩估计方法 误差: 机器学习 机器学习十讲--第四讲-模型提升 机器学习 《机器学习十讲》学习报告六 数据维度灾难需要降维 实际数据会有很多的维度,但对数据处理时,不能将所有数据的维度都当做一个参数,那样就会导致我们口中的维度灾难 那么,维度灾难该怎么处理呢 1主要成分分析 基本思想:构造原始特征的一系列线性组合形成的线性无关低纬特征,以去除数据的相关性,并使降维后的数据最大程度的保持原始高维数据的 机器学习 mysql和qt连接 一、MySQL介绍 MySQL是一种关系型数据库管理系统,所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型和大型网站的开发都选择 MySQL 作为网站数据库。二、MySQL和SQLite有什么区别SQLite是一款轻量级的关系数据库管理系统,也是开源免费的,用户可 mysql和qt连接 mysql qt c++ Powered by 金山文档 java 获取声网RtcToken 请求响应流程图===================服务器处理请求的流程:服务器每次收到请求时,都会为这个请求开辟一个新的线程。服务器会把客户端的请求数据封装到request对象中,request就是请求数据的载体!服务器还会创建response对象,这个对象与客户端连接在一起,它可以用来向客户端发送响应。===================response:其类型为HttpServletRes java 获取声网RtcToken java web请求 重定向 System 客户端 ios android 自定义取景框 Android的Camera包含取景器(viewfinder)和拍摄照片的功能。其程序的架构分成客户端和服务器两个部分,它们建立在Android的进程间通讯Binder的结构上。 Camera的JAVA程序的路径: packages/apps/Camera/src/com/android/camera/ frameworks/base/core/java/android/hardware/Ca ios android 自定义取景框 数据 bc java centos中ftp中get命令下载文件 1、从远程ftp服务器下载文件的命令格式:首先,从本地的某个目录(/data/ftp/)登陆到远程服务器,并进入要下载文件的目录(/data/logs/),使用get命令从远程服务器的当前目录(/data/logs/)下载文件到本地登陆远程服务器时的目录(/data/ftp/)。get 远程ftp服务器上当前目录下要下载的文件名 [下载到本地机器上当前目录时的文件名],如 ftp 服务器 当前目录 文件名 控制台 人机五子棋 java c语言五子棋人机对战声明:我是菜鸡闲的蛋疼 代码很简单,无图片,游戏全部功能画面显示全部由 printf 打印,不过游戏里有很多小bug,不过不影响正常游戏,有兴趣的自己改进,应该不怎么难。 注:本游戏win7可完美运行,win10的话,棋盘的打印会略有鬼畜(变形)。 win10完美运行方案:点击屏幕左下角"开始"界面,搜索框输入cmd,出现命令提示符的黑框框后,(或者直接用五子棋.exe 控制台 人机五子棋 java 游戏 c语言 #include 命令提示符