之前学习了线性回归,逻辑回归和梯度下降法,今天学习的这个技术能够帮助我们训练的模型对未知的数据进行更好的预测 - 正则化技术!快来一起学习学习,学习使我快乐 (^▽^)!一、正则化是什么?正则化(Regulariation)这 3 个字听起来挺高大上的,其实就是一种解决机器学习过拟合问题的技术,使用这项技术可以让我们在训练集上训练的模型对未知的数据也能很好地拟合。机器学习模型对未知数据的拟合能力又
转载
2023-11-19 13:15:35
254阅读
## 流形正则化在机器学习中的应用
在机器学习领域,流形正则化是一种用于处理高维数据的方法,它可以帮助我们更好地理解数据的结构并提高模型的泛化能力。流形正则化的基本思想是利用数据的局部结构来学习全局结构,从而避免过拟合和提高模型性能。
### 什么是流形正则化?
流形正则化是一种基于流形学习理论的降维方法,其核心思想是将高维数据映射到低维流形空间中,保留数据的局部结构信息。在高维空间中,数据
原创
2024-05-16 07:25:33
149阅读
【NLP学习】正则化1 正则化2 L2正则项(岭回归)什么情况下用L2正则项什么情况下不用L2正则项3 L1正则项4 ElasticNet回归:(L1、L2正则项)什么情况下用ElasticNet回归 1 正则化欠拟合、过拟合怎么解决? 解决方式:正则化2 L2正则项(岭回归)以线性回归来说,Loss function 如下: L2正则化相当于: J0表示上面的loss function,正
转载
2024-06-10 15:04:47
98阅读
一:L1 L2 正则化介绍监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们的训练数据,而规则化参数是防止我们的模型过分拟合我们的训练数据。多么简约的哲学啊!因为参数太多,会导致我们的模型复杂度上升,容易过拟合,也就是我们的训练误差会很小。但
转载
2023-08-24 20:53:15
533阅读
流形,也就是 Manifold 。不知道你有没有为我在本文开头放上的那个地球的图片感到困惑?这是因为球面是一个很典型的流形的例子,而地球就是一个很典型的“球面”啦(姑且当作球面好啦)。
有时候经常会在 paper 里看到“嵌入在高维空间中的低维流形”,不过高维的数据对于我们这些可怜的低维生物来说总是很难以想像,所以最直观的例子通常都会是嵌入在三维空间中的二维或者一维流行。比如说一块布,可以把它看
感觉有时候搞科研就像顺藤摸瓜一样,学着学着,就又看到了另一快开阔的天地。从本科时学基础数学,到硕士时跟着老板学计算机;从开始学二维数字图像,到后来学三维图形;做测地线时感觉到对于曲面的理论了解太匮乏,就开始重新看微分几何;就看到了流形的概念,接着前几天看了流形学习的几篇文章。 流形,感觉就是为了扩展线形的欧式空间,对于非线性
流形(manifold)的概念最早是在1854年由 Riemann 提出的(德文Mannigfaltigkeit),现代使用的流形定义则是由 Hermann Weyl 在1913年给出的。江泽涵先生对这个名词的翻译出自文天祥《正气歌》“天地有正气,杂然赋流形”,日本人则将之译为“多样体”,二者孰雅孰鄙,高下立判。流形(Manifold),一般可以认为是局部具有欧氏空间性质的空间。而实际上欧氏空间就
转载
2024-03-21 14:58:14
78阅读
1、re.findall()函数语法:re.findall(pattern,string,flags=0) ——> list(列表)列出字符串中模式的所有匹配项,并作为一个列表返回。如果无匹配,则返回空列表!与re.search()不一样的地方:re.findall返回的是列表,re.search返回文本re.findall匹配多个值,re.search只要匹配到就返回,只匹配一个值>
转载
2023-09-25 12:41:18
92阅读
目录流形向量场分布参考资料拓展资料进入研究室之后做的第一次学习汇报内容,一共分三则叙述,加油打工人!流形 先说定义。据 Wikipedia - 流形 , 流形被定义为 “可以局部欧几里得空间化的一种拓扑空间,是欧几里得空间中的曲线、曲面等概念的推广”。 对于欧几里得空间,一般认为标准欧几里得空间是四维及以上的空间,而我们接触得最多的其实是二维和三维的欧几里得空间,也就是我们常见的以平面直角坐标
译自书 《Optimization Algorithms on Matrix Manifolds》在矩阵流形上优化一个实值函数,是科研和工程中广泛存在的问题。在这一章节中,我们将会讨论几个相关的例子,以此体现研究流形优化的动机和意义。在第一部分,我们聚焦于特征值问题。 这个问题将作为一个典型的例子贯穿全书。这显然是一个非常重要的问题,已经,且仍会被广泛地研究。 作为一个优化问题,它自然地属于本书提
转载
2024-06-28 14:18:27
141阅读
正则表达式描述了一种字符串匹配的模式。1 为什么要使用正则表达式a. 数据验证验证手机号,银行卡号等。b. 替换文本正则查找特定源文本,将其替换为目标文本。c. 提取子串从给定字符串中提取目标子串。2 正则表达式-语法\s 匹配任何单个空白字符,包括tab键和换行符。\S 匹配任何非空白字符。\w 匹配包括[a-zA-Z0-9_]。(大小写英文字母、数字、下划线)\W 匹配任何非\w中的字符。(除
转载
2024-02-02 11:01:47
42阅读
线性回归1.一般形式w叫做x的系数,b叫做偏置项。2 如何计算2.1 Loss Function--MSE(均方误差)利用梯度下降法找到最小值点,也就是最小误差,最后把 w 和 b 给求出来。3 过拟合、欠拟合如何解决使用正则化项,也就是给loss function加上一个参数项,正则化项有L1正则化、L2正则化、ElasticNet详细了解,可参考视频什么是 L1 L2 正规化3.1 L1正则(
转载
2023-11-19 13:49:31
150阅读
正则表达式就是用查找字符串的,它能查找规则比较复杂的字符串
反斜杠:正则表达式里面用"\"作为转义字符。
转载
2023-06-09 07:58:01
67阅读
"""
为什么需要正则?
1、文本处理已经成为计算机常见的工作之一
2、对文本内容进行快速搜索定位,提取是比较繁琐和复杂的
3、为了解决这个问题,产生正则表达式
作用:
可以称之为文本的高级匹配模式,提供搜索、替换、查找等功能,
本质是由一系列特殊符号和字符组成的字符串
转载
2023-11-25 07:19:03
42阅读
正则表达式是对字符串操作的一种逻辑公式.我们一般使用正则表达式对字符串进行匹配和过滤.使用正则的优缺点:有点:灵活,功能性强,逻辑性强缺点: 上手难.一旦上手,会爱上这个东西工具: 各大文本编辑器一般都由正则匹配功能. 我们可以去http://tool.chinaz.com/regex/ 在线使用工具进行测试 1. 正则表达式,匹配字符串元字符字符组很简单用[]括起来,在[]中
转载
2024-04-02 19:54:52
47阅读
1、介绍这里整理了表达式,即pattern参数的语法。其本质是一个str类型。2、开始和结尾(1)^^匹配字符串的开头(2)$$匹配字符串的末尾(3)整体匹配同时使用^和$3、匹配次数(1)贪婪匹配和非贪婪匹配模式贪婪匹配,在允许的范围内尽可能多的匹配表达式次数。比如*、+、{n, m}等非贪婪匹配,在允许的范围内尽可能少的匹配表达式次数。使用?(2)*匹配0或任意多次表达式(3)+匹配至少1次表
转载
2023-07-27 20:29:05
79阅读
正则表达式:
1.概念:
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。
re 模块使 Python 语言拥有全部的正则表达式功能。
转载
2023-06-10 07:48:25
107阅读
正则表达式入门及python中的应用 1. 正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常
转载
2023-08-22 10:59:33
94阅读
Github: https://github.com/yjfiejd/Regex (包括示例代码)【维基百科】:https://zh.wikipedia.org/wiki/正则表达式 【官方参考链接】1) Regular expression operations 【官方】2) Regular Expression HOWTO
转载
2023-09-22 18:25:50
71阅读
正则化是一种回归的形式,它将系数估计(coefficient estimate)朝零的方向进行约束、调整或缩小。也就是说,正则化可以在学习过程中降低模型复杂度和不稳定程度,从而避免过拟合的危险。一、数学基础1. 范数范数是衡量某个向量空间(或矩阵)中的每个向量以长度或大小。范数的一般化定义:对实数p>=1, 范数定义如下: L1范数
当p=1时,是L1范数,其表示某个向量中所有元素绝对值的和
转载
2024-01-08 18:39:58
113阅读