一、哈希 哈希是一个系列的加密算法,各个不同的哈希算法虽然加密强度不同,但是有以下几个共同点: ①不管输入数据的数据量有多大,使用同一个哈希算法,得到的加密结果长度固定 ②哈希算法确定,输入数据确定,输出结果保证不变 ③哈希算法确定,输入数据有变化,输出结果一定有变化,而且通常变化很大 ④哈希算法不可逆 ⑤哈希算法中不区分英文大小写 哈希算法有很多种,如:MD5、SHA-
转载
2023-07-12 14:59:57
34阅读
本书介绍随着机器学习算法越来越多地被用来寻找模式,进行分析和做出决策(有时可能会影
原创
2023-06-23 10:16:11
179阅读
作者:Adrian Rosebrock这是一篇手把手教你使用 Python 实现机器学习算法,并在数值型数据和图像数据集上运行模型的入门教程,当你看完本文后,你应当可以开始你的机器学习之旅了!本教程会采用下述两个库来实现机器学习算法:scikit-learnKeras此外,你还将学习到:评估你的问题准备数据(原始数据、特征提取、特征工程等等)检查各种机器学习算法检验实验结果深入了解性能最
转载
2024-08-15 11:02:54
161阅读
因本人刚开始写博客,学识经验有限,如有不正之处望读者指正,不胜感激;也望借此平台留下学习笔记以温故而知新。这个系列是机器学习实战一书的学习笔记,主要是基本算法的代码实现。机器学习实战 百度网盘链接:百度网盘-链接不存在提取码:qcht推荐指数:5颗星决策树的特点 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特 征数据。 缺点:可能会产生过度匹配问题。 适用数据类型:
转载
2023-11-20 19:28:23
269阅读
机器学习实战(1)分类参考书籍:Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Second Edition 编译器:jupyter notebook3.1 MNISTMNIST数据集是一组数字图片,相当
转载
2024-05-12 17:09:58
112阅读
机器学习是一种从数据生成规则、发现模型,来帮助我们预测、判断、分析和解决问题的技术。一个机器学习项目从开始到结束大致分为5步,分别是定义问题、收集数据和预处理、选择算法和确定模型、训练拟合模型、评估并优化模型性能。这5步是一个循环迭代的过程,可以参考下面的图片:所有的项目都会按照这5步来做,我把它简称为实战5步。为了让你更深地理解这5步,在后面能更快地上手,我会带你做一个项目,我会给你清楚解释每一
转载
2023-07-29 19:51:20
729阅读
之前就知道有《机器学习实战》这本书,还有机器学习实战源码,对于想对机器学习理论和实践层面有更深入的了解和学习的话就可以看一下这本书,代码是python写好的,可以拿来跑一下,也可以加进去自己的理解,因为已经接触机器学习一年多的时间了,所以看这本书的时候感觉还不错,并不是很吃力,花了一周多的时间看完了书中的理论知识,代码部分跳过了,暂时没有去实践,因为现在看这本书的目的是
转载
2024-08-03 23:22:02
55阅读
目录 机器学习基础什么是机器学习机器学习应用场景海量数据机器学习的重要性机器学习的基本术语监督学习和非监督学习监督学习:supervised learning非监督学习:unsupervised learning机器学习工具介绍Python非 PythonNumPy 函数库基础测试 Numpy 库测试 NumPy 库代码整合总结 机器学习基础什么是机器学习机器学习的基本术语监督学习和非监督学
转载
2023-08-23 11:22:32
8阅读
该系列:整合了《机器学习实战》中的要点,适合理解概念之后当作笔记复习或者只喜欢看概念不喜欢看讲解的胖友。将代码改成了python3版本将单独成段的代码讲解以注释的方式与代码融合,方便阅读。机器学习基础概念训练集是用于训练机器学习算法的数据样本集合。目标变量是机器学习算法的预测结果,在分类算法中目标变量的类型通常是标称型的,而在回归算法中通常是连续型的。一般过程: 为了测试机器学习算法的效果,通常使
转载
2024-07-22 16:18:31
85阅读
1.首先从图片的角度,对机器学习算法、实战有一个全面而感性的认识。 1.1 机器学习算法思维导图 1.2 监督学习经典模型树状图 1.3 Scikit-learn工具包使用网状图 1.4 监督学习流程图2.剖析监督学习流程图的每一个步骤(by code)。 2.1 原始数据收集 (1)导入本地数据:import pandas as pd
train = pd.read_csv('../Brea
转载
2024-03-02 11:27:12
79阅读
驱动任务:根据加州住房价格的数据集建立加州的房价模型数据集下载地址:https://pan.baidu.com/s/1it08eJ7a1ZGTTc7mHBZVzw?pwd=9n132.2 设计系统典型的有监督学习任务,已经给出了标记的训练示例(每个实例都有预期的产出,也就是该区域的房价中位数)。并且也是一个典型的回归任务,因为哟啊对某个值进行预测。选择性能指标回归问题的典型性能指标是均方根误差RM
转载
2023-08-22 20:46:31
1095阅读
本文讲述了朴素贝叶斯的原理,概率的计算方式,给出代码的详细解释,并最后给出代码的运行过程的总结,然后又用了两个实例来讲述朴素贝叶斯代码的计算过程
1.优缺点优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标称型数据2.朴素贝叶斯的一般过程(1) 收集数据:可以使用任何方法。本章使用RSS源。
(2)
转载
2024-02-29 15:09:46
98阅读
一、机器学习:(1)有监督学习:(分类、回归)k-近邻、朴素贝叶斯、支持向量机、决策树 (2)无监督学习:(聚类、密度估计)k-均值、DBSCAN →如何选择?(1)预测目标变量的值:选择有监督学习&
转载
2023-07-28 14:13:07
394阅读
今天发布一篇图片博客,看一下效果如何,如果效果,以后的博客尽量发图片上来。
机器学习实战 本系列博客源自于读《机器学习实战—中文版》这本书的学习笔记,用于日后翻阅、查看资料用。机器学习算法越来越受到人们的青睐,是由于这些算法在一定程度上可以达到智能的目的,比如人脸识别、图像文本分类等在一定程度上可以代替人工繁琐复杂的操作。《机器学习实战》这本书写的非常好,它并没有从理论的角度讲解机
转载
2024-05-20 22:00:28
357阅读
目录机器学习基础什么是机器学习机器学习应用场景海量数据机器学习的重要性机器学习的基本术语监督学习和非监督学习监督学习:supervised learning非监督学习:unsupervised learning机器学习工具介绍测试 Numpy 库测试 NumPy 库代码整合Python非 PythonNumPy 函数库基础总结机器学习基础什么是机器学习机器学习的基本术语监督学习和非监督学习机器学习
原创
2021-04-15 18:40:23
814阅读
文章目录资料kNN步骤知识点简易kNN算法海伦约会读取txt文件法一 : open打开法二 : pandas (不熟)字符串类别格式需转为数字格式matplotlib显示中文乱码问题Matplotlib画图均值归一化测试数字识别首先,观察数据。算法法一:使用自己写的简易的kNN算法法二:使用sklearn 提供的kNeighborsClassifiers kNN步骤1 计算未知点与样本的距离 2
转载
2023-08-04 19:43:51
107阅读
小试牛刀刚买到《机器学习实战》这本书,爱不释手。但是里面在调试第二章的第一处代码的时候就出现了问题,所以将一些调试结果与对其理解写在下面。一、导入数据由于网站的数据难以下载,数据文件已经被我保存下来,百度网盘链接:https://pan.baidu.com/s/18g57CsRp5_3hYEYzjK69Vw,提取码:cg1f 数据下载下来后,在桌面创建一个文件夹,将文件放入其中,另外新建一个记事本
转载
2024-02-29 10:21:28
125阅读
Lesson 3.3 线性回归手动实现与模型局限知识点补充 相关性系数计算# 科学计算模块
import numpy as np
import pandas as pd
# 绘图模块
import matplotlib as mpl
import matplotlib.pyplot as plt
# 自定义模块
from ML_basic_function import *一、线性回归的手动实
转载
2024-04-22 22:37:02
61阅读
----------------------------------------------------------------------------------------本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLa
转载
2024-05-21 11:37:04
797阅读
文章目录一.简介1.1 集成学习1.2 随机森林二.集成学习—投票分类器2.1 概念2.2 代码实现三.集成学习—bagging和pasting3.1 简介3.2 Scikit-Learn中使用bagging和pasting3.3 包外评估3.4 随机补丁和随机子空间四.集成学习—随机森林4.1 简介4.2 API使用4.3 极端随机树4.4 特征重要性五.集成学习—提升法Boosting5.1
转载
2023-06-25 13:21:51
477阅读