可视化混淆矩阵  
  混淆矩阵是我们用来理解分类模型性能的表格。 这有助于我们理解如何将测试数据分类到不同的类中。 当我们想微调我们的算法时,我们需要了解在做出这些更改之前数据是如何被错误分类的。 有些种类比其他课程更糟糕,混淆矩阵将帮助我们理解这一点。 我们来看看下图: 
        class 0   。总体而言,52个项目实际上属于 
  class 0 
  。如果我们总结第一行中的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-09 12:32:18
                            
                                47阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、变量1、什么是变量? 运行时可以发生变化的量。 ● 在java、C、C++这些强数据类型语言中,定义变量必须申明变量的类型:int a = 10; ● Python是弱数据语言,在定义使用变量的过程中,不用申明变量的类型,解释器会自动根据值来判断:变量名称 = 变量值 # python的变量定义2、变量命名规范 ● 变量名称只能由【大小写字母、数字、下划线】组成特殊字符; ● 数字不能开头;            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-16 16:25:52
                            
                                97阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.虚拟变量定义:虚拟变量(Dummy Variable) 也叫哑变量,它算不上一种变量类型,确切地说,是将多分类变量转换为二分类变量的一种形式。如果数据为定类数据,比如专业、性别等,其数字仅代表类别,数字大小并没有意义,此时可以考虑引入哑变量,将不能够定量处理的变量量化,再进行分析。2.什么情况下需要设置虚拟变量2.1对于无序多分类变量举一个例子,如血型,一般分为A、B、O、AB四个类型,为无序            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-11 14:42:21
                            
                                333阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            分类问题分类(classification)问题的一种实现方式是,使用线性回归(linear regression),对于所有的预测结果,以某个值作为分界。比如小于0.5意味着0,大于0.5意味着1。然而,这种方法不够好,因为分类问题并不能用线性方程表示。但分类问题依然是回归问题,只不过预测的结果限定在少量离散的结果集中。现在,我们把关注点集中在结果只有0和1的分类问题上,称为二值分类问题(bin            
                
         
            
            
            
            变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。因此,变量可以指定不同的数据类型,这些变量可以存储整数,小数或字符。变量赋值Python 中的变量赋值不需要类型声明。每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。等号(=)用来给变量            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-26 19:18:38
                            
                                10阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Python3 数据类型转换有时候,我们需要对数据内置的类型进行转换,数据类型的转换,一般情况下你只需要将数据类型作为函数名即可。Python 数据类型转换可以分为两种:隐式类型转换 - 自动完成显式类型转换 - 需要使用类型函数来转换隐式类型转换在隐式类型转换中,Python 会自动将一种数据类型转换为另一种数据类型,不需要我们去干预。以下实例中,我们对两种不同类型的数据进行运算,较低数据类型(            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2022-08-16 09:41:00
                            
                                146阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ,我们将了解什么是分类变量以及处理这类数据的三种方法。、介绍    分类变量只接受有限数量的值。    考虑一项调查,询问你多久吃一次早餐,并提供四个选项:“从不”、“很少”、“大多数日子”或“每天”。    在本例中,数据是分类的,因为响应属于一组固定的类别。如果人们对他们所拥有的汽车品牌进行调查,他们的回答可以分为“本田”、“丰田”和“福特”。    在本例中,数据也是分类的。如果我们试图在没            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-18 22:44:08
                            
                                113阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            python 里面无非就是三种类型最为重要:字符串,列表,字典这几种类型首先应该要学会的是 索引,切片,和迭代: 字符串''字符串在内存中一但创建就不可修改,如果要修改内存会重新创建一个字符串'''1.字符串切片,及索引:1 test = 'pangrou'
2 v= test[3]
3 print(v)
4 #拿索引范围-1为最后位置(切片)
5 v= test[0:1]
6 prin            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-28 12:08:31
                            
                                78阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1.分类变量分类变量是用来表示类别或标记的。在实际的数据集中,类别的数量总是有限的。类别可以用数字表示,但与数值型变量不同,分类变量的值是不能被排序的。(作为行业类型,石油和旅游之间是分不出大小的。)它们又称为无序变量。2.分类变量的编码分类变量中的类别通常不是数值型的。 1 例如,眼睛的颜色可以是“黑色”“蓝色”和“褐色”,等等。因此,需要一种编码方法来将非数值型的类别转换为数值。我们很容易想到            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-21 07:07:53
                            
                                94阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            探索性数据分析(Exploratory Data Analysis)本节课程先从统计分析四步骤中的第二步:EDA开始。课程定义了若干个术语,如果学习过机器学习的同学,应该很容易类比理解:population:上节课说过,整体数据集合被称作populationindividual:其中每个个体,课程里称之为individual,注意不仅仅指个人,也可以泛指其他集合的其中一条数据variable:变量            
                
         
            
            
            
            一、整数如: 18、73、84每一个整数都具备如下功能: int二、长整型可能如:2147483649、9223372036854775807每个长整型都具备如下功能: long三、浮点型如:3.14、2.88每个浮点型都具备如下功能: float四、字符串如:'wupeiqi'、'alex'每个字符串都具备如下功能: str注:编码;字符串的乘法;字符串和            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-05-27 17:20:50
                            
                                85阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            前言在机器学习中,“分类”和“回归”这两个词经常听说,但很多时候我们却混为一谈。本文主要从应用场景、训练算法等几个方面来叙述两者的区别。 本质区别分类和回归的区别在于输出变量的类型。分类的输出是离散的,回归的输出是连续的。定量输出称为回归,或者说是连续变量预测; 定性输出称为分类,或者说是离散变量预测。若我们欲预测的是离散值,例如"好瓜""坏瓜",此类学习任务称为 "分类"。若欲预测的是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-10 12:55:10
                            
                                81阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            输入变量与输出变量均为连续变量的预测问题是回归问题;  输出变量为有限个离散变量的预测问题成为分类问题;其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。  分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测;  回归问题是指,给定一个新的模式,根据训练集推断它所            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-26 06:38:45
                            
                                56阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            机器学习中级教程1.介绍2.缺失值3.分类变量4.管道(Pipelines)5.交叉验证6.梯度提升(XGBoost)7.数据泄漏有很多非数字数据。下面是如何将其用于机器学习。在本教程中,您将了解什么是分类变量,以及处理此类数据的三种方法。正文介绍分类变量只接受有限数量的值。考虑一项调查,询问你多久吃一次早餐,并提供四个选项:“从不”、“很少”、“大多数天”或“每天”。在这种情况下,数据是分类的,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-23 16:18:42
                            
                                77阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
              统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如人的身高、性别等。  每个变量都有变量的值和变量的类型。我们按照变量的类型对变量进行划分。数值变量(numrical)和分类变量(categorical)。  数值型变量是值可以取一些列的数,这些值对于 加法、减法、求平均值等操作是有意义的。而分类变量对于上述的操作是没有意义的。  数值变量又可            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-19 16:33:03
                            
                                97阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1、变量我们可以将变量视为内存中的一个存储区域,该区域具有自己的名称(变量名)和类型(数据类型);变量通过使用变量名来访问存储变量的那块内存区域。由于Java是强类型语言,因此每个变量必须先声明类型才能使用,并且变量的值可以在已声明的数据类型的约束下不断改变。变量的作用域是离变量声明最近的一对{}之内。 2、变量的分类①、按照变量的类型分类      &nb            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-16 06:26:30
                            
                                669阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
                 在机器学习中,大多数算法,譬如逻辑回归,支持向量机SVM,k近邻算法等都只能够处理数值型数据,不能处理文字,在sklearn当中,除了专用来处理文字的算法,其他算法在fit的时候全部要求输入数组或矩阵,也不能够导入文字型数据(其实手写决策树和普斯贝叶斯可以处理文字,但是sklearn中规定必须导入数值型)。     然而在现实中,许多标签和特征在数据收集完毕的时候,都不是以数字来表现的。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-01-02 11:26:29
                            
                                3222阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            先回答前面一节的那个问题吧。<?php$foo = 10;$bar = 20; function change() {    global $fo            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-09-06 13:38:26
                            
                                155阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            数据预处理 | 处理类别变量(categorical variable)python-sklearn实现 | 三种常用方法            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-16 12:45:49
                            
                                213阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一.变量的定义 变量命名规则:由数字、字母、下划线组成;不能由数字开头;严格区分大小写;不能使用内置关键字作为变量名称。推荐变量的命名规则:每个变量名称都要有意义,单词之间分割使用大驼峰、小驼峰或者下划线。内置关键字包括如下图:二.数据类型python中共包含7种数据类型。数值类型、布尔类型、字符串类型、列表类型、元组类型、集合类型、字典类型。本次主要介绍前面三种。1.数值类型数值类型就            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-12 15:29:35
                            
                                68阅读
                            
                                                                             
                 
                
                                
                    