泰坦尼克号数据集,是kaggle(Titanic: Machine Learning from Disaster)上入门机器学习(ML)的一个好的可选数据集,当然,也是不错的练习数据分析的数据集。对 python ,在数据分析方面,作为一柄利器,涵盖了「数据获取→数据处理→数据分析→数据可视化」这个流程中每个环节,这个项目作为新生练习最好不过了。探索的问题主要探寻坦尼克号上的生还率和各因素(客舱等
转载
2024-01-02 11:47:58
168阅读
在泰坦尼克号和titanic2数据帧描述泰坦尼克号上的个别乘客的生存状态。这里使用的数据集是由各种研究人员开始的。其中包括许多研究人员创建的旅客名单,由Michael A. Findlay编辑。我们提取的数据集中的特征是票的类别,存活,乘坐班,年龄,登陆,home.dest,房间,票,船和性别。
转载
2021-10-19 21:26:00
491阅读
这是我做的第一个半完整的数据分析项目,里面包含数据获取,数据清洗,描述性统计,数据可视化,机器学习建模等内容。花了我两天时间,中间出了很多bug,而且原始数据也有问题,因此存在较多缺陷,还请各位大佬多多指教!目录: 1.数据获取 2.数据预处理 3.描述性统计 4.变量分布统计 5.探索变量间的关系 6.特征处理 7.机器学习建模 8.模型准确性评估第一步:数据获取 直接从互联网获取数据impor
转载
2023-12-28 10:01:12
337阅读
这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个简单的分析好了。使用工具:Excel(对,就是这么简单粗暴)数据源的获取可后台回复:泰坦尼克一、明确目的1912年泰坦尼克号撞上冰山沉没,船上2224名乘客和机组人员中有1502人遇难,幸存下来的人是出于运气还是
原创
2021-01-19 21:31:13
2368阅读
那些人士生还的可能性大?
原创
2021-09-07 14:20:32
2247阅读
kaggle:泰坦尼克第一节:①数据载入及初步观察:题目1:每1000行为一个数据模块,逐块读取题目2:表头变中文,索引改为乘客ID题目3:输出前10行和后15行题目4:判断数据是否为空题目5:修改的数据集重新的放入在一个新的`csv`文件中②`pandas`基础:题目1:查看`DataFrame`数据的每列的名称题目2:查看`Cabin`这列的所有值题目3:删除多余的列题目4:隐藏列元素题目5
转载
2024-01-11 22:12:47
74阅读
## 使用R语言分析泰坦尼克号数据
在数据科学的学习旅程中,分析泰坦尼克号数据集是一个经典的入门项目。这个数据集包含了乘客在泰坦尼克号上的信息,我们可以通过分析这些数据来回答许多有趣的问题,比如谁更可能生存下来。本文将指导你如何在R语言中进行这一分析,流程如下:
### 分析流程
我们可以将分析流程整理成如下表格,方便理解各个步骤:
| 步骤 | 描述 |
|------|------|
# 泰坦尼克号数据分析与可视化
## 引言
泰坦尼克号是一艘著名的英国轮船,也是历史上最著名的沉船之一。自从1912年沉没以来,它一直吸引着人们的注意。泰坦尼克号数据集是一个广泛使用的数据集,用于分析和预测泰坦尼克号乘客的生存情况。本文将介绍如何使用R语言对泰坦尼克号数据进行分析和可视化。
## 数据集介绍
泰坦尼克号数据集包含了泰坦尼克号上每位乘客的个人信息和是否生还的标签。数据集包括乘
原创
2023-07-25 14:47:28
529阅读
一、提出问题泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉 。然而不幸的是,在它的处女航中,泰坦尼克号便遭厄运。本文准备预测泰坦尼克号中乘客的生存概率。二、理解数据言归正传,首先登陆kaggle官网:Titanic: Machine Learning from Disasterwww.kaggle.com该文中有项目的详细介绍,在这里可下载后面学习需要的数据:
#
转载
2024-08-22 14:24:17
69阅读
数据分析——泰坦尼克号(二)二、数据清洗及特征处理2.1 导入库#加载所需的库
import numpy as np
import pandas as pd
#加载数据train.csv
data = pd.read_csv('train.csv')
data.head()2.2 缺失值观察与处理2.2.1 缺失值观察# 查看缺失值
# 方法一
data.info()
# 方法二
data.is
转载
2024-05-29 11:10:04
117阅读
案例:泰坦尼号数据分析背景:泰坦尼克号的沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在首次航行期间,泰坦尼克号撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。这场轰动的悲剧震撼了国际社会,并导致了更好的船舶安全条例。 海难导致生命损失的原因之一是没有足够的救生艇给乘客和机组人员。虽然幸存下来的运气有一些因素,但一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。数据集描述
转载
2023-08-13 15:31:06
848阅读
泰坦尼克号幸存者数据分析1、泰坦尼克号数据集2、数据集加载与概览3、泰坦尼克号幸存者数据分析4、哪些人可能成为幸存者 1、泰坦尼克号数据集 泰坦尼克号的沉没是世界上最严重的海难事故之一,造成了大量的人员伤亡。这是一艘号称当时世界上最大的邮轮,船上的人年龄各异,背景不同,有贵族豪门,也有平民旅人,邮轮撞击冰山后,船上的人马上采取措施安排救生艇转移人员,从本次海难中存活下来的,也就是幸存者泰坦尼克
转载
2024-09-04 14:31:15
77阅读
泰坦尼克号获救问题(线性回归 / 逻辑回归 / 随机森林 求解思路)一. 预处理 数据表格首先分析表格中的数据,可以看到 Age 列中的数据是有缺失的,因此,需要补齐所有空缺的Age数据,用中位数。再看Sex列中的性别字符串转换成 数字,便于计算。将所有 male替换为 0, female 替换为1。同理, Embarked 列也要转换成数字,由于该列中依然有缺失,需要填充,那就填充出现
转载
2024-07-04 09:46:36
81阅读
这里写自定义目录标题泰坦尼克号Titanic读入数据1、读取数据2、读入csv\excel\txt数据可视化分析图数据分析1、数据处理—特征工程(feature engineering)2、线性回归3、逻辑回归4、随机森林 泰坦尼克号TitanicKaggle项目之泰坦尼克号titanic实践与相关知识点总结读入数据1、读取数据pandas是常用的python数据处理包 ,它能够把csv文件读入
转载
2024-06-11 22:20:05
118阅读
写这篇博客,有两个目的:1. 我是一个kaggle新手,刚刚完成这个入门项目,想做一个总结。2. 给别的小伙伴讲讲这个项目,顺便提升自己的理解。如果文中有问题,请在 评论区一起讨论,谢谢。流程总结:1. 观察数据,通常使用data.head() 和data.columns.unique()来观察数据的大概情况和特征情况。2. 数据清洗3. 特征提取4. 建立模型5. 输出结果1. 项目说明:1.1
转载
2023-08-10 14:20:33
169阅读
# 如何在R语言中获取泰坦尼克号数据
泰坦尼克号数据集是数据科学和机器学习领域中的经典数据集,通常用于分类和回归问题的教学和实例分析。这篇文章将帮助你通过R语言获取和处理泰坦尼克号的数据集,适合初学者跟随。
## 整体流程
在R语言中获取泰坦尼克号的数据,通常遵循以下步骤:
| 步骤编号 | 步骤描述 |
|----------|--------
原创
2024-09-13 06:41:55
73阅读
# Python泰坦尼克号数据分析
## 引言
泰坦尼克号是一艘著名的客轮,于1912年首航途中遭遇冰山撞击沉没,造成了1502人的伤亡。这一事件引起了全世界的关注,并成为了历史上最为臭名昭著的船舶灾难之一。泰坦尼克号的沉没也成为了数据分析领域的一个经典案例,因为该事件的数据被广泛收集,并且可以用于分析乘客的生存率受到哪些因素的影响。
在本文中,我们将使用Python编程语言对泰坦尼克号的乘
原创
2023-08-14 17:55:45
349阅读
a.前期准备:获取数据,导入数据分析包 #导入数据,忽略警告提示
import warnings
warnings.filterwarnings('ignore')
#导入处理数据包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
#导入
转载
2024-07-15 07:01:08
52阅读
# 实现泰坦尼克号数据集的分析与可视化
## 介绍
泰坦尼克号数据集是一个经典的用于机器学习和数据分析的数据集,它包含了泰坦尼克号上乘客的信息,如年龄、性别、船票等级、是否生还等等。在本文中,我将指导你使用R语言来实现对泰坦尼克号数据集的分析与可视化。
## 步骤
下面是实现该任务的整个流程,我们将分为以下几个步骤来进行:
| 步骤 | 描述 |
| ---- | ---- |
| 1. 导
原创
2023-07-23 07:37:55
550阅读
泰坦尼克号数据可视化分析报告 1. 提出问题泰坦尼克号作为一部感人至深的电影流传至今,作为数据分析领域的一员,也站在数据分析的角度对其进行一些思考和分析,究竟什么样的人在泰坦尼克号更容易生还?2.理解数据2.1 采集数据从Kaggle泰坦尼克号项目界面下载数据:Kaggle泰坦尼克号项目2.2 导入数据 import 2.3 查看数据集信息 print 由上面信息可看出,数据集
转载
2023-10-20 07:31:37
166阅读