1)目标任务网址:kaggle_泰坦尼克号1912年4月15日,在她的处女航中,被广泛认为的泰坦尼克号与冰山相撞后沉没。不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡。尽管幸存者有一些运气,但似乎有些人比其他人更有可能生存。在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 使用旅客数据(即姓名,年龄,性别,社会经济舱等
转载
2024-08-03 16:30:39
70阅读
kaggle:泰坦尼克第一节:①数据载入及初步观察:题目1:每1000行为一个数据模块,逐块读取题目2:表头变中文,索引改为乘客ID题目3:输出前10行和后15行题目4:判断数据是否为空题目5:修改的数据集重新的放入在一个新的`csv`文件中②`pandas`基础:题目1:查看`DataFrame`数据的每列的名称题目2:查看`Cabin`这列的所有值题目3:删除多余的列题目4:隐藏列元素题目5
转载
2024-01-11 22:12:47
74阅读
这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个简单的分析好了。使用工具:Excel(对,就是这么简单粗暴)数据源的获取可后台回复:泰坦尼克一、明确目的1912年泰坦尼克号撞上冰山沉没,船上2224名乘客和机组人员中有1502人遇难,幸存下来的人是出于运气还是
原创
2021-01-19 21:31:13
2368阅读
那些人士生还的可能性大?
原创
2021-09-07 14:20:32
2247阅读
这是我做的第一个半完整的数据分析项目,里面包含数据获取,数据清洗,描述性统计,数据可视化,机器学习建模等内容。花了我两天时间,中间出了很多bug,而且原始数据也有问题,因此存在较多缺陷,还请各位大佬多多指教!目录: 1.数据获取 2.数据预处理 3.描述性统计 4.变量分布统计 5.探索变量间的关系 6.特征处理 7.机器学习建模 8.模型准确性评估第一步:数据获取 直接从互联网获取数据impor
转载
2023-12-28 10:01:12
337阅读
一、提出问题泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉 。然而不幸的是,在它的处女航中,泰坦尼克号便遭厄运。本文准备预测泰坦尼克号中乘客的生存概率。二、理解数据言归正传,首先登陆kaggle官网:Titanic: Machine Learning from Disasterwww.kaggle.com该文中有项目的详细介绍,在这里可下载后面学习需要的数据:
#
转载
2024-08-22 14:24:17
69阅读
泰坦尼克号数据分析 预测建模 准确率测算目录本文思路:1.搜集现有分析代码2.原文中代码存在不足,对相关库的引入及运行异常没有说明完善,因此,对原代码进行了完善。3.数据分析思路回顾及其他数据分析思路梳理a.对数据集的维度进行分析,初步了解其特征情况。b.可对数据情况进行各种分析c.对于已经被拆分为训练集和测试集的,可以通过合并再清洗的方式,简化工作(此处的数据清洗逻辑与上文的清洗逻辑相同,但代
转载
2023-12-19 06:42:46
124阅读
案例:泰坦尼号数据分析背景:泰坦尼克号的沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在首次航行期间,泰坦尼克号撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。这场轰动的悲剧震撼了国际社会,并导致了更好的船舶安全条例。 海难导致生命损失的原因之一是没有足够的救生艇给乘客和机组人员。虽然幸存下来的运气有一些因素,但一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。数据集描述
转载
2023-08-13 15:31:06
848阅读
泰坦尼克号获救问题(线性回归 / 逻辑回归 / 随机森林 求解思路)一. 预处理 数据表格首先分析表格中的数据,可以看到 Age 列中的数据是有缺失的,因此,需要补齐所有空缺的Age数据,用中位数。再看Sex列中的性别字符串转换成 数字,便于计算。将所有 male替换为 0, female 替换为1。同理, Embarked 列也要转换成数字,由于该列中依然有缺失,需要填充,那就填充出现
转载
2024-07-04 09:46:36
81阅读
泰坦尼克号数据集,是kaggle(Titanic: Machine Learning from Disaster)上入门机器学习(ML)的一个好的可选数据集,当然,也是不错的练习数据分析的数据集。对 python ,在数据分析方面,作为一柄利器,涵盖了「数据获取→数据处理→数据分析→数据可视化」这个流程中每个环节,这个项目作为新生练习最好不过了。探索的问题主要探寻坦尼克号上的生还率和各因素(客舱等
转载
2024-01-02 11:47:58
168阅读
这里写自定义目录标题泰坦尼克号Titanic读入数据1、读取数据2、读入csv\excel\txt数据可视化分析图数据分析1、数据处理—特征工程(feature engineering)2、线性回归3、逻辑回归4、随机森林 泰坦尼克号TitanicKaggle项目之泰坦尼克号titanic实践与相关知识点总结读入数据1、读取数据pandas是常用的python数据处理包 ,它能够把csv文件读入
转载
2024-06-11 22:20:05
118阅读
本文是优达学城数据分析师 P2 项目的结课报告,主要探寻泰坦尼克号上的生还率和各因素(客舱等级、年龄、性别、上船港口等)的关系。# Imports
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
# Read titanic
转载
2024-05-12 16:17:23
80阅读
写这篇博客,有两个目的:1. 我是一个kaggle新手,刚刚完成这个入门项目,想做一个总结。2. 给别的小伙伴讲讲这个项目,顺便提升自己的理解。如果文中有问题,请在 评论区一起讨论,谢谢。流程总结:1. 观察数据,通常使用data.head() 和data.columns.unique()来观察数据的大概情况和特征情况。2. 数据清洗3. 特征提取4. 建立模型5. 输出结果1. 项目说明:1.1
转载
2023-08-10 14:20:33
169阅读
在泰坦尼克号和titanic2数据帧描述泰坦尼克号上的个别乘客的生存状态。这里使用的数据集是由各种研究人员开始的。其中包括许多研究人员创建的旅客名单,由Michael A. Findlay编辑。我们提取的数据集中的特征是票的类别,存活,乘坐班,年龄,登陆,home.dest,房间,票,船和性别。
转载
2021-10-19 21:26:00
491阅读
# Python泰坦尼克号数据分析
## 引言
泰坦尼克号是一艘著名的客轮,于1912年首航途中遭遇冰山撞击沉没,造成了1502人的伤亡。这一事件引起了全世界的关注,并成为了历史上最为臭名昭著的船舶灾难之一。泰坦尼克号的沉没也成为了数据分析领域的一个经典案例,因为该事件的数据被广泛收集,并且可以用于分析乘客的生存率受到哪些因素的影响。
在本文中,我们将使用Python编程语言对泰坦尼克号的乘
原创
2023-08-14 17:55:45
349阅读
a.前期准备:获取数据,导入数据分析包 #导入数据,忽略警告提示
import warnings
warnings.filterwarnings('ignore')
#导入处理数据包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
#导入
转载
2024-07-15 07:01:08
52阅读
泰坦尼克号数据可视化分析报告 1. 提出问题泰坦尼克号作为一部感人至深的电影流传至今,作为数据分析领域的一员,也站在数据分析的角度对其进行一些思考和分析,究竟什么样的人在泰坦尼克号更容易生还?2.理解数据2.1 采集数据从Kaggle泰坦尼克号项目界面下载数据:Kaggle泰坦尼克号项目2.2 导入数据 import 2.3 查看数据集信息 print 由上面信息可看出,数据集
转载
2023-10-20 07:31:37
166阅读
泰坦尼克号生存预测这是kaggle上面比较入门的一个比赛。今天让我们来看看怎么做吧。kaggle传送门。首先报名,下载数据集。数据载入及概述首先导入从Kaggle上面下载的数据集,在导入的过程中就需要先导入一些必备的包了。import numpy as np
import pandas as pd
# 接着导入我们的训练数据
filename = 'titanic/train.csv' # 这
转载
2023-11-06 23:04:35
133阅读
虽然到处都是泰坦尼克号生存预测的案例,但是还是要再来一遍。哈哈哈。作为入门还是可以的。此篇文章为新手小白入门,大佬请指点。文章较长,下面进入正题。目录提出问题(Business Understanding )理解数据(Data Understanding)采集数据导入数据查看数据集信息3.数据清洗(Data Preparation )数据预处理特征工程(Feature Enginee
转载
2024-01-26 11:33:18
135阅读
# 使用Python进行泰坦尼克号数据分析
泰坦尼克号(Titanic)是历史上最著名的一艘豪华客轮,它于1912年撞上冰山后沉没,导致超过1500人遇难。泰坦尼克号事件吸引了无数人的关注,也成为数据分析与机器学习领域的经典案例之一。本文将介绍如何使用Python对泰坦尼克号乘客数据进行分析,重点展示数据预处理、可视化和简单的模型构建。
## 1. 数据获取与导入
泰坦尼克号的数据集可以在K