# 泰坦尼克生还分析 泰坦尼克号是一艘在1912年沉没的英国客轮,被誉为当时世界上最大、最豪华的客轮之一。然而,这次巨大的悲剧导致了大量乘客和船员的伤亡,引起了全世界的关注和思考。为了更好地了解泰坦尼克号事故发生的原因,我们可以通过数据分析来揭示一些有趣的信息。本文将使用Python分析泰坦尼克号的生还。 ## 数据获取与清理 在开始数据分析之前,我们首先需要获取并清理数据。幸运的是,
原创 2023-08-03 08:38:32
101阅读
      1912年4月14日,Titanic号在其处女航程中,不幸撞击冰山沉没在大西洋,超过1500名船员和乘客遇难,成为人类灾难史上沉痛的一幕,而与之相关的一系列谣言猜测也为后人津津乐道。那么我们不禁会问,船上这么多人,到底有多少人活下来了,这些活下来的又是什么人呢?下面我们从一份泰坦尼克号乘客的数据集来获取信息吧。 数据
相应的数据集和可执行文件均可以在本文中获取。以下各段代码也均可在jupyter中运行,可以随时查看结果。题目描述: 1912年,泰坦尼克号在第一次航行中就与冰山相撞沉没,导致了大部分乘客和船员身亡。在这个项目中,我们将探索部分泰坦尼克号旅客名单,来确定哪些特征可以最好地预测一个人是否会生还分析数据import numpy as np #导入包 import pandas as pd # 加载数
转载 2023-10-23 09:05:40
237阅读
python对titanic进行数据分析 一、数据描述 1、数据解释 • survival:这个人幸存下来了,这也是我们要预测的值 • pclass:就是这个人做的是不是头等仓, class 1 = 1st, 2 = 2nd, 3 = 3rd
转载 2021-06-18 16:38:00
269阅读
# 泰坦尼克号乘客数据分析生还的步骤指南 在本文中,我们将逐步实施一个有关泰坦尼克号乘客数据分析的项目,重点分析生还。对于这一项目,我们将使用Python编程语言和一些常用的数据分析库。希望通过本文的讲解,能够帮助初学者全面理解数据分析的流程和具体实现。 ## 项目流程概述 我们将项目分为以下几个步骤: | 步骤 | 描述 | |------|----
原创 10月前
34阅读
主要分析数据接:https://pan.baidu.com/s/1jn88GiOr7uWA8BDQocFXxg 密码: s0e0不同舱位等级中幸存者和遇难者的乘客比例不同性别的幸存比例幸存和遇难旅客的票价分布幸存和遇难乘客的年龄分布不同上船港口的乘客仓位等级分布幸存和遇难乘客堂兄弟姐妹的数量分布幸存和遇难旅客父母子女的数量分布单独乘船与否和幸存之间有没有联系是否成年男性和幸存之间有没有联系 数
1 首先统计总的死亡人数和幸存人数对比 (柱状图和饼图)import numpy as np import pandas as pd import matplotlib.pyplot as plt from pylab import mpl mpl.rcParams['font.sans-serif'] = ['SimHei'] # SimHei是黑体的意思 df = pd.read_csv(
数据准备import numpy as np import pandas as pd from pandas import Series,DataFrame import matplotlib.pyplot as plt from __future__ import division from scipy import stats import seaborn as sns import pand
泰坦尼克号(RMS Titanic),又译作铁达尼号,是英国白星航运公司下辖的一艘奥林匹克级邮轮,于1909年3月31日在爱尔兰贝尔法斯特港的哈兰德与沃尔夫造船厂动工建造,1911年5月31日下水,1912年4月2日完工试航。泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉 。然而不幸的是,在她的处女航中,泰坦尼克号便遭厄运——她从英国南安普敦出发,途经法国瑟堡-奥
【编者按】大家熟知的电影《泰坦尼克号》,是一部经典的奥斯卡电影,也是一部以真实故事改编而拍的电影。真实故事中,1912年4月14日,这艘当时世界上体积最庞大、内部设施最豪华的客运轮船泰坦尼克号,与一座冰山相撞,2224名船员及乘客中,逾1500人丧生,其中仅333具罹难者遗体被寻回。时隔一个世纪之久,如果用编程的角度,来审视这场灾难,会有什么发现呢?今天的文章,正是用编程来研究泰坦尼克号的生还者情
简介Titanic是Kaggle竞赛的一道入门题,参赛者需要根据旅客的阶级、性别、年龄、船舱种类等信息预测其是否能在海难中生还,详细信息可以参看https://www.kaggle.com/,本文的分析代码也取自 kaggle 中该竞赛的 kernal。数据介绍给出的数据格式如下:PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket
转载 2023-11-16 20:32:36
74阅读
还没关注?快动动手指!1912年当时世界上最大的豪华客轮泰坦尼克号在处女航中撞上冰山沉没,船上船员及乘客共有2224人,只有710人生还。当灾难突然降临时,所有人的生死瞬...
转载 2022-08-09 20:37:32
314阅读
数据集下载地址:https://github.com/fayduan/Kaggle_Titanic/blob/master/train.csv视频地址:http://study.163.com/course/courseLearn.htm?courseId=1003551009#/learn/video?lessonId=1004052093&courseId=1003551009&nbs
泰坦尼克数据可视化分析报告1. 提出问题泰坦尼克号作为一部感人至深的电影流传至今,作为数据分析领域的一员,也站在数据分析的角度对其进行一些思考和分析,究竟什么样的人在泰坦尼克号更容易生还?2.理解数据2.1 采集数据从Kaggle泰坦尼克号项目界面下载数据:Kaggle泰坦尼克号项目2.2 导入数据import numpy as npimport pandas as pdtrain = pd.r
kaggle项目初探,使用机器学习包sklearn 预测泰坦尼克号乘客生存,生存预测是分类问题,使用逻辑回归。提出问题(Business Understanding )理解数据(Data Understanding)数据清洗(Data Preparation )特征工程(Feature Engineering)获取相关系数(Correlation)构建模型(Modeling) 模
这是我做的第一个半完整的数据分析项目,里面包含数据获取,数据清洗,描述性统计,数据可视化,机器学习建模等内容。花了我两天时间,中间出了很多bug,而且原始数据也有问题,因此存在较多缺陷,还请各位大佬多多指教!目录: 1.数据获取 2.数据预处理 3.描述性统计 4.变量分布统计 5.探索变量间的关系 6.特征处理 7.机器学习建模 8.模型准确性评估第一步:数据获取 直接从互联网获取数据impor
转载 2023-12-28 10:01:12
337阅读
这是Kaggle的一道题,这里使用决策树完成预测,方便起见就直接在jupyter lab上来做这题了。1、首先导入需要的包#1、导包 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import cross_val_score #交叉验证 from
这里记录一下通过这个案例掌握的之前不会的api(pandas) 1.数据的统计描述往往都df.decsribe()但是可以分数值型和对象型变量数值型# describe函数查看部分变量的分布 # 因为Survived是0-1变量,所以均值就是幸存人数的百分比,这个用法非常有用 titanic_df[["Survived","Age", "SibSp", "Parch"]].describ
泰坦尼克数据处理【1】 实验目录1 解释步骤2 处理数据3 数据可视化4 修改数据5 训练模型【2】 实验步骤1 解释步骤* 识别和定义问题 * 获取训练和测试数据 * 质疑,准备,清理数据 * 分析,识别模式并探索数据 * 建模,预测并解决问题 * 可视化,报告并提出问题解决步骤和最终解决方案 * 提供并提交结果首先了解一下问题的定义:在泰坦尼克号沉船事 件中,有人幸存了就有人牺
前言  这个是Kaggle比赛中泰坦尼克号生存分析。强烈建议在做这个比赛的时候,再看一遍电源《泰坦尼克号》,可能会给你一些启发,比如妇女儿童先上船等。所以是否获救其实并非随机,而是基于一些背景有先后顺序的。1,背景介绍  1912年4月15日,载着1316号乘客和891名船员的豪华巨轮泰坦尼克号在首次航行期间撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。沉船导致大量伤亡的原因之一
  • 1
  • 2
  • 3
  • 4
  • 5