上次已经讲了怎么下载数据,这次就不说废话了,直接开始。首先导入相应的模块,然后检视一下数据情况。对数据有一个大致的了解之后,开始进行下一步操作。 一、分析数据 1、Survived 的情况train_data['Survived'].value_counts() 2、Pclass 和 Survived 之间的关系train_data.groupby('Pclass')['Survived
转载
2024-10-09 22:31:30
89阅读
一个非常经典的机器学习实战题目。 通过python,运用线性回归、逻辑回归、随机森林、堆叠算法等处理数据判断船员存活情况。 代码在唐宇迪教程的代码的基础上进行了修改,主要结合用到的库的更新做出一定改动,以适应目前版本。全部代码都运行过,确保近期可用。导入训练集(共891条)import pandas
titanic = pandas.read_csv("titanic_train.csv")
ti
转载
2024-10-11 09:25:54
94阅读
引言 机器学习算法都是为项目为数据服务的,某一个算法都有它自己的适用范围,以及优势与劣势,研究算法由于平日的日常操练,那么用它去做项目就如同上战场杀敌一样,去发挥它的价值,kaggle就是这样一个刷怪升级的地方,在kaggle里面有无数的妖魔,等级从初级到专家级不等,下面就让我们去尝试一下。套路 &nb
转载
2024-09-23 06:15:20
69阅读
import pandas #ipython notebook
titanic = pandas.read_csv("titanic_train.csv")
titanic.head(5)titanic["Age"] = titanic["Age"].fillna(titanic["Age"].median()) #age将空值填充为平均值 (处理age)
titanic.describe()
转载
2023-08-02 13:51:20
183阅读
Kaggle入门——Titanic(一)最近开始接触Kaggle,并且希望借此机会学习一下PyTorch,因此开坑一下这个系列,主要是借助PyTorch搭建模型来解决Kaggle的问题,由于PyTorch和Kaggle都是入门,所有错误在所难免,大家别当做什么入门宝典== 问题大致就是船倒了,旅客需要逃生,但是救生艇的数量是有限的,没有办法每个人都坐上救生艇,然后副船长说出了女士和小孩优先,由此可
转载
2023-12-27 10:20:34
133阅读
# 泰坦尼克号沉没预测Python源代码实现指南
## 1. 简介
在本文中,我将指导你如何使用Python来实现泰坦尼克号沉没预测的源代码。我们将使用机器学习算法来训练一个模型,根据乘客的特征预测他们是否会在泰坦尼克号的沉没事件中幸存。
## 2. 整体步骤概览
在这个项目中,我们将采取以下步骤来实现泰坦尼克号沉没预测的Python源代码:
1. 数据加载和预处理。
2. 特征工程,包括
原创
2023-08-30 03:17:22
176阅读
简介Titanic是Kaggle竞赛的一道入门题,参赛者需要根据旅客的阶级、性别、年龄、船舱种类等信息预测其是否能在海难中生还,详细信息可以参看https://www.kaggle.com/,本文的分析代码也取自 kaggle 中该竞赛的 kernal。数据介绍给出的数据格式如下:PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket
转载
2023-11-16 20:32:36
74阅读
# 用Python分析泰坦尼克号沉船数据
泰坦尼克号是一艘著名的豪华客轮,它在1912年首次航行时撞上了冰山,导致1500多名乘客和船员遇难。这个悲剧引发了人们对海上安全的广泛关注。同时,泰坦尼克号也成为了数据分析和机器学习领域的重要案例。在本文中,我们将使用Python分析泰坦尼克号的数据,并尝试预测乘客的生存机会。
## 数据集介绍
我们将使用Kaggle上提供的“泰坦尼克号”数据集。这
# 基于Python的“泰坦尼克号”项目指导
欢迎来到“泰坦尼克号Python”项目的学习之旅!这个项目旨在使用Python分析泰坦尼克号乘客数据,预测哪些乘客可能生还。下面的文章将指引你一步步完成这个项目。
## 项目流程
在开始我们的项目之前,让我们先概述一下整个流程。以下是完成泰坦尼克号项目的步骤表:
| 步骤 | 描述
【目录】kaggle介绍项目练手:泰坦尼克号收获分享 一、kaggle介绍 kaggle是一个数据科学竞赛平台,创立于2010年,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。kaggle官方表示,该社区目前在全世界范围内已有超过80万注册用户。 以上是官方介绍,我们换个角度来理解kaggle:kaggle是为了解决什么问题而被创造出
转载
2023-11-04 13:12:48
304阅读
?引言泰坦尼克号的沉没是历史上最惨痛的沉船事件之一。1912年4月15日,泰坦尼克号在其处女航中与冰山相撞后沉没,2224名乘客和船员中的1502人死亡。在这个数据分析项目中,我们需要完成对什么样的人有可能幸存的分析。特别是,我们需要你应用机器学习的工具来预测哪些乘客在悲剧中幸存下来。在本文中,我们就从数据的角度出发对泰坦尼克幸存者进行分析与预测,话不多说我们开始吧。?数据获取本项目数据基于Kag
转载
2023-12-15 19:29:08
93阅读
接触数据挖掘内容较少,加之本次写作业较为匆忙,只能借鉴大佬思路进行相应的探索,后续会合理安排工作与学习时间,挤出时间认真完成作业!!数据探索之前断断续续做过中文文本分类项目,通过朴素贝叶斯原理,使用多项式算法建立模型对商品进行打标签,才算是首次接触数据挖掘,通过中文文本分类,第一次了解过拟合、交叉验证、TF-IDF、词向量等等术语,不断地加深对数据挖掘的认知,而本次泰坦尼克-数据挖掘项目,算是另一
转载
2023-12-21 20:40:05
61阅读
文章目录一、建模基本流程二、结构化数据建模流程2.1 泰塔尼克号数据2.2 数据处理2.3 建立模型2.4 训练模型2.5 评估模型2.6 模型预测27 保存模型 一、建模基本流程数据处理建立模型训练模型评估模型模型预测保存模型二、结构化数据建模流程数据文件:链接:https://pan.baidu.com/s/1H3QBVLPv4WeUnIYH92OKEA?pwd=wh77
提取码:wh77
转载
2024-02-04 10:35:21
139阅读
介绍泰坦尼克号是一艘著名的豪华客轮,在其处女航中遭遇灾难,导致1500多名乘客和船员丧生。在这个项目中,我们将基于泰坦尼克号数据集探索一个基于机器学习的问题,该数据集包含有关乘客的信息,如他们的年龄、性别、船舱等级以及他们是否在船沉没时幸存下来。本项目的目标是使用机器学习技术构建一个能够根据可用特征准确预测给定乘客是否在泰坦尼克号灾难中幸存的模型。这个问题不仅对历史感兴趣,还具有实际应用,比如改善
转载
2024-07-22 11:15:44
65阅读
泰坦尼克船员获救数据: titanic_train.csv用excel打开数据集。显示如下:写在前边:np和pd.import pandas as pd #造pandas的别名为pd
import numpy as np #造numpy的别名为np 一、读取数据import pandas as pd #造pandas的别名为pd
i
转载
2024-04-23 08:38:11
88阅读
在第一节“Python-数据清洗与分析案例之泰坦尼克号(一)”网址:https://www.lixdx.cn/archives/93 中进行了数据清洗与缺失值填充,接下来进行数据可视化分析,找到生存率的影响因素。注意:本章中年龄的缺失值为案例分析(一)中用年龄和舱位的中位数的值填充。提出问题:什么因素会影响乘客的生还率?影响乘客生还率的因素很多,这里只讨论乘客的性别、年龄以及舱位是否对生还率产生影
转载
2024-05-10 00:24:12
41阅读
工作流程:在数据科学竞赛的解决问题的七个步骤:1.问题或问题的定义。(理解题目)2.获得培训和测试数据。(获取数据)3.争论,准备清理数据。(初步清洗数据)4.分析、识别模式,并探索数据。(特征工程)5.模型,预测和解决问题。(机器学习算法介入)6.可视化报告,并提出解决问题的步骤和最终的解决方案。(调参、优化)7.供应或提交结果。涉及相关算法:线性回归、逻辑回归、随机森林、模型融合。问题回顾:1
转载
2024-01-15 19:37:17
43阅读
这是我做的第一个半完整的数据分析项目,里面包含数据获取,数据清洗,描述性统计,数据可视化,机器学习建模等内容。花了我两天时间,中间出了很多bug,而且原始数据也有问题,因此存在较多缺陷,还请各位大佬多多指教!目录: 1.数据获取 2.数据预处理 3.描述性统计 4.变量分布统计 5.探索变量间的关系 6.特征处理 7.机器学习建模 8.模型准确性评估第一步:数据获取 直接从互联网获取数据impor
转载
2023-12-28 10:01:12
337阅读
文章目录数据引入和初步分析csv数据引入和概览初步探索分析PclassSexNameSibSpParchEmbarkedFare可视化分析AgeAge & SexPclass & AgePclass & Sex & EmbarkedEmbarked & Sex & Fare数据整理PassengerIdTitle将分类值转变为数值以便模型分析和预测
转载
2023-08-07 15:29:20
276阅读
数据集来源于kaggle经典竞赛数据集
一、目的根据数据集中的信息,利用python机器学习对泰坦尼克乘客是否生还进行预测。二、数据集我的数据集有三个,test、train、genderclassmodel,都是csv格式test和train数据集中的字段: 从左到右依次是,乘客编号、是否生还、仓位、姓名、性别、年龄、船上同辈亲属的人数、乘客有父母或孩子的人数、船票号、旅费
转载
2024-01-10 17:40:00
144阅读