1.提出问题什么样的人在泰坦尼克号中更容易存活?2.理解数据2.1 采集数据从Kaggle泰坦尼克号项目页面下载数据:Titanic: Machine Learning from Disaster2.2 导入数据 #导入处理数据包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#训练数据
转载
2023-12-13 22:47:21
49阅读
【目标检测】军用民用飞机卡车坦克数据集6527张YOLO+VOC格式数据集格式:VOC格式+YOLO格式
压缩包内含:3个文件夹,分别存储图片、xml、txt文件
JPEGImages文件夹中jpg图片总计:6527
Annotations文件夹中xml文件总计:6527
labels文件夹中txt文件总计:6527
标签种类数:6
标签名称:["0","1","2","3","4","5"]
标
【目标检测】军用民用飞机卡车数据集6530张YOLO-VOC格式数据集格式:VOC格式+YOLO格式
压缩包内含:3个文件夹,分别存储图片、xml、txt文件
JPEGImages文件夹中jpg图片总计:6530
Annotations文件夹中xml文件总计:6530
labels文件夹中txt文件总计:6530
标签种类数:6
标签名称:["civilian aircraft","civil
中国最强数据库学术会议来袭!在NDBC大会期间,达摩院数据库与存储实验室联合中国计算机学会(CCF)数据库专业委员会,举办了首届产业数据库研发论坛。产学研的思想碰撞,见证“阿里力量”
原创
2018-10-19 14:04:16
291阅读
12月20日-21日,由中国信通院、中国通信标准化协会主办,中国通信标准化协会大数据技术标准推进委员会承办的“2023数据资产管理大会”在京召开。在会上,第七届大数据“星河(Galaxy)”案例评选结果正式公布。中移在线服务有限公司(中移在线)与酷克数据联合申报的《基于云原生化的数据仓库平台,实现数据算力交付效率全面提升》项目,凭借全栈自主可控、敏捷高效、安全稳定的先进特性,成为业内首个容器化部署
原创
2024-04-08 17:28:18
111阅读
目录Titanic泰坦尼克数据集入门简介准备工作数据加载与探索数据清洗与处理特征工程与建模结果评估与优化总结Titanic泰坦尼克数据集入门1. 导入数据2. 数据清洗3. 数据分析和可视化4. 预测生还率Titanic泰坦尼克数据集入门简介泰坦尼克号是一艘英国豪华轮船,于1912年4月15日在首次航行时沉没。这场海难造成了非常多的生命损失,同时也引起了全球范围的轰动。Titanic数据集是一个广
转载
2024-06-23 11:05:02
100阅读
importturtleimporttimeturtle.pensize(3)turtle.setup(1000,800)turtle.pencolor("red")turtle.speed(10)turtle.penup()turtle.goto(-400,-400)turtle.pendown()turtle.left(135)turtle.fd(100)turtle.ri
原创
2020-08-09 14:34:47
234阅读
点赞
importturtleimporttimeturtle.pensize(3)turtle.setup(1000,800)turtle.pencolor("red")turtle.speed(10)turtle.penup()turtle.goto(-400,-400)turtle.pendown()turtle.left(135)turtle.fd(100)turtle.ri
原创
2020-08-09 14:34:41
377阅读
点赞
# 用Python分析泰坦尼克号数据
泰坦尼克号是历史上最著名的沉船事故之一,基于这个事件的数据集为数据科学家提供了丰富的分析素材。本文将通过Python对泰坦尼克号数据集进行基本的分析,并展示如何使用各种可视化手段。
## 数据获取与处理
首先,我们需要获取泰坦尼克号的数据集。常用的来源是Kaggle网站上的泰坦尼克号生存者数据集。数据主要包含乘客的年龄、性别、船票价等信息。我们将使用`p
# Python 马赛克数据增强实操指南
在数据科学与机器学习中,数据增强是一种常见且有效的手段,以帮助提高模型的性能。马赛克数据增强是一种将图片块进行随机切换的方法,极大提升了数据的多样性。本文将详细介绍如何用Python实现马赛克数据增强,整个流程分为几个步骤,我们将用表格展示这些步骤。
## 整体流程
| 步骤 | 描述
本系列是针对《机器学习实战》蜥蜴书第二版自己的总结,结合吴恩达的ML课部分理论内容。这里拿泰坦尼克这个经典例子来说明对于机器学习算法的数据清洗技术。观察数据首先从kaggle下载数据得到 train.csv 和 test.csv加载数据train_data = pd.read_csv('drive/Colab Notebooks/ml/datasets/titanic/train.csv')
te
转载
2024-06-30 16:26:38
90阅读
题目简析上一篇用了贝叶斯分类器,这次用决策树和随机森林试一试,不过最终的得分没有贝叶斯分类器高,好吧,说实话,感觉再用几个不同的机器学习方法应该结果也差不多,现在主要是试水,先搞懂基础的算法,然后再通过数据的处理与分析去优化结果。决策树我个人认为,决策树应该是比较好理解的机器学习算法了。其中心思想就是ifelse,存在很多个条件的时候,如果第一个条件是A,第二个条件是B…………就选择方案C。是一个
# 法那克数据采集 Python API
## 什么是法那克数据采集?
法那克数据采集是一种用于获取和分析网页数据的工具。它提供了一个简单易用的 Python API,使用户能够轻松地编写脚本来提取数据,并将其保存到本地或进行进一步处理。
## 安装法那克数据采集 API
要使用法那克数据采集 API,首先需要安装相关的 Python 包。在命令行中运行以下命令来安装:
```shell
原创
2023-10-21 09:24:15
25阅读
# Python泰坦尼克数据下载与分析
泰坦尼克号沉船事件是历史上最著名的海难之一,这起事件不仅吸引了大量的研究者关注,也成为了数据科学领域中经典的数据分析和机器学习案例。借助Python,尤其是常用的数据分析库,如Pandas和Matplotlib,我们可以轻松地下载并分析泰坦尼克号的数据集。
## 数据下载
在开始分析之前,我们需要获取泰坦尼克号的数据集。通常,这些数据集可以在Kaggl