Datawhale 河北高校数据挖掘比赛-Task1 赛题理解一、 赛题理解赛题:零基础入门数据挖掘 - 二手车交易价格预测1.1 学习目标理解赛题数据和目标,清楚评分体系。1.2 了解赛题- 赛题概况 - 数据概况 - 预测指标 - 分析赛题1.2.1 赛题概况比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某
数据科学计算、机器学习、以及深度学习领域,Python 是最受欢迎的语言。Python 在数据科学领域,有非常丰富的包可以选择,numpy、scipy、pandas、scikit-learn、matplotlib。但这些库都仅仅受限于单机运算,当数据量很大时,比如50GB甚至500GB的数据集,这些库的处理能力都显得捉襟见肘,打开都很困难了,更别说分析了。本文向大家介绍几个好用的加速工具,可以很
# Java编程大赛题目科普 ## 1. 引言 Java编程大赛是一个面向全国中小学生的Java编程比赛,旨在提高学生的编程能力和创新思维。本文将介绍一道典型的Java编程大赛题目,并以代码示例的形式详细解答。 ## 2. 题目描述 题目要求实现一个简单的学生成绩管理系统,包含以下功能: - 添加学生信息 - 删除学生信息 - 修改学生信息 - 查询学生信息 - 计算学生平均分 - 统计
原创 2023-08-09 04:53:32
212阅读
Java编程那些事儿105——网络编程技术413.2.4 UDP编程         网络通讯的方式除了TCP方式以外,还有一种实现的方式就是UDP方式。UDP(User Datagram Protocol),中文意思是用户数据报协议,方式类似于发短信息,是一种物美价廉的通讯方式,使用该种方式无需建立专用的虚拟连接,由
一. 背景信息 随着信息社会的进步,对网络传输的要求也越来越高,在带宽固定的情况下,数据如何被更好的压缩显得尤为重要。 合理的压
原创 2021-12-27 11:23:52
112阅读
一、选择题主要考察以下:基础的统计学1)贝叶斯 2)条件概率 3)偏态判断、 4)独立、相关、期望、方差、协方差等,围绕Cov(X,Y) = EXY - EX * EY这个公式展开。其他忘了基础的机器学习1) K-NN 2)距离(曼哈顿、欧式、bregman等) 3)k-means 4)关联分析(支持度、置信度等) 5)Precision、Recall、ROC等其他忘了,考的不深。大数据方面的理解
这个比赛偶然在saike上看到的,不是很难比较水,由于是单人参赛,秉持着巩固锻炼一下自己的数据挖掘和机器学习水平的想法就报名了。由于赛题确实没什么含金量,7天的比赛3天我就把论文和代码写完了。不过也得益于我以前存过情感分析的深度学习bert模型代码,所以最后的训练效果非常好。最后离一等奖差了五名,有点遗憾但是也捞了个二等奖。给大家参考一下思路和代码吧题目选择——题目 B:餐饮服务评价情感倾向分析餐
面试- 阿里-. 大数据题目- 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 假如每个url大小为10bytes,那么可以估计每个文件的大小为50G×64=320G,远远大于内存限制的4G,所以不可能将其完全加载到内存中处理,可以 ...
转载 2021-07-16 08:09:00
246阅读
2评论
java程序设计赛前模拟题 一、单选题:(45分)15题单选题,每题3分 第1题 单项选择题     代码片段: System.out.format("Pi is approximately %d.", Math.PI);     请问执行的结果是什么?       A       编译出错 &
如何利用Java实现一个高效的数据存储引擎?不会?细细阅读这篇文章,教你一步步实现并优化。1 前言国际惯例,先报成绩,熬了无数个夜晚,最后依旧被绝杀出了第一页,最终排名第 21 名。前十名的成绩分布为 413.69~416.94,我最终的耗时是 422.43。成绩虽然不是特别亮眼,但与众多参赛选手使用 C++ 作为参赛语言不同,我使用的是 Java,一方面是我 C++ 的能力早已荒废,另一方面是我
一、填空题  1.反映发展趋势的可视化图表有___________、____________和_____________。 2.___________是指发现并纠正数据文件中可识别错误的最后一道程序,是对数据的完整性、一致性和准确性进行重新审查和校验的过程。 3.在使用 RAND 函数时,若要随机抽取 0~100 之间的数值,随机数公式应为_________
【文章内容】 摘要: 随着信息技术的飞速发展,大数据已经渗透到各行各业,为现代社会带来了巨大的变革。本文围绕大数据在软考中的应用,探讨了大数据在软件工程领域中的影响,分析了大数据技术如何提升软件考试的质量和效率,并提出了一种基于大数据技术的软考评估模型。通过对相关数据的分析,证明了大数据技术在软考中具有广阔的应用前景和巨大的价值。 一、引言 近年来,随着互联网、物联网、云计算等技术的快速发
========= 基础 =========1 var, val和def三个关键字之间的区别?valimmutable varia
原创 2022-11-03 14:07:04
57阅读
AETA地震预测 AI 算法大赛——Helloworld队比赛方案(亚军)        首先很幸运拿到AETA地震预测AI数据分析大赛的亚军,非常感谢我的大佬队友(也是我的学弟)。我第一次参赛没有思路也没有经验,想先做一个可行性分析,做一个大而全的方案,导致的后果就是无从下手。队友直接给我上了一课,别想太多,先定一个简单的方案先试着,后期再做改进,不管三
一、题目 提升景区及酒店等旅游目的地美誉度是各地文旅主管部门和旅游相关企业非常重视和关注的工作,涉及到如何稳定客源、取得竞争优势、吸引游客到访消费等重要事项。游客满意度与目的地美誉度紧密相关,游客满意度越高,目的地美誉度就越大。因此掌握目的地游客满意度的影响因素,切实提高游客满意度、最终提升目的地美誉度,不仅能够保证客源稳定,而且对于旅游企业科学监管、资源优化配置以及市场持续开拓具有长远而积极的作
1、用法:DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False) 2、参数说明: labels:要删除的行/列的名字,用列表给出 axis:默认为0,即删除行,删除列时指定为1 index:直接指定要删 ...
转载 2021-09-07 15:22:00
145阅读
2评论
========= 基础 =========1、Hive sql to MRhttps://cwiki.apache.org/confluence/di
原创 2022-11-03 14:06:29
43阅读
==========================================================
原创 2022-11-03 14:04:35
50阅读
========= 基础 =========1、RDD 的 基础​​https://www.jianshu.com/p/fca10efd2315​​​​https://www.jianshu.com/p/6319d6239f03​​​​https://www.jianshu.com/p/64ade88f0e19​​源码​​https://github.com/apache/spark/b
原创 2022-11-03 15:12:44
65阅读
========= 基础 =========1、Flink 的 抽象层次有几种Stateful stream processingCore APITableSQL2、Window 类型(1)T
原创 2022-11-03 15:13:13
104阅读
  • 1
  • 2
  • 3
  • 4
  • 5