目录02-01-什么是大数据02-02-数据仓库和大数据搭建数据仓库的过程.png02-03-OLTP和OLAP02-04-分布式文件系统的基本思想分布式文件系统的基本思想.png02-05-什么是机架感知机架感知的基本思想.png02-06-什么是倒排索引什么是索引.png什么是倒排索引.png02-07-HDFS的体系架构和Demo演示02-08-什么是PageRankGoogle的向量矩阵.
转载
2023-09-05 19:31:28
67阅读
一、大数据技术与应用入门培训教程大纲 1.1.大数据定义与解决方案 1.2.大数据行业应用 1.3.大数据技术学习前景 1.4.大数据从业岗位要求 1.5.大数据常用概念
转载
2023-07-25 11:47:14
67阅读
大数据课程介绍什么是大数据:海量数据的处理大数据用在哪:用在需要对海量数据进行处理的任何场合大数据学什么: (1)学分布式系统的思想 (2)学框架基础课程内容介绍Linux & Shell编程基础 Hadoop Mapreduce数据的处理流程: 收集数据—>web服务器,打日志–flume,sqoop–>hadoop(hdfs)----->数据的清理----->数
转载
2023-08-10 22:13:29
50阅读
在这个博文中,我想分享我在学习Python爬虫课程时的一些感想和体会。在这个过程中,我深入探讨了协议背景、抓包方法、报文结构、交互过程、字段解析以及工具链集成等内容,希望这些能帮助到同样在学习或使用爬虫技术的朋友们。
### 协议背景
首先,我们来聊聊协议背景。在爬虫技术中,HTTP协议是我们最常接触到的,理解HTTP的基础知识对于抓取网页数据至关重要。为了更全面地理解各类协议的演变,我们可以
《数值分析》课程体会一对数值分析的认识数值分析的定义:数值分析(numerical analysis)是研究分析用计算机求解数学计算问题的数值计算方法及其理论的学科,是数学的一个分支,它以数字计算机求解数学问题的理论和方法为研究对象。为计算数学的主体部分。运用数值分析解决问题的过程:实际问题→数学模型→数值计算方法→程序设计→上机计算求出结果数值分析这门学科有如下特点:1·面向计算机2·
转载
2024-07-29 13:46:17
29阅读
软工课程已经结束了,我们学习了很多知识,完成了一个小项目,小组成员们都有了很多感想。 徐丹: 软件工程这门课程教会了我们完成一个项目的具体过程。在软工的实践课程中,我们小组共同完成了一个小项目,但即使是一个小项目,过程也并不简单。从项目立项到写需求文档,到项目的具体开发以及测试都是一个很复杂、很精细 ...
转载
2021-06-22 00:56:00
432阅读
2评论
数据库基础知识常用数据库有哪些? MySQL,oracle,DB2,SQLServer,OceanBaseSQL语言SQL语言是非过程性语言 DDL数据库定义语言 用来定义数据库对象:数据库,表,列 关键字:creat ,drop,alter,truncate,show等DML数据库操作语言 用来对表中数据进行更新,增加和删除记录 如updata,insert,delete,不包含查询DCL数据库
转载
2024-09-26 13:48:51
12阅读
前言Python编程语言有许多语法结构、标准库函数和交互式开发环境功能。好在,你可以忽略大多数内容。你只需要学习部分内容,就能编写一些方便的小程序。但在动手之前,你必须学习一些基本编程概念。就像魔法师培训,你可能认为这些概念既深奥又啰嗦,但有了一些知识和实践,你就能像魔法师一样指挥你的计算机,完成难以置信的事情。本章有几个例子,我们鼓励你在交互式环境中输入它们。交互式环境让你每次执行一条Pytho
转载
2023-09-12 15:30:17
75阅读
为了广大学员更好的学习spark,对《Spark大数据快速计算平台》最初课程重新安排,便于更全面、更系统的了解spark。大部分课程是一周的内容(1-2小时),有部分课程是二周的内容(2-4小时);二周内容的课程会一次性发放,但间隔时间会多一周,总的课程...
转载
2022-11-09 00:00:18
257阅读
大数据领域三个大的技术方向:1、Hadoop大数据开发方向2、数据挖掘、数据分析&机器学习方向3、大数据运维&云计算方向大数据学习什么Python:Python 的排名从去年开始就借助人工智能持续上升,现在它已经成为了语言排行第一名。 语法简捷而清晰,对底层做了很好的封装,是一种很容易上手的高级语言。 大数据和数据科学领域,任何集群架构软件都支持Python,Python也有很丰富
转载
2023-09-12 21:21:21
2阅读
大数据体系结构(开源组件介绍),让你对当前大数据技术栈一目了然; Linux命令基础实战; Hadoop基础,对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍,让你快速把握Hadoop的核心技术和工作原理,逐渐形成分布式思维; Sqoop,作为关系型数据库与Hadoop之间的桥梁,批
转载
2016-11-02 20:50:00
236阅读
2评论
1) 值得保持的优点团队氛围融洽、交流通畅。团队构成比较合理。年轻人技术强力,老人能够把控项目方向。遇到问题及时沟通,群策群力解决问题。有吃苦耐劳的精神,每个人都抱有很高的责任心。能顶住持续高强的压力。公司大环境给予的支持力度大,从技术、工程、到后勤保障都值得称赞。 2) 仍需要改进的地方需求管理:客户提出来的需求比较零散,需要整理入册,安
相较本科阶段要学习的计算机编程语言,比如:java,linux,mysql等,研究生的大数据专业会更加深入一点
相较本科阶段要学习的计算机编程语言,比如:java,linux,mysql等,研究生的大数据专业会更加深入一点,更多的是接触学习数据的采集与分析(Python、Scala),大数据的存储(hbase、hive、sqoop),学习处理软件,学习数
转载
2023-06-02 19:52:28
170阅读
【1】linux命令 (1)who查找登录的用户 (2)last -n(-3)查看最近的登陆历史记录 (3)关机/重启 shutdown -h now 立刻关机 shutdown -h +10 10分钟以后关机 shutdown -h 12:00:00 12点整的时候关机 halt 立刻关机 shu ...
转载
2021-07-27 15:24:00
172阅读
2评论
学习方法: 1、如何写博客?给自己的学习留痕迹? markdown语法:给自己的学习做笔记 2、如何通过视频学习优质资源? 跟紧加速播放功能!potplayer神器、百度云盘 3、如何找到有价值的源码资源? github、码云、coding.net的下载 4、如何学习权威知识? 官网指引,谷歌翻译 5、各大学习网站介绍? 慕课网、51CTO(开会员)、极客学院、麦子学院(前端)、网易云课堂、哔哩哔
原创
2022-03-11 17:47:14
238阅读
大数据课程-------redis部分
转载
2021-07-29 17:44:00
75阅读
2评论
学习方法:1、如何写博客?给自己的学习留痕迹?markdown语法:给自己的学习做笔记2、如何通过视频学习优质资源?跟紧加速播放功能!potplayer神器、百度云盘3、如何找到有价值的源码资源?github、码云、coding.net的下载4、如何学习权威知识?官网指引,谷歌翻译5、各大学习网站介绍?慕课网、51CTO(开会员)、极客学院、麦子学院(前端)、网易云课堂、哔哩哔...
原创
2021-06-11 09:22:50
315阅读
在学*了*一个学期java后,我有了一点自己的见解。Java是面向对象的,具有平台无关性。所以现在被广泛的应用于很多领域。也是因为老师在开始上课的时候就给我们讲过这些,所以带有兴趣和动力去学*java程序设计。
在开始学*java时,觉得有c语言做基础会比较容易一些。Java区分大小写,在一开始调试别人的程序时,常会因为字母、空格等一些小的失误调试不出来,慢慢地随着练*的增多,这些低级错误
转载
2023-07-20 23:52:56
77阅读
大数据金融风控的预测案例 1)数据准备 a)离群点处理 总体上先对数据进行了解,做一些简单统计,对连续性数值与字符型数值的处理; 离群点的处理: 首先,离群点的定义:是与其他大多数样本的行为或特征分布不一致的那些点; 处理方式:方法1—首先统计每个样本下缺省的特征(列)数,然后进行排序,画图,拆分成训练集与测试集进行对比,这样可以保证训练集与测试集分布一致;(注:在一些模型的训练中,结果往往得不到
转载
2024-01-15 09:34:19
55阅读
笔记内容: 一、集合及其运算在之列表中我们可以存储数据,并且对数据进行各种各样的操作。但是如果我们想要对数据进行去重时是十分麻烦的,需要使用循环,要建立新的列表,还要进行对比,十分的麻烦,还消耗内存,所以我们在编程过程中就要使用集合。Python中的集合和数学中的集合是一样的,也存在交并补的运算。集合的所有数据用花括号括起来,每个数据用逗号分隔。我们可以来建立一个集合或者建立
转载
2023-05-28 18:05:32
85阅读