该系列精选文章来自于数据社公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。

该系列文章主要包括大数据平台、数据仓库、数据挖掘等。

收藏,大数据系列文章_数据仓库

系列文章都是基于实战总结的干货,下面列出文章链接,建议收藏,方便查看。

收藏,大数据系列文章_kafka_02


【大数据平台】


从0到1搭建大数据平台之数据采集系统

从0到1搭建大数据平台之调度系统

从0到1搭建大数据平台之计算存储系统

从0到1搭建自助分析平台

从0到1搭建大数据平台

基于Ambari的大数据平台搭建

基于CDH(Cloudera Distribution Hadoop)的大数据平台搭建

一文入门流处理开发

浅谈数据中台

数据中台设计方法论

收藏|如何做一个好的大数据平台架构

大数据集群迁移的那一夜是怎么过的|回忆录

收藏|Flink比Spark好在哪?


收藏,大数据系列文章_kafka_02


【数据仓库】


数据分析师应该了解的数据仓库(1)

数据分析师应该了解的数据仓库(2)

数据分析师应该了解的数据仓库(3)

数据分析师应该了解的数据湖

一文了解数据湖引擎

数据湖vs数据仓库vs数据集市

一分钟讲解数据仓库元数据

谈谈ETL中的数据质量

你是分析师,还是“提数机”?

Hive改表结构的两个坑|避坑指南


收藏,大数据系列文章_kafka_02

【数据挖掘】


数据挖掘从入门到放弃(一):线性回归和逻辑回归

数据挖掘从入门到放弃(二):决策树

数据挖掘从入门到放弃(三):朴素贝叶斯

数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法

数据挖掘从入门到放弃(五)seaborn 的数据可视化

数据挖掘从入门到放弃(六):K-means 聚类

数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

数据分析为什么火了

如何入门数据分析?

用户行为分析之数据采集

用户行为分之数据处理


收藏,大数据系列文章_kafka_02

【kafka实战】


Kafka实战宝典:如何跨机房传输数据

kafka实战宝典:手动修改消费偏移量的两种方式

Kafka实战宝典:监控利器kafka-eagle

Kafka实战宝典:一文带解决Kafka常见故障处理

Kafka实战宝典:Kafka的控制器controller详解



收藏,大数据系列文章_kafka_02

【杂谈】


如何参与一个Apache开源项目

聊聊数据库

关于数据库,程序员应该了解的那些事

推荐一款可视化+NoteBook工具

在郑州,你该买哪里的房子?


收藏,大数据系列文章_kafka_02