大家好,我是一哥,整理了系列精选文章来主要包括大数据平台、数据仓库、数据挖掘等。

收藏,大数据文章合集_kafka

系列文章都是基于实战总结的干货,下面列出文章链接,建议收藏,方便查看。

收藏,大数据文章合集_数据仓库_02



【大数据平台】


从0到1搭建大数据平台之数据采集系统

从0到1搭建大数据平台之调度系统

从0到1搭建大数据平台之计算存储系统

从0到1搭建自助分析平台

从0到1搭建大数据平台

基于Ambari的大数据平台搭建

基于CDH(Cloudera Distribution Hadoop)的大数据平台搭建

一文入门流处理开发

浅谈数据中台

数据中台设计方法论

收藏|如何做一个好的大数据平台架构

大数据集群迁移的那一夜是怎么过的|回忆录

收藏|Flink比Spark好在哪?

Hadoop周边组件学习笔记

三万字,Spark学习笔记

Flink学习笔记


收藏,大数据文章合集_数据仓库_02


【数据仓库】


数据分析师应该了解的数据仓库(1)

数据分析师应该了解的数据仓库(2)

数据分析师应该了解的数据仓库(3)

数据分析师应该了解的数据湖

一文了解数据湖引擎

数据湖vs数据仓库vs数据集市

一分钟讲解数据仓库元数据

谈谈ETL中的数据质量

你是分析师,还是“提数机”?

Hive改表结构的两个坑|避坑指南

数据仓库建设规范(文档版)

一哥答疑:数据仓库如何确定主题域?

那些被问懵逼的数仓面试题

面试!什么是数据仓库?

面试,如何使用数据仓库?


收藏,大数据文章合集_数据仓库_02

【数据挖掘】


数据挖掘从入门到放弃(一):线性回归和逻辑回归

数据挖掘从入门到放弃(二):决策树

数据挖掘从入门到放弃(三):朴素贝叶斯

数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法

数据挖掘从入门到放弃(五)seaborn 的数据可视化

数据挖掘从入门到放弃(六):K-means 聚类

数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

数据分析为什么火了

如何入门数据分析?

用户行为分析之数据采集

用户行为分之数据处理


收藏,大数据文章合集_数据仓库_02

【kafka实战】


Kafka实战宝典:如何跨机房传输数据

kafka实战宝典:手动修改消费偏移量的两种方式

Kafka实战宝典:监控利器kafka-eagle

Kafka实战宝典:一文带解决Kafka常见故障处理

Kafka实战宝典:Kafka的控制器controller详解

干货,实战滴滴开源Logi-KafkaManager

kafka实践(十二):生产者(KafkaProducer)源码详解和调试

​收藏,吊打面试官的kafka知识!​


收藏,大数据文章合集_数据仓库_02

【杂谈】


如何参与一个Apache开源项目

聊聊数据库

关于数据库,程序员应该了解的那些事

推荐一款可视化+NoteBook工具

在郑州,你该买哪里的房子?

业务重要?还是技术重要?

浅谈优秀工程师的成长因素

一哥答疑,如何面对繁杂的数据需求?

【一哥闲聊】程序员如何打破35岁魔咒

数仓工程师如何避免沦为“提数机”


收藏,大数据文章合集_数据仓库_02


公众号回复【资料】,免费获取一下整理资料!


收藏,大数据文章合集_kafka_08


收藏,大数据文章合集_kafka_09

最后,数据社开始征稿了


征稿说明

1、稿件类型要求,大数据、数据仓库、数据分析相关原创内容;

2、稿件内容大于2000字;

3、稿件需要在数据社公众号首发,标明投稿者姓名以及简介

4、稿件经过审核发表后,一哥会给作者发100元红包,作为稿酬