Spark + AI Summit North America 202006 高清 PPT 全部更新完

过往记忆大数据 过往记忆大数据 Spark Summit North America 2020 会议结束距今已经快一个月了,我也在会议一结束整理了一部分可下载的 PPT,参见《你要的 Spark AI Summit 2020 PPT 我已经给你整理好了》。截止到目前,基本上所有可公开的 PPT 数砖已经上传到 slideshare 网站,参见 https://www.slideshare.net/databricks。我抽空已经把这些 PPT 全部整理完了,总计 148 个,请访问 https://www.iteblog.com/archives/9832.html 页面获取。

这次的会议有很多议题值得我们去学习,推荐大家去看的议题:

  • 第一天的 KeyNote(Delta Engine、LakeHouse);
  • Native Support of Prometheus Monitoring in Apache Spark 3.0
  • Deep Dive into GPU Support in Apache Spark 3.x
  • Sputnik: Airbnb’s Apache Spark Framework for Data Engineering
  • Running Apache Spark on Kubernetes: Best Practices and Pitfalls
  • On Improving Broadcast Joins in Apache Spark SQL
  • Flash for Apache Spark Shuffle with Cosco
  • A Thorough Comparison of Delta Lake, Iceberg and Hudi
  • Bucketing 2.0: Improve Spark SQL Performance by Removing Shuffle
  • SQL Performance Improvements at a Glance in Apache Spark 3.0
  • Zeus: Uber’s Highly Scalable and Distributed Shuffle as a Service
  • Deep Dive into the New Features of Apache Spark 3.0
  • How Adobe Does 2 Million Records Per Second Using Apache Spark!

我也在过去几天挑选了一些比较好的 PPT 写成软文给大家分享,比如:

  • Spark on K8S 的最佳实践和需要注意的坑
  • Apache Spark 3.0 中的向量化 IO
  • Sputnik:Airbnb基于Spark构建的数据开发框架
  • 全方位解读数砖的 Delta Engine
  • Spark 背后的商业公司收购的 Redash 是个啥?
  • 马铁大神的 Apache Spark 十年回顾 在后面一段时间我还会找一些比较好的 PPT 给大家分享,敬请关注。另外,如果大家特别想看其中的一些议题,欢迎在留言区留言,我会挑选一些拿出来分享。

关于本次会议的视频我已经挑选了近50个分享在 《Spark AI Summit North America 2020 专辑》里面,感兴趣可以看下,不过如果有条件的同学建议到 YouTube 官方去看,那里面有字幕。