Spark Summit North America 2020 会议结束距今已经快一个月了,我也在会议一结束整理了一部分可下载的 PPT,参见《你要的 Spark AI Summit 2020 PPT 我已经给你整理好了》。截止到目前,基本上所有可公开的 PPT 数砖已经上传到 slideshare 网站,参见 https://www.slideshare.net/databricks。我抽空已经把这些 PPT 全部整理完了,总计 148 个,请访问 https://www.iteblog.com/archives/9832.html 页面获取。


Spark + AI Summit North America 202006 高清 PPT 全部更新_java


这次的会议有很多议题值得我们去学习,推荐大家去看的议题:

  • 第一天的 KeyNote(Delta Engine、LakeHouse);

  • Native Support of Prometheus Monitoring in Apache Spark 3.0

  • Deep Dive into GPU Support in Apache Spark 3.x

  • Sputnik: Airbnb’s Apache Spark Framework for Data Engineering

  • Running Apache Spark on Kubernetes: Best Practices and Pitfalls

  • On Improving Broadcast Joins in Apache Spark SQL

  • Flash for Apache Spark Shuffle with Cosco

  • A Thorough Comparison of Delta Lake, Iceberg and Hudi

  • Bucketing 2.0: Improve Spark SQL Performance by Removing Shuffle

  • SQL Performance Improvements at a Glance in Apache Spark 3.0

  • Zeus: Uber’s Highly Scalable and Distributed Shuffle as a Service

  • Deep Dive into the New Features of Apache Spark 3.0

  • How Adobe Does 2 Million Records Per Second Using Apache Spark!


我也在过去几天挑选了一些比较好的 PPT 写成软文给大家分享,比如:

在后面一段时间我还会找一些比较好的 PPT 给大家分享,敬请关注。另外,如果大家特别想看其中的一些议题,欢迎在留言区留言,我会挑选一些拿出来分享。


关于本次会议的视频我已经挑选了近50个分享在  《Spark AI Summit North America 2020 专辑》里面,感兴趣可以看下,不过如果有条件的同学建议到 YouTube 官方去看,那里面有字幕。

Spark + AI Summit North America 202006 高清 PPT 全部更新_java_02