Uber大数据平台的演进(2014~2019)过往记忆大数据过往记忆大数据也可以到我个人博客阅读(点击下面阅读原文即可)https://www.iteblog.com/archives/2557.htmlUber致力于在全球市场上提供更安全,更可靠的运输服务。为了实现这一目标,Uber在很大程度上依赖于数据驱动的决策,从预测高流量事件期间骑手的需求到识别和解决我们的驾驶员-合作伙伴注册流程中的瓶颈
原创 2021-03-31 19:24:18
188阅读
点击“蓝字”关注我们来源 |过往记忆大数据Uber 致力于在全球市场上提供更安全,更可靠的运输服务。为了实现这一目标,Uber 在很大程度上依赖于数据驱动的决策,从预测高流量事件期间...
转载 2022-01-05 10:34:29
250阅读
Uber 致力于在全球市场上提供更安全,更可靠的运输服务。为了实现这一目标,Uber 在很大程度上依赖于数据驱动的决策,从预测高流量事件期间骑手的需求到识别和解决我们的驾驶员-合作伙伴注册流程中的瓶颈。自2014年以来,Uber 一直致力于开发大数据解决方案,确保数据可靠性,可扩展性和易用性;现在 Uber 正专注于提高他们平台的速度和效率。本文将介绍 Uber大数据平台的演进。第一代:Ube
原创 2021-04-06 09:30:32
100阅读
Uber 致力于在全球市场上提供更安全,更可靠的运输服务。为了实现这一目标,Uber 在很大程度上依赖于数据驱动的决策,从预测高流量事件期间骑手的需求到识别和解决我们的驾驶员-合作伙伴注册流程中的瓶颈。自2014年以来,Uber 一直致力于开发大数据解决方案,确保数据可靠性,可扩展性和易用性;现在 Uber 正专注于提高他们平台的速度和效率。本文将介绍 Uber大数据平台的演进。第一代:Ube
原创 2021-04-06 09:23:42
162阅读
Apache Hudi助力Uber低成本构建开源大数据平台
转载 2022-06-06 16:50:35
137阅读
点击“蓝字”关注我们文章 | Uber官方作者 | Reza Shiftehfar翻译 | 欧高炎 Uber致...
转载 2022-01-05 10:23:27
143阅读
随着 Uber 业务的扩张,为公司业务提供支持的基础数据池也在飞速膨胀,其处理成本水涨船高。当大数据成为我们最大的运维支出项目之一后,我们启动了一项降低数据平台成本的计划。该计划将问题分解为三大分支:平台效率、供应和需求。在这篇文章中,我们将讨论 Uber 为提高数据平台效率和降低成本所做的一系列工作。 大数据文件格式优化 我们的大部分 Apache®Hadoop®文件系统(HDFS)空间都被 A
原创 2021-09-01 09:13:59
189阅读
随着 Uber 业务的扩张,为公司业务提供支持的基础数据池也在飞速膨胀,其处理成本水涨船高。当大数据成为我们最大的运维支出项目之一后,我们启动了一项降低数据平台成本的计划。该计划将问题分解为三大分支:平台效率、供应和需求。在这篇文章中,我们将讨论 Uber 为提高数据平台效率和降低成本所做的一系列工作。Apache Hudi我们在大数据平台中遇到的最明显的成本效益提升机会之一是高效的增量处理。我们
转载 2021-12-21 16:16:02
228阅读
随着 Uber 业务的扩张,为公司业务提供支持的基础数据池也在飞速膨胀,其处理成本水涨船高。当大数据成为我们最大的运维支出项目之一后,我们启动了一项降低数据平台成本的计划。该计划将问题分解为三大分支:平台效率、供应和需求。在这篇文章中,我们将讨论 Uber 为提高数据平台效率和降低成本所做的一系列工 ...
转载 2021-09-01 09:11:00
93阅读
2评论
逐步改进其大数据平台架构,具有很高的参考和借鉴价值。
原创 2022-11-21 14:58:08
106阅读
指数级业务(和数据)增长自 2016 年以来,Uber 已在平台上增加了几项新业务,包括 Uber Eats、Uber Freight 和 Jump Bikes。现在,Uber 平台每天发生 1500 万次交易,每月有超过 7500 万活跃用户。在过去的八年中,Uber 已经从一家小型创业公司发展成为一个在全球拥有 18,000 名员工的巨头公司。随着业务的增长,数据系统和工程架构的复杂性也日益增
原创 2021-04-03 11:31:34
734阅读
Uber 来说,2019 是繁忙的一年,包括:迎来了第十亿单 Uber 外卖订单;在平台上,自行车和两轮电动车的外卖骑手覆盖了 2400 万英里;以及前往帝国大厦、埃菲尔铁塔和金门大桥等热门景点的旅行。然而,在所有这些活动的背后,都有一个关于数据的故事,以及我们为支持平台服务而对数据基础设施进行的创新。在我们现有的规模和全球范围内,对 Uber 平台的全天候支持意味着高达数拍字节(petaby
原创 2021-03-29 18:37:55
282阅读
Uber,实时数据(乘车请求数、可用司机数、天气、游戏等)可以让运营团队作出明智的决定,例如动态定价、最大调度预计到达时间计算以及对我们服务的供求情况进行预测,从而改善 Uber 平台...
转载 2021-06-12 00:15:23
388阅读
Uber,实时数据(乘车请求数、可用司机数、天气、游戏等)可以让运营团队作出明智的决定,例如动态定价、最大调度预计到达时间计算以及对我们服务的供求情况进行预测,从而改善 Uber 平台...
转载 2021-06-12 00:15:25
444阅读
大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 大数据根基于互联网,数据仓库、数据挖掘、云计算等互联网技术的发展为大数据的应用奠定了基础。1.大数据是什么?引用3个比较常用的
第一代:Uber 大数据的开端在 2014 年之前,我们有限的数据量可以塞进一些传统的联机事务处理 (OLTP) 数据库中(例如 MySQL 和 PostgreSQL)。为了利用这些数据,我们的工程师必须单独访问每个数据库或表,如果用户想将不同数据库的数据组合起来,需要自己编写代码。当时,我们还没有对所有存储的数据进行全局访问的需求,也没有这些数据的全局视图。事实上,我们的数据分散在不同的 OLT
原创 2021-04-02 21:33:23
265阅读
一、了解Hadoop关于Hadoop的官方说明是:Apache Hadoop 是一款支持 数据密集型 分布式 应用程序并以 Apache 2.0 许可协议发布的 开源软体框架。拆开来说,其中包含学习 Hadoop 必须要理解的三个知识点:(1)Hadoop是一个框架; (2)可以用来处理大规模数据; (3)Hadoop被部署在集群上。二、Hadoop传统意义上,我们常说的Hadoop是包含了 Co
当你已经准备好实施大数据,请仔细的评估云提供商提供的大数据功能,确保找到最合适的。下面我们来看一下四种云服务产品。当谈到在云端实施大数据战略时,好消息是你会有很多选择。但是,这同时也是一个坏消息。来自Forrester Research最近的一份报告强调,尽管大数据云服务很强大,他们也有可能造成混乱,从而需要企业采用比传统的方式更加灵活,琐碎的方法。该报告的结论是:在云计算领域中没有一种服务是适合
转载 2023-07-30 20:15:25
196阅读
本片博客介绍大数据相关的开源系统以及他们对应的一句话简介, 对于各位想大概了解大数据都有哪些开源系统的同学有帮助。各种相关开源系统简介:   如下是Apache基金支持的开源软件hdfs   跟GFS类似, 一个分布式文件系统。   mapreduce
1. Hue是什么HUE=Hadoop User ExperienceHue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue,可以在浏览器端的Web控制台上与Hadoop集群进行交互,来分析处理数据,例如操
转载 2024-04-29 21:58:00
232阅读
  • 1
  • 2
  • 3
  • 4
  • 5