分享嘉宾:张鸿志博士 团 算法专家编辑整理:廖媛媛 美的集团导读:团作为中国最大在线本地生活服务平台,连接着数亿用户和数千万商户,其背后蕴含着丰富与日常生活相关知识。团知识图谱团队从2018年开始着力于图谱构建和利用知识图谱赋能业务,改善用户体验。具体来说,“团大脑”是通过对团业务中千万数量级商家、十亿级别的商品和菜品、数十亿用户评论和百万级别的场景进行深入理解来构建用户、商
一面算法问了4道都比较简单,分别考二分,递归,双指针以及动态规划。1.二分搜索704. 二分查找力扣原题,注意边界条件,以及是否能取等号即可。2.二分搜索(递归实现)704. 二分查找代码如下:public int search(int[] nums, int left, int right, int target) { while (left <= right){
本文来说下团(Leaf)分布式ID算法 文章目录概述Leaf特性Leaf-segment数据库方案双buffer优化Leaf高可用容灾Leaf-snowflake方案弱依赖ZooKeeper解决时钟问题Leaf现状本文小结 概述在复杂分布式系统中,往往需要对大量数据和消息进行唯一标识。如在团点评金融、支付、餐饮、酒店、猫眼电影等产品系统中,数据日渐增长,对数据分库分表后需要有一个唯一ID
前言推荐系统并不是新鲜事物,在很久之前就存在,但是推荐系统真正进入人们视野,并且作为一个重要模块存在于各个互联网公司,还是近几年事情。随着互联网深入发展,越来越多信息在互联网上传播,产生了严重信息过载。如果不采用一定手段,用户很难从如此多信息流中找到对自己有价值信息。解决信息过载有几种手段:一种是搜索,当用户有了明确信息需求意图后,将意图转换为几个简短词或者短语组合(即q
# 大数据架构 团作为中国领先本地生活服务平台,每天都会产生大量数据。为了更好地分析和利用这些数据团搭建了一套强大大数据架构。本文将介绍大数据架构,并通过代码示例解释其核心技术。 ## 大数据架构概览 大数据架构主要包括数据采集、数据存储、数据处理和数据应用四个主要环节。在这个过程中,主要使用技术包括Hadoop、Spark、Kafka、HBase等。 下面
原创 2024-04-26 07:48:14
335阅读
技术架构图flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到数据输出到HDFS、hbase、hive、kafka队列等众多外部存储系统中,一般采集需求,通过对flume简单配置即可实现,Flume针对特殊场景也具备良好自定义扩展能力,因此,flume可以适用于大部分日常数据采集场景sqoopsqoop是apache旗下一款“Hadoop和关系数据库服务器之间
前言团最初数据处理以Hive SQL为主,底层计算引擎为MapReduce,部分相对复杂业务会由工程师编写MapReduce程序实现。随着业务发展,单纯Hive SQL查询或者MapReduce程序已经越来越难以满足数据处理和分析需求。一方面,MapReduce计算模型对多轮迭代DAG作业支持不给力,每轮迭代都需要将数据落盘,极大地影响了作业执行效率,另外只提供Map和Reduce这
相信大家点外卖时候都会注意到“预估到达时间”这一栏,那你是否好奇过这个时间是怎么得出来呢?简单用距离除以速度?还是结合送餐距离、出餐时间和天气情况等更多动态因素?今天团官方给了我们正确答案:首次公开外卖配送中“预估到达时间”算法规则。 (图片来自团官方) 据团官方介绍,其算法模型得出“预估到达时间”并不只有一个,而是四个:即“模型预估时间”和包括【城市特性保护时间】、【分段保
文章目录1、 Leaf-segment号段模式1.1 数据库配置1.2 导入并修改leaf项目1.3 Leaf-segment双buffer模式1.4 Leaf segment监控1.5 优缺点2.Leaf-snowflake2.1 Leaf-snowflake启动过程2.2 优缺点 目前主流分布式ID生成方式,大致都是基于数据库号段模式和雪花算法(snowflake),而团(Leaf)
编者按:在用户意图明确时,我们通常用搜索引擎来解决互联网时代信息过载问题,但当用户意图不明确或者很难用清晰语义表达,搜索引擎就无能为力。此时,借助推荐系统通过用户行为分析理解其意图,为其推送个性化结果,便成为一种更好选择。团作为国内发展较快O2O网站,有着大量用户和丰富用户行为,这些为推荐系统应用和优化提供了很好条件。本文由
关注“hadoop技术学习”这个公众号同学越来越多,增长很快,不是说这个公众号多吸引人,倒是可以看出了国内
转载 2021-07-29 16:28:49
235阅读
9月13日(北京)高性能计算、数据中心端到端互连方案提供商Mellanox今日宣布,国内最大生活服务电商平台团点评现已在其人工智能和大数据平台部署 Mellanox 端到端25GbE以太网络。近来随着移动互联网飞速发展,通过线上完成消费决策及交易,线下实际消费O2O模式也吸引了越来越多用户。作为国内最大生活服务电商平台,团点评已经为6亿注册用户、超450万合作商户提供各类生活娱乐相关
 近日,第三方互联网大数据监测机构Trustdata发布了《2018年Q1中国移动互联网行业发展分析报告》,对第一季度移动互联网行业发展情况进行了盘点。报告显示,互联网外卖行业格局进一步明晰,团外卖领先优势继续扩大。在用户端,团外卖独立APP日活跃用户数量超过饿了么与百度外卖总和。在商户端,团外卖商家版DAU近120万,以倍数级优势拉开与竞对差距。报告显示,2018年第一季度
背景数据,已经成为互联网企业非常依赖新型重要资产。数据质量好坏直接关系到信息精准度,也影响到企业生存和竞争力。Michael Hammer(《Reengineering the Corporation》一书作者)曾说过,看起来不起眼数据质量问题,实际上是拆散业务流程重要标志。 数据质量管理是测度、提高和验证质量,以及整合组织数据方法等一套处理准则,而体量大、速度快和多样性特点,决
转载 2023-05-29 11:00:43
1244阅读
实时数仓以端到端低延迟、SQL标准化、快速响应变化、数据统一为目标。团外卖数据智能组总结最佳实践是:一个通用实时生产平台跟一个通用交互式实时分析引擎相互配合,同时满足实时和准实时业务场景。两者合理分工,互相补充,形成易开发、易维护且效率高流水线,兼顾开发效率与生产成本,以较好投入产出比满足业务多样性需求。01 实时场景实时数据团外卖场景是非常多,主要有以下几个方面:运营层面:比
# 大数据分析流程 ## 引言 团是一家著名O2O平台,拥有大量用户数据。对这些数据进行分析可以帮助我们了解用户行为和需求,从而优化产品和服务。本文将介绍大数据分析流程,并提供相应代码示例。 ## 流程概述 下面是大数据分析整体流程: ```mermaid pie title 大数据分析流程 "数据收集" : 30 "数据清洗" : 20
原创 2023-09-27 03:27:53
193阅读
    马云曾经说过,“互联网还没搞清楚时候,移动互联来了;移动互联还没搞清楚时候,大数据来了。”  大数据应用其实早已渗透到人们生活中方方面面:亚马逊运用大数据为客户推荐商品信息,阿里用大数据成立了小微金融服务集团,而谷歌更是计划用大数据接管世界??当下,很多行业都开始增加对大数据需求。大数据时代不仅处理着海量数据,同时也加工、传播、分享它们。不知不觉中,数据可视
转载 精选 2014-12-23 14:38:50
1319阅读
# 团超市大数据分析实现流程 ## 1. 确定数据来源 首先,我们需要确定从哪里获取团超市数据。可以从团接口获取数据,或者直接使用已有的数据文件。 ## 2. 数据清洗和预处理 在进行数据分析之前,需要对原始数据进行清洗和预处理,以保证数据准确性和一致性。可能需要进行以下操作: - 去除重复数据 - 处理缺失值 - 处理异常值 - 标准化数据格式 ## 3. 数据存储 将清洗和预处
原创 2023-11-06 06:23:45
179阅读
# 大数据架构平台科普 ## 1. 引言 随着技术快速发展,大数据在各行各业应用日益深化。团作为国内领先生活服务平台,其大数据架构是支撑其业务发展核心部分。本篇文章将介绍大数据架构平台基本概念,并探讨其在数据处理和分析中运用,最后将展示一些简要代码示例。 ## 2. 大数据架构概述 大数据架构主要由以下几个部分构成: 1. **数据采集**:通过多种方式
原创 2024-09-04 06:32:02
147阅读
I. 知识图谱 应用案例 — 团概述深度学习(隐性模型) 特点 面向一个具体任务(如下围棋、识别猫、人脸识别、语音识别等)需要海量训练数据需要强大计算力场景示例 人脸识别目前进展 在一些任务上已经接近或超过人类任务范围 面向具体任务,难以迁移可解释性 较难解释数据量 海量训练数据知识图谱(显性模型) 特点 可广泛
  • 1
  • 2
  • 3
  • 4
  • 5