1. 什么是DataWorks

DataWorks(大数据开发治理平台)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。

DataWorks基于MaxCompute/EMR/MC-Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万名数据/算法工程师正在使用DataWorks,承担集团99%数据业务构建。

2. DataWorks的功能

dataworks和hive是什么 dataworks es_sql


DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute、开源大数据引擎E-MapReduce、实时计算(基于Flink)、机器学习PAI、云原生数据仓库 AnalyticDB for PostgreSQL,云原生数据仓库AnalyticDB for MySQL,并且支持用户自定义接入计算和存储服务。DataWorks为您提供全链路智能大数据及AI开发和治理服务。

您可以使用DataWorks,对数据进行传输、转换和集成等操作,从不同的数据存储引入数据,并进行转化和开发,最后将处理好的数据同步至其它数据系统。

3. 使用限制

仅支持Chrome浏览器69以上版本和新版Edge浏览器。

4. DataWorks专业版典型应用场景

资源优化:帮您节省计算、存储费用
移动运维:轻松搞定任务运维
运行诊断:为您快速定位疑难问题
智能监控:提高生产力,更加智慧的告警处理方式
字段级数据血缘:快速定位脏数据源头
多种控制节点:满足复杂业务场景逻辑
数据保护伞:进行数据安全保障
实时流计算开发:极大降低新技术使用门槛

5. DataWorks产品架构

dataworks和hive是什么 dataworks es_dataworks和hive是什么_02

dataworks和hive是什么 dataworks es_数据仓库_03

dataworks和hive是什么 dataworks es_sql_04

dataworks和hive是什么 dataworks es_dataworks和hive是什么_05

6. 常见问题与难点解析

参考文档:https://help.aliyun.com/document_detail/97879.html