由于ChatGTP的惊人表现,本来已经趋于平淡的AI,又火爆起来。毫无疑问,人类已经进入了AI时代,AI将渗入到各行各业,渗入到生活与工作的每个方面。这是一场新的工业革命,很多工作都将消失,但也会产生很多新的机会,而新的机会一定属于掌握AI或会使用AI技术的人。
由于 TDengine 作为一款时序数据库(Time Series Database)主要用户群是传统工业用户,遍及制造、能源、化工、矿山、汽车等众多行业,因此我有机会接触很多这些领域的客户,中国的、美国的,我都有很广泛的交流。AI的突飞猛进,让这些产业的人比IT人更加焦虑,每次交流,都会聊到AI的话题,怎么利用AI技术降低成本,提高传统产业的效率。
但通过我一年多的观察、思考,发现传统产业要能尽快、低成本、低风险的享受到AI的红利,还有很多坎要过,主要要看采取什么样的策略。周末有空闲时间,将自己的思考整理出来,分享给大家。

消除数据孤岛

AI的基础是大数据,需要有足够的数据样本,才能训练模型,才能依据数据做出商业决策。但是对于传统产业而言,这个大数据的前提就不容易实现。
传统产业的IT、OT建设参差不齐,无论中国还是美国,大部分企业的数字化建设远落后于互联网类型的企业。以我最近打交道的美国发电企业为例,他们很多用的还是PI System,而且还是很老版本的,Aveva对Process Book都不支持了,但还在使用,因为PI相当稳定,而且能满足他们生产要求,他们也就没有更换的动力。但这个老系统是完全独立的,是一个数据孤岛。一个发电集团总有几十个甚至几百个电厂,每个电厂用的软件,或版本都很难一致。而且由于商业的并购、分拆的原因,导致各种系统并存,各种软件供应商都有,而更换的成本与风险很高,因此很难统一。加上现在清洁能源的发展,光伏、风力发电的系统与传统的电力又不一样,因此复杂度更高。
在这种情况下要让AI赋能这些传统产业,首先要做的就是将散布各处的各种系统、包括各种版本采集的数据进行汇总,消除数据孤岛。但由于各种系统存在,有老掉牙的自动化系统,也有最新的数采系统,各种工业协议都存在,数据汇聚还不是简单的汇聚,还需要对各个数据源的数据进行清洗、加工、处理,才能进入统一的平台。而每个数据源都不一样,因此数据汇聚是一个脏活、累活,还不产生直接的经济效益。但是数据汇聚如果不做,AI赋能谈都不用谈。

建设数据分享平台

数据总是提供给各种应用,包括各种AI应用使用的,而且这些应用有内部,还有外部合作方的应用。比如新能源汽车采集大量的数据,它包括电机、电控、电池数据,甚至还有用户行为数据。这些数据不仅内部不同的部门需要使用,看如何通过数据分析提升汽车品质,改善驾驶与乘车体验,同时众多第三方需要这些数据,比如电池供应商、电机供应商,他们也需要用这些数据来进行分析,有些数据还要上报政府监管部门。因此如果不建设好强大的数据分享平台,将无法应对内部、外部以及监管部门的需求。
但分享就牵涉到数据的隐私与安全问题,利益相关方应该只能看到它被容许看到的数据。比如电池供应商只应该获取脱去用户个人信息后的电池数据,而且只能看到自己的电池数据,还不能看到同一汽车主机厂其他电池供应商的数据。为了保护隐私,有的数据甚至要加工后才能提供,而不是直接提供原始数据。为进一步增加安全性,数据拥有方还必须能随时控制应用访问的时长,访问的数据的时间段等。
大多数场景下,数据的分享可以是批的方式进行,定时获取一次就行。但有的场景是需要实时获取的,比如工业上总希望做实时的异常检测。一旦检测到新的数据,就需要立即通知相关的应用。可以预见,实时的数据分享需求场景还会越来越多。
由于应用林林总总,新的应用、新的合作伙伴天天涌现,这个分享还必须有足够的灵活性。系统管理员收到开通分享的请求后,做个简单的配置,分享就能立即生效,而无需进行开发或复杂的配置。
因此企业要能让AI赋能,数据汇聚后,还必须建设有强大、安全而又灵活的数据分享平台。

无缝对接的开放系统

数据汇聚后,企业当然可以开发自己的AI应用,做更好的异常监测,实时报警,并为产能、成本、设备维护等提供更好的预测,而且这些都是基于整个公司层面的数据做出的,而不是局限于一个电厂或一个制造厂,让决策者有更好的宏观整体把控。
但传统企业要组建自己的AI开发甚至数据分析团队,都是相当不容易的。因为AI开发以及数据分析的人才,还很稀缺,你需要与阿里、华为、腾讯、百度这些企业竞争,在美国,则是与谷歌、微软、苹果、亚马逊等竞争。不仅他们的薪资结构、工作方式与传统产业相差太大,而且即使加入,因为对产业本身的知识了解不够,往往半年甚至一年都难发挥出作用,导致投入产出不成正比。
那么最好的方式就是直接采用第三方的AI应用,将自己拥有的数据平台与第三方AI应用对接。而且为缩短周期,可以直接使用对方提供的云服务,这样就大幅减小了购买或协调资源以及部署所需要的时间,可以立即上线。同时云服务一般是按时长或用量收费,而无需提前支付一大笔采购费用。这样能很快看到效果,看是否能满足要求,大幅降低了决策成本。
但AI应用提供方很多家,服务质量也参差不齐,那么作为拥有数据的企业,要做到的就是保证自己数据平台的开放性,任何应用都可以通过标准的接口获取数据,这样就能去除AI应用与数据平台对接的障碍,各种应用系统都能与数据平台无缝对接。只要想尝试某个AI应用,一周甚至一天之内就可以看到效果,大幅提高决策效率。因此如果数据平台具有很好的开放性,那么让AI赋能,就像商场买衣服一样,可以左挑右拣,直到自己满意为止,不是痛苦,而是一件赏心悦目的事情。
一般的平台或软件都会声称自己是开放的。但从我个人的经验来看,只有流行的用户量大的软件或系统,开放性才不会有问题,而且所有的应用都会与它对接。就像我们开发的TDengine,由于开源,安装量已经超过27万,而且它还有标准的JDBC接口,支持SQL,能与几乎所有的可视化、BI工具对接。

AI的未来

与互联网一样,AI并不能取代传统产业,能源、制造、汽车、矿山这些行业依旧存在,但AI能赋能、提升这些产业,提高生产效率,为传统产业注入新的活力。不拥抱AI的企业将会失去竞争力,逐步被淘汰。
AI已经强大,但对于传统产业而言,还有两个不足。一是要求的算力过大,导致成本过高,对于利润很低的传统产业,难以承受。另外一方面,现在的ChatGPT,依赖的都是历史数据,而工业场景,更需要的是对实时数据的分析。因此AI在工业场景还有很多挑战以及提升的空间,但这个挑战应该交给AI的研究人员。
传统产业要做的是,将分布于各地的数据汇聚起来,建设一个开放的、可以安全、灵活共享的数据平台,能与众多的第三方的AI工具或服务无缝集成,在无需大量的资金和人力投入下,在几乎没有决策风险的前提下,能迅速验证并享受AI带来的红利。

拥抱AI.png 以我自己为例,我自己创办的TDengine是一个专为物联网、工业互联网定制的大数据平台。TDengine不是以AI为核心技术的公司,但在AI的时代,我们的唯一选择就是全面拥抱AI。为帮助众多的传统产业数字化转型、能让AI赋能,过去的一年,我们投入了巨大的人力支持开发PI System, MQTT, OPC等各种工业数据接口,支持与各种BI、AI工具对接,而且在阿里云、AWS、Azure、GCP上推出全托管的云服务。无需大量资金投入、无决策风险下,短时间内你就可以试用开通,并与AI应用、众多的分析工具、可视化工具集成,体验大数据以及AI的魅力。
“Run! Don't walk. You are either running for food or running from being food!" 。我们唯有奔跑,才能不被AI时代抛弃。
陶建辉 2023年6月3日于加州湾区