说明

之前有人问我究竟是做哪方面的,我发现有点说不清,哈哈。

总体上可以认为是人工智能或者数据科学。

内容

1 全栈的三层意思

人工智能有很多定义,有一种模糊但准确的定义:人类脑力劳动的自动化。

所以我一直在研究如何进行抽象(以及再抽象),只有抽象到一定层次,才会产生自动化。这方面最主要的抽象成果就是Data Mill数据工坊,我研究从数据到数据的制造过程。要实现这个制造过程,交付价值,必须要做配套的建设,这也是为什么提全栈:光有想法是不够的。

全栈体系的第一层意思:完成端到端的人工智能价值交付。

数据科学的定义则明确很多:是业务、数学和技术的结合。

用直白一点的话说,数据科学要考虑如何表达以及服务好业务线,首先是理解业务,然后将其映射到数据世界。然后考虑用技术来具体实现对业务的支撑,也就是工程化(Engineering)。我认为工程化可能是目前国内普遍的弱项,所谓35岁现象很好的证明了这一点。IT行业本质上是一个以代码论英雄的行业,一个人从coding转向管理就是成功? 35岁以上就不爱写代码了?我不知道这样的企业工程化水平能有多高,但要知道,这个行业兴起也不过20年,不向前走必被淘汰。扯远了,数据科学的最后一维是数学。意味着其建模和分析方法完全是建立在数学的基础之上的,当然,多参考一些通信技术的理论肯定也是对的(例如滤波、信道什么的)。

业务是价值实现的关键,技术手段是生存的保障,数学能力则是核心竞争力

全栈体系的第二层意思:全面思考业务、技术和数学,可以交付实用的,有价值的产品。

最后则是关于「第四次工业革命」的思考。第一次到第三次工业革命,主要是集中在「实物制造」范围的。人类开始大规模的使用机器替代人力,以制造实物产品。在过去的100年不断改进这个过程,使用了更好的材料,更多的能源,以及更高的电气自动化(例如使用机器人替代工人)。但是这些都是围绕实物的,其结果绝大部分是生产了xx吨材料,xx台电脑等。

第四次工业革命的核心将是「虚拟制造」,人类作为进化的优胜者,依靠的是更好的决策,而不是肌肉力量。我认为其成熟的表示是产品形态是从数字到数字的生产。金融和媒体行业将是最早实现变革的行业,金融业本身就是从数字到数字的业务。其本质可以简化为:当前价格1.5, 是否买入/卖出?媒体行业当然也是如此,且不说元宇宙,假设之后数字人演电影,每天赚“几爽”? 当然未来有更具战略意义的虚拟世界推演,这个还有点遥远,暂且不论。

这些和全栈有什么关系?
第三次工业革命带来了极为强大的实物制造能力,算力和存储以客观可度量的方式飞速提升,通信的便利性和速度也达到了一个前所未有的程度。所以客观基础已经有了,但是在虚拟制造的工艺本身还处于一个非常初级的阶段。

用一个简单的比喻,今天的虚拟制造工艺大致相当于半导体的“电子管时代”。未来怎么提升?当然是向“集成电路”发展。无论是从功能的集成度还是性能的集成度,都要求全栈能力。

全栈体系的第三层意思:实现逻辑和功能的高度集成。量变将产生质变。

2 全栈的四个方面

算法、架构、运维与交互是全栈四方面。

  • 1 算法是灵魂与核心。要实现脑力劳动的自动化,当然是抽象后由算法来实现。
  • 2 架构是算法/系统的基础。这里要从两个角度看,一方面,算法需要有架构支持才能进行更高的复杂度设计以及更高效的运行效率。另一方面,架构也是构成系统能力的关键因素。
  • 3 运维是大规模实现的关键。由于整个体系是基于分布式进行设计和建造的,那么运维就很重要。整个系统可能由1000个左右的微服务构成,能够快速、方便的部署服务可以节约大量时间。
  • 4 交互是商业交付的关键。这块之前没有那么强的意识,当然也没有那么多的精力。到了目前这个阶段,需要开始考虑交互了,主要是前端技术。前端可以引导使用服务(即便是使用自己的服务,也会因为太多而觉得累,需要使用前端引导),使得服务的价值被放大;另外,对于非技术用户,前端可以帮助他们认识、认可服务的价值。

不同的路径最终都可以实现全栈,可能观察的角度不同,理解和重要性也有差异。但这四个方面可以构成一个端到端的闭环,我认为是完整的。

我的路径大约是这样

java全栈开发和云计算的区别_运维

一开始是纯粹的单机算法,后来发现再要往前有比较多的限制,于是设计了一些架构,算法转变为离线/分布式。之后又发现即使有了架构也需要相当多的部署和维护,所以又稍微研究了一下运维(docker和脚本命令)。再之后,就觉得交互比较重要,下一步应该会做一些交互的实现。

整个过程基本上会整合为一套相似的工具/方法,我觉得这个是能够一个人跨多个领域的关键。适合自己的才最好。

整体上,这几部分大致这样

序号

名字

解释

1

算法

Lv2, 从结果的可用性上衡量基本都达到了商业级,从技术上,复杂度、自动化程度、计算规模(时长)达到了较高的程度

2

架构

Lv1, 达到了可用集,配合算法高效实现,实践证明有效

3

运维

Lv1, 可以快速的部署和管理,理论上可以有效管理上百台计算服务器(大约10个小集群)

4

交互

Lv0, 做过一些简单的交互实现,还未达到足够低的单位开发成本以及足够好的交互效果

从全栈的角度,2022年有两个小目标:

  • 1 从算法的角度实现突破,主要指商用价值变现以及算法、架构、运维高度协同的工程
  • 2 让交互也达到Lv1,可以使自己更好的使用服务,单位开发成本足够低。主要有元素操作(拖拽,状态)、表格交互和图表可视化三部分。