受长久以来市场宣传的影响,目前的操作系统被定义“单机操作系统”范畴里。即运行在一台计算机上管理一台计算机的软硬件资源应用软件使用本地硬件资源的操作系统。操作系统的另一种范式:多机操作系统,却很少有人知道和研究。多机操作系统是借助网络连接,运行在多台计算机、管理多台计算机软硬件资源的操作系统。它能够把大量计算机聚合到一起,成为一台虚拟的软件的“超级计算机”,同时对应用软件屏蔽和共享底层的硬件资源,简化开发和使用成本,实现计算规模和存储规模的指数级增长。

多机操作系统_硬件资源


在维基百科中,对操作系统的定义是这样的:

an operating system (OS) is system software that manages computer hardware and software resources, and provides common services for computer programs

翻译:【操作系统(OS)是管理计算机硬件和软件资源,并为计算机程序提供公共服务的系统软件】

所以,基于以上表述,云计算平台也可以视为操作系统的一种。事实上,云计算平台管理着所有的硬件(IaaS)和应用软件(PaaS),为用户提供公共软件服务(SaaS),这完全符合上述对操作系统的定义。

但是云计算平台和传统操作系统仍然是有区别的,主要体现在:

1. 传统操作系统是单机运行。

2. 云计算平台对操作系统要求是多机和分布式运行,并实现资源复用。

受限于单机操作系统的既有问题,所有云计算厂商对此做了折中,选择了这样的技术方案:将单机操作系统和虚拟化结合,在上层搭建分布式的运行环境,以实现云业务的扩展伸缩。但是这是表糊匠的解决办法,主要的弊病是:

1. 云计算平台整体结构复杂,缺乏统一化和标准化。

2. 集群弹性伸缩受制于应用层,而不是操作系统本身,制约着业务规模。

3. 运维管理是个大麻烦,集群的稳定性和可靠性也是问题。

4. 应用软件受制于特定平台,导致应用软件设计开发成本高,无法实现“一次编写随处运行”的标准化支持。

5. 对开发者和用户不友好,难以延展到更多应用领域,无法形成生态。

在云计算1.0的时代,因为企业计算需求不大,还可以对付。但是随着人工智能成为了云计算发展的主流,和算力互联网的到来,云计算进入2.0时代,加上很多大企业私有化部署需求,云计算平台表糊匠的做法已经难以为继。

要解决这些问题只有从底层开始,将基本需求纳入操作系统设计里,才能实现更快更强更稳定的算力输出,所以操作系统需要重构,多机操作系统的春天来了!

基于这些情况,Laxcus做为全球第一款商用的多机操作系统,为应对云计算平台超大规模的集群管理和计算需求,和算力互联网时代的到来,开始了从底层的产品技术重构。

从单机操作系统过渡到多机操作系统,是操作系统发展历史重要跃迁。它意味着算力业务正在普惠化、平民化、白菜化,我们从此摆脱单台计算机的制约,充分利用多服务器和计算机集群的并行计算能力,快速完成各种各样的计算业务。

做为人工智能和算力互联网的基础设施,多机操作系统在未来20年,将替代大多数单机操作系统,催生一个全新的巨大的市场,其中蕴含着大量的商机目前Laxcus设计工作已经完成,产品开发工作正在进行中。

多机操作系统_云计算平台_02