PHP环境的配置是一个比较麻烦的过程,因此,通常情况下,对于初学者和一般的使用者来说,使用组合包可以方便完成环境的配置,一步到位,一般使用的组合包为AppServ,这个组合包相对比较稳定,下载也比较方便。但是,也有几点需要注意:首先,我们现在较新的版本为“2013-10-25_appserv-win32-2.6.0.1343644756.exe”,当然2.5.10版的也可以,差别不是很大,运行安装            
                
         
            
            
            
            整个流程:工程修改后push到gitlab >> gitlab通过webhook通知jenkins工程有改变 >>jenkins到gitlab取最新工程 >> jenkins完成容器构建 docker images >> push到docker hub >> 让单台或多台服务器同时拉下这个镜像并运行还可以使用完整的如下CI, C            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-03 09:48:49
                            
                                150阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            C++中STL容器的区别与使用有vector、list、deque、map、multimap、unordered_map、set、multiset和unodered_map,他们之间有什么不同,各自的优缺点是什么,如何选用时适当的容器,这些问题需要去了解。vector  序列容器,类似于C语言中的数组,它维护一段连续的内存空间,具有固定的起始地址,可以在任何位置插入新元素,有随机访问功能,即提供[            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-24 15:02:10
                            
                                44阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            查看作业状态 查看当前用户的作业状态,可以使用如下命令: squeue 例如: JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 33762 normal nstest1 wangwu R 0:03 2 h05r4n[15-16] 参数 ...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-08-25 12:15:00
                            
                                345阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            SLURM (Simple Linux Utility for Resouce Management)非常成熟的开源社区集群批处理调度系统。介绍2008年左右起源于LLNL实验室, 最新版本20.11开源软件(约50万行c源码),开发和发布一直活跃用户群: Top10里有5家使用(天河HPC是其一)商业公司SchedMD提供顾问咨询服务完善的插件为用户提供较便利的扩展功能特点:结构清晰、功能丰富、            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-13 15:29:47
                            
                                276阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Motivation之前从来没有用过集群,跑代码都是用单独的服务器,第一次上手组里的集群懵逼了一天。中文的博客大部分都写的很一般,有些我想知道的问题也找不到答案。所以就想着,自己一遍学习一边记录一下,做成一个入门的介绍,方便自己和其他新入门的朋友查看。查看节点状态sinfo输出参数的含义PARRITION:节点所在分区
AVAIL:分区状态,up 标识可用,down 标识不可用
TIMELIMIT            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-29 07:08:30
                            
                                1223阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            slurm0.Pytorch环境问题1.slurm作业管理系统2.sinfo查看系统资源3.squeue查看作业状态4.srun交互式提交作业5.sbatch后台提交作业6.salloc分配模式作业提交7.scancel取消已提交的作业8.scontrol查看正在运行的作业信息9.sacct查看历史作业信息10.xxx.slurm作业模版11.关于联网12.Linux 常用命令13.官网手册14            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-12 11:33:49
                            
                                379阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 实现SLURM集群
## 简介
SLURM(Simple Linux Utility for Resource Management)是一个开源的集群管理系统,用于Linux集群的资源管理和作业调度。通过SLURM,可以很方便地管理计算集群上的作业任务,实现资源的合理分配和调度。
## 流程
下面是实现SLURM集群的主要步骤:
| 步骤 | 描述 |
| ---- | ---- |
|            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-05-27 10:21:12
                            
                                131阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在高性能计算(HPC)环境中,Slurm(Simple Linux Utility for Resource Management)架构是一个关键的资源管理和调度系统,它为用户提供了高效的作业管理功能。本文将详细探讨 Slurm 架构的解决方案,涵盖从背景描述到技术原理、架构解析、源码分析、性能优化到应用场景的各个方面。
## 四象限图概述
在了解 Slurm 架构之前,我们首先要认识到它在高性            
                
         
            
            
            
            Slurm配置文件配置文件示例slurm.conf是Slurm的核心配置文件,它描述了一般的Slurm 配置信息、要管理的节点、有关 如何将这些节点分组到分区中,以及各种调度 与这些分区关联的参数。该配置文件在群集中的所有节点上保持一致。如果修改了slurm.conf相关配置文件,诸如slurmctld端口等,需要使用scontrol reconfigure重新配置。(注意:slurm.conf是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-04 12:11:06
                            
                                1378阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            编写Slurm脚本#!/bin/bash
#SBATCH -J test              # 作业名是 test
#SBATCH -p cpu               # 提交到 cpu 分区
#SBATCH -N 1                 # 使用一个节点
#SBATCH --cpus-per-task=1    # 每个进程占用一个 cpu 核心
#SBATCH -t            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-05 10:28:45
                            
                                211阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            提交交互式任务交互式任务是一种特殊的队列任务,在该模式下,用户可以直接登录到计算节点,此后 所有的操作都在这个节点上进行。这个功能主要是方便用户在服务器上调试程序, 以便能够实时看到程序的输出。 我们需要使用 salloc 命令来分配交互式任务所需的资源,它的语法为$ salloc [申请资源]其中,用户需要以选项的方式指定申请的资源,这些选项与 SLURM 脚本中的选项基本 相同。常用选项为:-            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-06 10:39:24
                            
                                1442阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            sacct用于报告有关活动或已完成作业的作业或作业步的记账信息。salloc用于实时为作业分配资源。通常用于分配资源和生成shell。然后使用shell执行srun命令来启动并行任务。sattach用于将标准输入,输出和错误以及信号功能附加到当前正在运行的作业或作业步。可以多次附加到作业和从作业中分离。sbatch用于提交作业脚本,以便以后执行。该脚本通常包含一个或多个用于启动并行任务的srun命            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-04 15:11:03
                            
                                82阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            以下这段文字翻译自技术大牛Brendan Gregg和Jim Mauro 2011年的著作:《DTrace: Dynamic Tracing in Oracle Solaris, Mac OS X and FreeBSD》第三章《System View》里关于CPU利用率的一个介绍(56页)。个人觉得写得很清晰,就把它翻译出来,希望能让更多人对CPU利用率有正确的理解。翻译有错之处,还希望大家批评            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-25 12:52:19
                            
                                58阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Slurm集群监控是管理和监视Slurm集群中各种资源和作业运行情况的重要工作。在本文中,我将向你介绍如何实现Slurm集群监控的过程,并提供相应的代码示例。首先,让我们来看一下整个流程:
| 步骤 |         操作         |
|:----:|:--------------------:|
|  1   | 安装Prometheus和Grafana |
|  2   | 配置P            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-04-25 10:58:57
                            
                                210阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Slurm(Simple Linux Utility for Resource Management)是一个常用的高性能计算集群作业调度系统,它能有效管理和调度计算节点、分配资源、安排作业,为用户提供更好的计算体验。在使用Slurm的过程中,调度策略至关重要,它可以帮助我们合理分配计算资源,提高作业的运行效率。
在Slurm中,调度策略是通过配置Slurm的参数来实现的,下面我将告诉你如何实现            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-04-24 11:01:37
                            
                                166阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在Kubernetes(K8S)中使用SLURM进行集群调度是一种常见的方式,可以帮助实现资源的高效利用和作业的自动调度。在本文中,我将向你介绍如何在Kubernetes集群上使用SLURM进行作业调度。
首先,让我们了解一下整个流程。在使用SLURM进行集群调度时,通常可以分为以下几个步骤:
| 步骤 | 操作 |
| ------ | ------ |
| 1 | 在Kubernetes集            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-04-29 12:06:07
                            
                                189阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、LSF 基本介绍LSF(Load Sharing Facility)是IBM旗下的一款分布式集群管理系统软件,负责计算资源的管理和批处理作业的调度。它给用户提供统一的集群资源访问接口,让用户透明地访问整个集群资源。同时提供了丰富的功能和可定制的策略。LSF 具有良好的可伸缩性和高可用性,支持几乎所有的主流操作系统。它通常是高性能计算环境中不可或缺的基础软件。作用上与PBS一样,使用方法略有不同            
                
         
            
            
            
            学SLAM的小姑娘2017年1月20号正式定下了研究生期间的研究方向:SLAM,之前的我是完全不懂什么叫SLAM(Simultaneous Localization and Mapping),叫做同时定位与地图重建,主要解决了机器人的位姿和地图构建,从我现在的理解,也就是这样了。     本学期开始,重装了系统,用的时Ubuntu14.04,瞬间感觉自己电脑无比干净,因为是个Linux菜鸟,上学期            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-15 16:47:35
                            
                                117阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1.slurm.conf简介slurm.conf是一个ASCII文件,它描述了一般的Slurm 配置信息、要管理的节点、有关如何将这些节点分组到分区中,以及各种调度与这些分区关联的参数。此文件应为在群集中的所有节点上保持一致。可以通过设置SLURM_CONF在执行时修改文件位置 环境变量。Slurm 守护进程还允许您覆盖 使用“-f”的内置位置和环境提供的位置 选项。文件的内容不区分大小写,但节点            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-13 09:23:07
                            
                                549阅读
                            
                                                                             
                 
                
                                
                    