这是本博客第一篇技术相关的小贴士,在这里我不会详细介绍所涉及的技术组件的具体使用细节,因为我相信这些大家都可以通过官方文档了解到。如果你是一个看了官方文档依然一脸茫然的IT小白,个人建议是先从基础重新学起再来看具体的需求和方案。


在这片文章里我们会涉及到两个概念,一个是Azure automation,另外就是resource的tag。


Tag这个我就不多说了,绝大多数系统或者平台都会带有的Key-value标识功能。

Automation的话,至少要了解runbook, job, schedule 这几个基本的概念才能继续往下看。



需求:为了避免不必要的资源浪费,许多测试开发环境可以在非工作时间进行关机来达到节约成本的目的。

如果贵公司钱多的烧不完,则可以自豪的忽略这个需求。

话不多说先贴上runbook供大家参考:




---------------------------------------------------

workflow Autoshutdown_by_tag


{


     $connectionName = "AzureRunAsConnection"

try

{


    $servicePrincipalConnection=Get-AutomationConnection -Name $connectionName


    "Logging in to Azure..."

    Add-AzureRmAccount `

        -ServicePrincipal `

        -TenantId $servicePrincipalConnection.TenantId `

        -ApplicationId $servicePrincipalConnection.ApplicationId `

        -CertificateThumbprint $servicePrincipalConnection.CertificateThumbprint `

        -EnvironmentName AzureChinaCloud

}

catch {

    if (!$servicePrincipalConnection)

    {

        $ErrorMessage = "Connection $connectionName not found."

        throw $ErrorMessage

    } else{

        Write-Error -Message $_.Exception

        throw $_.Exception

    }

}




$subs = Get-AzureRmSubscription



Foreach ($sub in $subs)


{



    Select-AzureRmSubscription -SubscriptionId $sub.SubscriptionId -ErrorAction Continue


    $VMs = Get-AzureRmVm -status| Where-Object {$_.Tags.Keys -eq "AutoShutdown" -and $_.Tags.Values -eq "Yes" }



  ForEach -Parallel -ThrottleLimit 10 ($VM in $VMs)


  {



  If ($vm.powerstate -eq "VM deallocated")


      {Write-Output "$($VM.Name) is already shutdown"}


  else


   {Write-Output "Stop: $($VM.Name)";Stop-AzureRMVM -Name $VM.Name -ResourceGroupName $VM.ResourceGroupName -force }


  }



}


}


---------------------------------------------------


具体说明:

1. 首先这个runbook的目的就是遍历你的账号下所有订阅下用有标签Autoshutdown并且值为Yes的虚拟机,并检测他们的powerstate, 如果不是 deallocated 状态则执行stop-AzureRMVM 命令进行关机。标签和值可以完全按照各自喜好自定义。

2. 此runbook需要关联相对应的schedule才能按时执行,具体如何操作就不深入阐述了。

3. 此Automation的run as account不能expired, 同时必须要对对应的虚拟机拥有开关机的权限。RBAC中自定义role这块我之后会有专门的文章介绍,这里就不深入阐述。

4. 这里用的是workflow,而不是普通的powershell脚本。最主要的优势是可以做到并行操作。  ”ForEach -Parallel -ThrottleLimit 10“在这里就设置了最多同时进行10台虚拟机的关机操作。当你的云平台上有大量的虚拟机时,顺序操作会消耗大量的脚本运行时间,一般来说一台虚拟机的关机动作5到10分钟不等,数量一大可能你的job就会超时。

5. 开机的runbook与关机类似,只是用到的是start-AzureRMVM命令。 另外在新的AzureRM.Compute 模块中,stop-AzureRMVM会有需要人机交互进行确认,因此需要使用 -force 强制执行,这个小tip可以使用在任何其他的类似的powershell命令中。



其实这里涉及到了一些其他的知识点,有一些我会在其他的小贴士中详细介绍。但是如果你只是想单纯的让这个功能跑起来,其实还是非常容易的。


对于一个IT从业人员,如果只是知其然也是可以混口饭吃的。但是一旦遇到高手依然会原形毕露,被别人鄙视一番也是自然。因此我们还是得知其所以然。

一般来说IT知识的掌握分为四个阶段: User-->Know what--->troubleshooting--->Expert。 如果是技术相关岗位,至少也要在自己的专业领域达到Troubleshooting或者expert级别,而对其他的至少要做到know what。这里又涉及到了知识体系的搭建,在之后我也会分享一些相关的体会。

希望这篇文章可以对日常维护Azure 的朋友们有所启发,如果有什么建议欢迎留言讨论。