1 #include <iostream>
2 #include <cmath>
3 #include <ctime>
4 #include <windows.h>
5
6 using namespace std;
7
8 //得到循环0xFFFFFFFF次用的秒数
9 unsigned int test()
10 {
11 unsigned int c = 0xFFFFFFFF;
12
13 time_t t1, t2;
14 time(&t1);
15
16 for(unsigned int i = 0; i < c; i++)
17 ;
18 time(&t2);
19 return (unsigned int)(t2 -t1);
20
21 }
22
23
24 #define T 20000 //周期时间 20秒
25 #define C 100 //采样点时间间隔
26 #define PI 3.1415 //PI
27 const unsigned int count = 0xFFFFFFFF / (test() *1000); //采样间隔可以执行的循环数目
28 const unsigned int N = T/C; //周期内采样点数目
29 unsigned int v[N] = { 0 }; //所有采样点连续执行循环数
30 unsigned int mt[N] = { 0 }; //所有采样点休眠毫秒数
31
32 int main()
33 {
34 //计算循环次数和休眠时间
35 for(int i = 0; i < N; i++)
36 {
37 double x = 2 * PI * i / N;
38 double r = (sin(x) + 1) / 2;
39
40 mt[i] = C - r * C;
41 v[i] = r * C * count;
42 }
43 for(;;)
44 {
45 for(int i = 0; i < N; i++)
46 {
47 for(int j = 0; j < v[i]; j++)
48 ;
49 Sleep(mt[i]);
50 }
51 }
52 }
首先什么是CPU占用率?
在任务管理器的一个刷新周期内,CPU忙(执行应用程序)的时间和刷新周期总时间的比率,就是CPU的占用率,也就是说,任务管理器中显示的是每个刷新周期内CPU占用率的统计平均值。
因此可以写个程序,在一个刷新周期中,一会儿忙,一会儿闲,调节忙/闲比例,就可以控制CPU占有率!
一个刷新时间到底是多长,书上只是说,任务管理器观测,大约是1秒。鼠标移动、后台程序等都会对曲线造成影响!
单核环境下,空死循环会导致100%的CPU占有率。双核环境下,CPU总占有率大约为50%,四核会不会是25%左右呢?(没试过)
题目:写一个程序,让用户来决定Windows任务管理器(Task Manager)的CPU占用率。程序越精简越好,计算机语言不限。例如,可以实现下面三种情况:
1. CPU的占用率固定在50%,为一条直线;
2. CPU的占用率为一条直线,但是具体占用率由命令行参数决定(参数范围1~ 100);
3. CPU的占用率状态是一个正弦曲线。
解法一:简单解法
Busy用可循环来实现,for(i=0;i<n;i++) ;
对应的汇编语言为
loop;
mov dx i ;将i置入dx寄存器
inc dx ;将dx寄存器加1
mov dx i ;将dx中的值赋回i
cmp i n ;比较i和n
j1 loop ;i小于n时则重复循环
我的cpu(双核) 2.53GHZ 现代cpu每个时钟周期可执行两条以上的代码,取平均值2,于是
(2520 000 000*2)/5=1012000000(循环/秒) 每秒可以执行循环1012000000次
不能简单的取n=10120000000然后sleep(1000),如果让cpu工作1s,休息1s很可能是锯齿,先达到一个峰值然后跌入一个很低的占有率;所以我们睡眠时间改为10ms,10ms比较接近windows的调度时间,n=10120000。如果sleep时间选的太小,会造成线程频繁的唤醒和挂起,无形中增加了内核时间的不确定性因此代码如下:
1 #include <windows.h>
2
3 int main(void)
4 {
5 //50%
6 //Thread 0 can only run on CPU 0.
7 SetThreadAffinityMask(GetCurrentProcess(), 0x00000001);
8 while(true)
9 {
10 for(int i=0;i<10120000;i++)
11 ;
12 Sleep(10);
13 }
14 return 0;
15
16
17 }
解法二:使用GetTickCount()和Sleep()
GetTickCount()可以得到“系统启动到现在”所经历的时间的毫秒值,最多可以统计49.7天,因此我们可以利用GetTickCount()判断busy loop要循环多久,如下:
1 #include <windows.h>
2
3 int main(void)
4 {
5
6 //50%
7 int busyTime=10;
8 int idleTime=busyTime;
9 _int64 startTime;
10 SetThreadAffinityMask(GetCurrentProcess(), 0x00000001);
11 while(true)
12 {
13 startTime=GetTickCount();
14 while((GetTickCount()-startTime)<=busyTime)
15 {
16 ;
17 }
18 Sleep(idleTime);
19 }
20 return 0;
21 }
上面两种解法都是假设当前系统只有当前程序在运行,但实际上,操作系统有很多程序会同时调试执行各种任务,如果此刻进程使用10%的cpu,那我们的程序只有使用40%的cpu才能达到50%的效果。
Perfmon.exe是从WIN NT开始就包含在windows管理工具中的专业检测工具之一。我们可以用程序来查询Perfmon的值,.Net Framework提供了PerformanceCounter这一对象,可以方便的查询当前各种性能数据,包括cpu使用率,因此解法三如下:
解法三:能动态适应的解法
1 using System;
2 using System.Diagnostics;
3 namespace cpu
4 {
5 class Program
6 {
7 static void Main(string[] args)
8 {
9 cpu(0.5);
10 }
11 static void cpu(double level)
12 {
13 PerformanceCounter p = new PerformanceCounter("Processor", "% Processor Time", "_Total");
14 if (p == null)
15 {
16 return;
17 }
18 while (true)
19 {
20 if (p.NextValue() > level)
21 System.Threading.Thread.Sleep(10);
22 }
23 }
24 }
25 }
解法四:正弦曲线
1 #include <windows.h>
2 #include <math.h>
3 int main(void)
4 {
5 SetThreadAffinityMask(GetCurrentProcess(), 0x00000001);
6 const double SPLIT=0.01;
7 const int COUNT=200;
8 const double PI=3.14159265;
9 const int INTERVAL=300;
10 DWORD busySpan[COUNT]; //array of busy time
11 DWORD idleSpan[COUNT]; //array of idle time
12 int half=INTERVAL/2;
13 double radian=0.0;
14 for(int i=0;i<COUNT;i++)
15 {
16 busySpan[i]=(DWORD)(half+(sin(PI*radian)*half));
17 idleSpan[i]=INTERVAL-busySpan[i];
18 radian+=SPLIT;
19 }
20 DWORD startTime=0;
21 int j=0;
22 while(true)
23 {
24 j=j%COUNT;
25 startTime=GetTickCount();
26 while((GetTickCount()-startTime)<=busySpan[j])
27 ;
28 Sleep(idleSpan[j]);
29 j++;
30 }
31 return 0;
32 }
其中busySpan[i]=(DWORD)(half+(sin(PI*radian)*half)); idleSpan[i]=INTERVAL-busySpan[i];
这样保证了占有率=busy/(busy+idle)=(half+(sin(PI*radian)*half))/(2*half)=(1+sin(PI*radian))/2 在0到100%之间!
下面更深入在双核情况下,每个cpu显示不同的曲线。如下:
控制CPU占用率,不仅仅是出于好玩而已。以前的某些程序,特别是某些老游戏,在新的机器上运行速度太快,必须先给CPU降速,才能顺利运行那些程序,有个共享软件CPUKiller,就是专门弄这个的。
控制CPU占用率,因为要调用Windows的API,要考虑到多核、超线程的情况,要考虑到不同版本的Windows的计时相关的API的精度不同,使问题变得相当复杂,若再考虑其它程序的CPU占用率,则该问题则变得很烦人。(taskmgr调用了一个未公开的API)。
对CPU核数的判断,书上是调用GetProcessorInfo,其实可以直接调用GetSystemInfo,SYSTEM_INFO结构的dwNumberOfProcessors成员就是核数。不知道超线程对这两种方法有什么影响。
如果不考虑其它程序的CPU占用情况,可以在每个核上开一个线程,运行指定的函数,实现每个核的CPU占用率相同。
要让CPU的占用率,呈函数 y = calc(t) (0 <= y <= 1, t为时间,单位为ms )分布,只要取间隔很短的一系列点,认为在某个间隔内,y值近似不变。
设间隔值为GAP,显然在指定t值附近的GAP这段时间内,
CPU占用时间为:busy = GAP * calc(t),
CPU空闲时间为:idle = GAP - busy
因此,很容易写出下面这个通用函数:
1 void solve(Func *calc)
2 {
3 double tb = 0;
4 while(1)
5 {
6 unsigned ta = get_time();
7 double r = calc(tb);
8 if (r < 0 || r > 1) r = 1;
9 DWORD busy = r * GAP;
10 while(get_time() - ta < busy) {}
11 Sleep(GAP - busy);
12 tb += GAP;
13 }
14 }
如果CPU占用率曲线不是周期性变化,就要对每个t值都要计算一次,否则,可以只计算第一个周期内的各个t值,其它周期的直接取缓存计算结果。
以CPU占用率为正弦曲线为例,显然:y = 0.5 * (1 + sin(a * t + b))
其周期T = 2 * PI / a (PI = 3.1415927),可以指定T值为60s即60000ms,则
可以确定a值为 2 * PI / T, 若在这60000ms内我们计算200次(c = 200),则GAP值为 T / c = 300ms.也就是说,只要确定了周期和计算次数,其它几个参数也都确定下来。
代码如下:
1 #include<iostream>
2 #include<cmath>
3 #include<windows.h>
4
5 static int PERIOD = 60 * 1000; //周期ms
6 const int COUNT = 300; //一个周期计算次数
7 const double GAP_LINEAR = 100; //线性函数时间间隔100ms
8 const double PI = 3.1415926535898; //PI
9 const double GAP = (double)PERIOD / COUNT; //周期函数时间间隔
10 const double FACTOR = 2 * PI / PERIOD; //周期函数的系数
11 static double Ratio = 0.5; //线性函数的值 0.5即50%
12 static double Max=0.9; //方波函数的最大值
13 static double Min=0.1; //方波函数的最小值
14
15 typedef double Func(double); //定义一个函数类型 Func*为函数指针
16 typedef void Solve(Func *calc);//定义函数类型,参数为函数指针Func*
17 inline DWORD get_time()
18 {
19 return GetTickCount(); //操作系统启动到现在所经过的时间ms
20 }
21 double calc_sin(double x) //调用周期函数solve_period的参数
22 {
23 return (1 + sin(FACTOR * x)) / 2; //y=1/2(1+sin(a*x))
24 }
25 double calc_fangbo(double x) //调用周期函数solve_period的参数
26 {
27 //方波函数
28 if(x<=PERIOD/2) return Max;
29 else return Min;
30 }
31
32 void solve_period(Func *calc) //线程函数为周期函数
33 {
34 double x = 0.0;
35 double cache[COUNT];
36 for (int i = 0; i < COUNT; ++i, x += GAP)
37 cache[i] = calc(x);
38 int count = 0;
39 while(1)
40 {
41 unsigned ta = get_time();
42 if (count >= COUNT) count = 0;
43 double r = cache[count++];
44 DWORD busy = r * GAP;
45 while(get_time() - ta < busy) {}
46 Sleep(GAP - busy);
47 }
48 }
49
50 void solve_linear(Func*) //线程函数为线性函数,参数为空 NULL
51 {
52 const unsigned BUSY = Ratio * GAP_LINEAR;
53 const unsigned IDLE = (1 - Ratio) * GAP_LINEAR;
54 while(1)
55 {
56 unsigned ta = get_time();
57 while(get_time() - ta < BUSY) {}
58 Sleep(IDLE);
59 }
60 }
61 //void solve_nonperiod(Func *calc) //非周期函数的处理,暂没实验
62 //{
63 // double tb = 0;
64 // while(1)
65 // {
66 // unsigned ta = get_time();
67 // double r = calc(tb);
68 // if (r < 0 || r > 1) r = 1;
69 // DWORD busy = r * GAP;
70 // while(get_time() - ta < busy) {}
71 // Sleep(GAP - busy);
72 // //tb += GAP;
73 // tb += get_time() - ta;
74 // }
75 //}
76
77 void run(int i=1,double R=0.5,double T=60000,double max=0.9,double min=0.1)
78 //i为输出状态,R为直线函数的值,T为周期函数的周期,max方波最大值,min方波最小值
79 {
80 Ratio=R; PERIOD=T; Max=max; Min=min;
81 Func *func[] = {NULL ,calc_sin,calc_fangbo}; //传给Solve的参数,函数指针数组
82 Solve *solve_func[] = { solve_linear, solve_period}; //Solve函数指针数组
83 const int NUM_CPUS = 2; //双核,通用的可以用下面GetSystemInfo得到cpu数目
84 HANDLE handle[NUM_CPUS];
85 DWORD thread_id[NUM_CPUS]; //线程id
86 //SYSTEM_INFO info;
87 //GetSystemInfo(&info); //得到cpu数目
88 //const int num = info.dwNumberOfProcessors;
89 switch(i)
90 {
91 case 1: //cpu1 ,cpu2都输出直线
92 {
93 for (int i = 0; i < NUM_CPUS; ++i)
94 {
95 Func *calc = func[0];
96 Solve *solve = solve_func[0];
97 if ((handle[i] = CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)solve,
98 (VOID*)calc, 0, &thread_id[i])) != NULL) //创建新线程
99 SetThreadAffinityMask(handle[i], i+1); //限定线程运行在哪个cpu上
100 }
101 WaitForSingleObject(handle[0],INFINITE); //等待线程结束
102 break;
103 }
104 case 2: //cpu1直线,cpu2正弦
105 {
106 for (int i = 0; i < NUM_CPUS; ++i)
107 {
108 Func *calc = func[i];
109 Solve *solve = solve_func[i];
110 if ((handle[i] = CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)solve,
111 (VOID*)calc, 0, &thread_id[i])) != NULL) //创建新线程
112 SetThreadAffinityMask(handle[i], i+1); //限定线程运行在哪个cpu上
113 }
114 WaitForSingleObject(handle[0],INFINITE); //等待线程结束
115 break;
116 }
117 case 3: //cpu1直线,cpu2方波
118 {
119
120 /*Func *calc = func[0];
121 Solve *solve = solve_func[0];*/
122 if ((handle[0] = CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)solve_func[0],
123 (VOID*)func[0], 0, &thread_id[0])) != NULL) //创建新线程
124 SetThreadAffinityMask(handle[0], 1); //限定线程运行在哪个cpu上
125 Func *calc = func[2];
126 Solve *solve = solve_func[1];
127 if ((handle[1] = CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)solve,
128 (VOID*)calc, 0, &thread_id[1])) != NULL) //创建新线程
129 SetThreadAffinityMask(handle[1], 2); //限定线程运行在哪个cpu上
130 WaitForSingleObject(handle[0],INFINITE); //等待线程结束
131 break;
132 }
133 case 4: //cpu1正弦,cpu2方波
134 {
135 if ((handle[0] = CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)solve_func[1],
136 (VOID*)func[1], 0, &thread_id[0])) != NULL) //创建新线程
137 SetThreadAffinityMask(handle[0], 1); //限定线程运行在哪个cpu上
138 Func *calc = func[2];
139 Solve *solve = solve_func[1];
140 if ((handle[1] = CreateThread(NULL, 0, (LPTHREAD_START_ROUTINE)solve,
141 (VOID*)calc, 0, &thread_id[1])) != NULL) //创建新线程
142 SetThreadAffinityMask(handle[1], 2); //限定线程运行在哪个cpu上
143 WaitForSingleObject(handle[0],INFINITE); //等待线程结束
144 break;
145 }
146 default: break;
147 }
148 }
149
150 void main()
151 {
152 run(1,0.5); //cpu1 ,cpu2都输出50%的直线
153 //run(2,0.5,30000); //cpu1 0.5直线,cpu2正弦周期30000
154 //run(3); //cpu1直线,cpu2方波
155 //run(4,0.8,30000,0.95,0.5); //cpu1正弦,cpu2 0.95-0.5的方波
156 }
补充几个函数的说明:
GetTickCount返回(retrieve)从操作系统启动到现在所经过(elapsed)的毫秒数,它的返回值是DWORD。函数原型: DWORD GetTickCount(void); C/C++头文件:winbase.h ;windows程序设计中可以使用头文件windows.h
Sleep()函数 C++中头文件<windows.h>下的函数 作用:延时,程序暂停若干时间。时间,就是他的参数,单位是毫秒。Sleep (500) ; //注意第一个字母是大写。就是到这里停半秒,然后继续向下执行。 在Linux C语言中 sleep的单位是秒 sleep(5); //停5秒 包含在 <unistd.h>头文件中
CreateThread,建立新的线程 HANDLE CreateThread(
LPSECURITY_ATTRIBUTES lpThreadAttributes, // pointer to security attributes
DWORD dwStackSize, // initial thread stack size
LPTHREAD_START_ROUTINE lpStartAddress, // pointer to thread function
LPVOID lpParameter, // argument for new thread
DWORD dwCreationFlags, // creation flags
LPDWORD lpThreadId // pointer to receive thread ID );
概述: 当使用CreateProcess调用时,系统将创建一个进程和一个主线程。CreateThread将在主线程的基础上创建一个新线程,大致做如下步骤: 1在内核对象中分配一个线程标识/句柄,可供管理,由CreateThread返回 2把线程退出码置为STILL_ACTIVE,把线程挂起计数置1 3分配context结构 4分配两页的物理存储以准备栈,保护页设置为PAGE_READWRITE,第2页设为PAGE_GUARD 5lpStartAddr和lpvThread值被放在栈顶,使它们成为传送给StartOfThread的参数 6把context结构的栈指针指向栈顶(第5步)指令指针指向startOfThread函数 语法: hThread = CreateThread (&security_attributes,dwStackSize,ThreadProc,pParam,dwFlags, &idThread) ; 参数说明: 第一个参数是指向SECURITY_ATTRIBUTES型态的结构的指针。在Windows 98中忽略该参数。在Windows NT中,它被设为NULL。第二个参数是用于新线程的初始堆栈大小,默认值为0。在任何情况下,Windows根据需要动态延长堆栈的大小。 CreateThread的第三个参数是指向线程函数的指针。函数名称没有限制,但是必须以下列形式声明: DWORD WINAPI ThreadProc (PVOID pParam) ; CreateThread的第四个参数为传递给ThreadProc的参数。这样主线程和从属线程就可以共享数据。 CreateThread的第五个参数通常为0,但当建立的线程不马上执行时为旗标CREATE_SUSPENDED。线程将暂停直到呼叫ResumeThread来恢复线程的执行为止。第六个参数是一个指标,指向接受执行绪ID值的变量。
SetThreadAffinityMask:The SetThreadAffinityMask function sets a processor affinity mask for the specified thread. DWORD_PTR SetThreadAffinityMask(HANDLE hThread, DWORD_PTR dwThreadAffinityMask); 调用SetThreadAffinityMask,能为各个线程设置亲缘性屏蔽:该函数中的h T h r e a d参数用于指明要限制哪个线程, dwThreadAffinityMask用于指明该线程能够在哪个CPU上运行。dwThreadAffinityMask必须是进程的亲缘性屏蔽的相应子集。返回值是线程的前一个亲缘性屏蔽。因此,若要将3个线程限制到CPU1、2和3上去运行,可以这样操作: //Thread 0 can only run on CPU 0. SetThreadAffinityMask(hThread0, 0x00000001); //第0位是1 //Threads 1, 2, 3 run on CPUs 1, 2, 3.//第1 2 3位是1 SetThreadAffinityMask(hThread1, 0x0000000E); SetThreadAffinityMask(hThread2, 0x0000000E); SetThreadAffinityMask(hThread3, 0x0000000E);
WaitForSingleObject 当指定的对象的状态被标记或者指定的时间间隔过完时,此函数返回DWORD类型参数。
格式:DWORD WaitForSingleObject(HANDLE hHandle,DWORD dwMilliseconds);
参数:hHandle表示对象的句柄,dwMilliseconds指出了时间间隔;过了指定的时间,即使对象状态没发生改变,函数也会返回;如果此参数设为0,函数测试对象的状态并且立即返回;如果此参数设为INFINITE,则表示此函数的时间间隔永远不会流逝完——只有等待对象状态被标识时返回。 返回值:成功:WAIT_OBJECT_0:表示对象的状态被标识 WAIT_TIMEOUT:表示指定时间已到而对象状态没有被标识 失败:WAIT_FAILED:表明失败WaitForSingleObject 函数检查指定对象当前状态,如果对象的状态没有被标识,则调用的线程进入有效的等待状态。在等待对象状态被标识或者指定的时间间隔到期,线程只会占据(consume)处理器一小段时间。时间间隔需要被指定在0到0x7FFFFFFF之间的正数,最大的时间间隔值不等于无穷大而是0x7FFFFFFF,无穷大的时间间隔值是0xFFFFFFFF。任何在0x7FFFFFFF和0xFFFFFFFE之间的值都等同于0x7FFFFFFF;如果你需要一个时间间隔比0x7FFFFFFF还要大的话,使用表示不穷的值0xFFFFFFFF。返回之前,等待函数修改了某些类型的同步对象的状态,只有当对象的信号状态引起了函数的返回时这种修改才发生。例如,一个信号量对象计数减少1。WaitForSingleObject 函数能等待如下的各种对象:事件(Event)、线程(Thread)、进程(Process)、互斥量(Mutex)、信号量(Semaphore)。 使用时要小心调用等待函数和直接或间接产生窗口的代码。如果一个线程创建了窗口,那么它必须处理消息。广播消息发送到系统中的所有窗口。使用一个没有时间间隔的等待函数的线程可能导致系统死锁。例如,动态数据交换(DDE)协议和COM函数CoInitialize两个都间接地创建了可能导致死锁的窗口。因此,如果您有一个线程创建的窗口,使用MsgWaitForMultipleObjects 或者 MsgWaitForMultipleObjectsEx 而不是使用WaitForSingleObject。