摘要: 实际上,没有任何语言或操作系统可以为你提供异步突然终止线程的便利,且不会警告你不要使用它们。
本文分享自华为云社区《如何编写高效、优雅、可信代码系列(1)——C++多线程强制终止》,原文作者:我是一颗大西瓜 。
故事的起因来源于我在优化他人 c++源码的时候,想通过多线程的方式提升程序的运算效率,主要存在以下需求和难点:
1. 多个线程并行跑模型,看哪个模型跑的快,跑出来后结束其他线程,线程间独立运行无通信过程
2. 源码模型很复杂,函数调用较多,不好改动,因此不太适合通过信号或标志进行通信终止
网上搜索了一下线程结束的几种方式:
1. 线程函数的 return 返回(建议)。这种退出线程的方式是最安全的,在线程函数 return 返回后, 会清理函数内申请的类对象, 即调用这些对象的析构函数.。然后会自动调用 _endthreadex()函数来清理 _beginthreadex()函数申请的资源(主要是创建的 tiddata 对象)。
2. 同一个进程或另一个进程中的线程调用 TerminateThread 函数(应避免使用该方法)。TerminateThread 能够撤消任何线程,其中 hThread 参数用于标识被终止运行的线程的句柄。当线程终止运行时,它的退出代码成为你作为 dwExitCode 参数传递的值。同时,线程的内核对象的使用计数也被递减。注意 TerminateThread 函数是异步运行的函数,也就是说,它告诉系统你想要线程终止运行,但是,当函数返回时,不能保证线程被撤消。如果需要确切地知道该线程已经终止运行,必须调用 WaitForSingleObject 或者类似的函数,传递线程的句柄。
3. 通过调用 ExitThread 函数,线程将自行撤消(最好不使用该方法)。该函数将终止线程的运行,并导致操作系统清除该线程使用的所有操作系统资源。但是,C++资源(如 C++类对象)将不被析构。
4. ExitProcess 和 TerminateProcess 函数也可以用来终止线程的运行(应避免使用该方法)。
选项 2 和 3 可能会导致内存泄漏,实际上,没有任何语言或操作系统可以为你提供异步突然终止线程的便利,且不会警告你不要使用它们。所有这些执行环境都强烈建议开发人员,甚至要求在协作或同步线程终止的基础上构建多线程应用程序。
现有的线程结束函数,包括 linux 系统的 pthread.h 中的 pthread_exit()和 pthread_cancel(),windows 系统的 win32.h 中的 ExitThread()和 TerminateThread(),也就是说,C++没有提供 kill 掉某个线程的能力,只能被动地等待某个线程的自然结束,析构函数~thread()也不能停止线程,析构函数只能在线程静止时终止线程 joinable,对于连接/分离的线程,析构函数根本无法终止线程。
要终止与 OS /编译器相关的函数的线程,我们需要知道如何从 C++获取本机线程数据类型 std::thread。幸运的是,在调用或之前 std::thread 提供了一个 API native_handle()以获取线程的本机句柄类型。并且可以将此本地句柄传递给本地 OS 线程终止函数,例如 join()detach() pthread_cancel()。
以下代码用于显示 std::thread::native_handle(),std::thread::get_id()并 pthread_self()返回相同的代码 pthread_t 来处理 Linux / GCC 的 C++线程
#include #include #include #include #include std::mutex iomutex; void f(int num) { std::this_thread::sleep_for(std::chrono::seconds(1)); std::lock_guard lk(iomutex); std::cout << "Thread " << num << " pthread_t " << pthread_self() << std::endl; } int main() { std::thread t1(f, 1), t2(f, 2); //t1.join(); t2.join(); ----------------pos 1 //t1.detach(); t2.detach(); -------------pos 2 std::cout << "Thread 1 thread id " << t1.get_id() << std::endl; std::cout << "Thread 2 thread id " << t2.get_id() << std::endl; std::cout << "Thread 1 native handle " << t1.native_handle() << std::endl; std::cout << "Thread 2 native handle " << t2.native_handle() << std::endl; t1.join(); t2.join(); //t1.detach(); t2.detach(); }
运行后可以得到结果
$ g++ -Wall -std=c++11 cpp_thread_pthread.cc -o cpp_thread_pthread -pthread -lpthread $ ./cpp_thread_pthread Thread 1 thread id 140109390030592 Thread 2 thread id 140109381637888 Thread 1 native handle 140109390030592 Thread 2 native handle 140109381637888 Thread 1 pthread_t 140109390030592 Thread 2 pthread_t 140109381637888
uncommentpos 1 或者 pos2 后,即调用 join()或之后 detach(),C++线程会丢失本机句柄类型的信息
$ ./cpp_thread_pthread Thread 1 pthread_t 139811504355072 Thread 2 pthread_t 139811495962368 Thread 1 thread id thread::id of a non-executing thread Thread 2 thread id thread::id of a non-executing thread Thread 1 native handle 0 Thread 2 native handle 0
因此,要有效地调用本机线程终止函数(例如 pthread_cancel),需要在调用 std::thread::join()时或之前保存本机句柄 std::thread::detach()。这样,始终可以使用有效的本机句柄终止线程。
class Foo { public: void sleep_for(const std::string &tname, int num) { prctl(PR_SET_NAME,tname.c_str(),0,0,0); sleep(num); } void start_thread(const std::string &tname) { std::thread thrd = std::thread(&Foo::sleep_for, this, tname, 3600); tm_[tname] = thrd.native_handle(); thrd.detach(); std::cout << "Thread " << tname << " created:" << std::endl; } void stop_thread(const std::string &tname) { ThreadMap::const_iterator it = tm_.find(tname); if (it != tm_.end()) { pthread_cancel(it->second); tm_.erase(tname); std::cout << "Thread " << tname << " killed:" << std::endl; } } private: typedef std::unordered_map ThreadMap; ThreadMap tm_; }; int main() { Foo foo; std::string keyword("test_thread"); std::string tname1 = keyword + "1"; std::string tname2 = keyword + "2"; // create and kill thread 1 foo.start_thread(tname1); foo.stop_thread(tname1); // create and kill thread 2 foo.start_thread(tname2); foo.stop_thread(tname2); return 0; }
结果是
$ g++ -Wall -std=c++11 kill_cpp_thread.cc -o kill_cpp_thread -pthread -lpthread $ ./kill_cpp_thread Thread test_thread1 created: 30332 30333 pts/5 00:00:00 test_thread1 Thread test_thread1 killed: Thread test_thread2 created: 30332 30340 pts/5 00:00:00 test_thread2 Thread test_thread2 killed:
当然,条件允许的话最好还是使用返回或信号的方式终止线程,这样也符合安全可信的要求。
获取更多 AI 相关数据、算法、模型等 AI 资产,请点击“了解更多”,AIGallery 等您!