Windbg关于死锁的简单调试分析总结-Aet

Bingliaolong 2024-09-13 19:02 Aet | 隐藏边栏 | 抢沙发 | 46 0

文章评分 1 次，平均分 5.0 ：

示例代码

#include <iostream>

#include <thread>

#include <mutex>

std::mutex mutex1;

std::mutex mutex2;

void threadFunction1() {

std::lock_guard<std::mutex> lock1(mutex1);

std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 模拟工作

std::lock_guard<std::mutex> lock2(mutex2);

std::cout << "Thread 1 finished work" << std::endl;

}

void threadFunction2() {

std::lock_guard<std::mutex> lock2(mutex2);

std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 模拟工作

std::lock_guard<std::mutex> lock1(mutex1);

std::cout << "Thread 2 finished work" << std::endl;

}

int main() {

std::thread t1(threadFunction1);

std::thread t2(threadFunction2);

t1.join();

t2.join();

return 0;

}

WinDbg分析

启动调试

编译并运行程序
1. 使用VS编译生成test.exe，并双击运行
附加到进程
1. 启动 WinDbg，选择 File > Attach to Process，找到并选择运行的死锁程序
暂停程序执行
1. 在 WinDbg 中，点击工具栏上的暂停按钮 Debug -> Break

分析：检查线程状态

输入以下命令查看当前所有线程

使用以下命令查看当前线程的调用堆栈

~* kb

示例

0:004> ~

0 Id: 66d8.69f4 Suspend: 1 Teb: 000000be`0cd2d000 Unfrozen

1 Id: 66d8.920 Suspend: 1 Teb: 000000be`0cd2f000 Unfrozen

2 Id: 66d8.6eb8 Suspend: 1 Teb: 000000be`0cd31000 Unfrozen

3 Id: 66d8.1600 Suspend: 1 Teb: 000000be`0cd33000 Unfrozen

. 4 Id: 66d8.55ec Suspend: 1 Teb: 000000be`0cd35000 Unfrozen

5 Id: 66d8.3124 Suspend: 1 Teb: 000000be`0cd37000 Unfrozen

# 6 Id: 66d8.73e8 Suspend: 1 Teb: 000000be`0cd39000 Unfrozen

0:004> ~* kb

0 Id: 66d8.69f4 Suspend: 1 Teb: 000000be`0cd2d000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`47da920e : cccccccc`cccccccc cccccccc`cccccccc cccccccc`cccccccc 00007ff7`ab77145b : ntdll!NtWaitForSingleObject+0x14

01 00007ffb`ee9327e4 : 00000000`00000000 00007ffb`ee9327ba 00000020`00000000 00000000`000000d4 : KERNELBASE!WaitForSingleObjectEx+0x8e

02 00007ff7`ab774581 : 000000be`0cbbfa60 00000000`00000000 c3a7d800`00000047 00000000`00000000 : MSVCP140D!_Thrd_join+0x24 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\cthread.cpp @ 53]

03 00007ff7`ab774d49 : 000000be`0cbbfac8 00007ff7`ab771145 00000264`341a6100 00007ffb`3100f21e : leetcode_temp!std::thread::join+0x81 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\thread @ 133]

04 00007ff7`ab775b89 : 0000320f`00000001 00007ffb`310825c8 00000000`00000000 00007ff7`ab77771d : leetcode_temp!main+0x69 [Q:\qym_code\leetcode_temp\leetcode_temp\leetcode_temp.cpp @ 33]

05 00007ff7`ab775a32 : 00007ff7`ab77e000 00007ff7`ab77e220 00000000`00000000 00000000`00000000 : leetcode_temp!invoke_main+0x39 [D:\a\_work\1\s\src\vctools\crt\vcstartup\src\startup\exe_common.inl @ 79]

06 00007ff7`ab7758ee : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : leetcode_temp!__scrt_common_main_seh+0x132 [D:\a\_work\1\s\src\vctools\crt\vcstartup\src\startup\exe_common.inl @ 288]

07 00007ff7`ab775c1e : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : leetcode_temp!__scrt_common_main+0xe [D:\a\_work\1\s\src\vctools\crt\vcstartup\src\startup\exe_common.inl @ 331]

08 00007ffc`48307374 : 000000be`0cd2c000 00000000`00000000 00000000`00000000 00000000`00000000 : leetcode_temp!mainCRTStartup+0xe [D:\a\_work\1\s\src\vctools\crt\vcstartup\src\startup\exe_main.cpp @ 17]

09 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

0a 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

1 Id: 66d8.920 Suspend: 1 Teb: 000000be`0cd2f000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`4a23d407 : 00000000`00000000 00000000`00000000 00000264`341a4ce0 00000264`341a5d10 : ntdll!NtWaitForWorkViaWorkerFactory+0x14

01 00007ffc`48307374 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!TppWorkerThread+0x2f7

02 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

03 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

2 Id: 66d8.6eb8 Suspend: 1 Teb: 000000be`0cd31000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`4a23d407 : 00000000`00010017 00000000`00000001 00000264`00000001 00000264`341a7e70 : ntdll!NtWaitForWorkViaWorkerFactory+0x14

01 00007ffc`48307374 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!TppWorkerThread+0x2f7

02 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

03 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

3 Id: 66d8.1600 Suspend: 1 Teb: 000000be`0cd33000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`4a23d407 : 00000000`00000000 00000000`00000000 00000264`341a4ce0 00000264`341a60b0 : ntdll!NtWaitForWorkViaWorkerFactory+0x14

01 00007ffc`48307374 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!TppWorkerThread+0x2f7

02 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

03 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

4 Id: 66d8.55ec Suspend: 1 Teb: 000000be`0cd35000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`4a219205 : 00007ff7`ab78906f 000010bc`66c5ac50 000000be`0d1ff618 00000000`00000000 : ntdll!NtWaitForAlertByThreadId+0x14

01 00007ffb`ee932df3 : 00007ff7`00000000 cccccccc`cccccccc 00000000`00000000 000000be`0d1ff8b8 : ntdll!RtlAcquireSRWLockExclusive+0x165

02 00007ffb`ee932b65 : 00007ff7`ab783050 00000000`00000000 00007ff7`ab78906f 000000be`0d1ff8b8 : MSVCP140D!mtx_do_lock+0xb3 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\mutex.cpp @ 93]

03 00007ff7`ab7746f4 : 00007ff7`ab783050 00000000`00000000 00000000`00000330 000000be`0d1ff658 : MSVCP140D!_Mtx_lock+0x15 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\mutex.cpp @ 165]

04 00007ff7`ab773aa5 : 00007ff7`ab783050 00007ffb`31065cc3 00007ffb`3106548a 00007ffb`310661ce : leetcode_temp!std::_Mutex_base::lock+0x34 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\mutex @ 52]

05 00007ff7`ab774a65 : 000000be`0d1ff858 00007ff7`ab783050 00000000`00000000 00007ffc`4a2202c9 : leetcode_temp!std::lock_guard<std::mutex>::lock_guard<std::mutex>+0x45 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\mutex @ 454]

06 00007ff7`ab7737b9 : 00007ff7`ab789038 00007ffb`31065c20 00000000`00000015 00000000`00000000 : leetcode_temp!threadFunc1+0x85 [Q:\qym_code\leetcode_temp\leetcode_temp\leetcode_temp.cpp @ 18]

07 00007ff7`ab773037 : 00000264`341ac290 00000264`341ac290 00000000`00000000 ffffffff`fffffffe : leetcode_temp!std::invoke<void (__cdecl*)(void)>+0x29 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\type_traits @ 1704]

08 00007ffb`31082f95 : 00000264`341ac290 00000000`00000000 00000000`00000000 00000000`00000000 : leetcode_temp!std::thread::_Invoke<std::tuple<void (__cdecl*)(void)>,0>+0x87 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\thread @ 60]

09 00007ffc`48307374 : 00000264`341aa5f0 00000000`00000000 00000000`00000000 00000000`00000000 : ucrtbased!thread_start<unsigned int (__cdecl*)(void *),1>+0xa5 [minkernel\crts\ucrt\src\appcrt\startup\thread.cpp @ 97]

0a 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

0b 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

5 Id: 66d8.3124 Suspend: 1 Teb: 000000be`0cd37000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`4a219205 : 00007ff7`ab78906f 000010bc`66c59abc 000000be`0d2ff8e8 00000000`00000000 : ntdll!NtWaitForAlertByThreadId+0x14

01 00007ffb`ee932df3 : 00007ff7`00000000 cccccccc`cccccccc 00000000`00000000 000000be`0d2ffb88 : ntdll!RtlAcquireSRWLockExclusive+0x165

02 00007ffb`ee932b65 : 00007ff7`ab783000 00000000`00000000 00007ff7`ab78906f 000000be`0d2ffb88 : MSVCP140D!mtx_do_lock+0xb3 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\mutex.cpp @ 93]

03 00007ff7`ab7746f4 : 00007ff7`ab783000 00000000`00000000 00000264`00000330 000000be`0d2ff928 : MSVCP140D!_Mtx_lock+0x15 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\mutex.cpp @ 165]

04 00007ff7`ab773aa5 : 00007ff7`ab783000 00007ffb`31065cc3 00007ffb`3106548a 00007ffb`310661ce : leetcode_temp!std::_Mutex_base::lock+0x34 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\mutex @ 52]

05 00007ff7`ab774b85 : 000000be`0d2ffb28 00007ff7`ab783000 00000000`00000000 00007ffc`4a2202c9 : leetcode_temp!std::lock_guard<std::mutex>::lock_guard<std::mutex>+0x45 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\mutex @ 454]

06 00007ff7`ab7737b9 : 00007ff7`ab789038 00007ffb`31065c20 00000000`00000015 00000000`00000000 : leetcode_temp!threadFunc2+0x85 [Q:\qym_code\leetcode_temp\leetcode_temp\leetcode_temp.cpp @ 25]

07 00007ff7`ab773037 : 00000264`341abb10 00000264`341abb10 00000000`00000000 ffffffff`fffffffe : leetcode_temp!std::invoke<void (__cdecl*)(void)>+0x29 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\type_traits @ 1704]

08 00007ffb`31082f95 : 00000264`341abb10 00000000`00000000 00000000`00000000 00000000`00000000 : leetcode_temp!std::thread::_Invoke<std::tuple<void (__cdecl*)(void)>,0>+0x87 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\thread @ 60]

09 00007ffc`48307374 : 00000264`341aac10 00000000`00000000 00000000`00000000 00000000`00000000 : ucrtbased!thread_start<unsigned int (__cdecl*)(void *),1>+0xa5 [minkernel\crts\ucrt\src\appcrt\startup\thread.cpp @ 97]

0a 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

0b 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

# 6 Id: 66d8.73e8 Suspend: 1 Teb: 000000be`0cd39000 Unfrozen

# RetAddr : Args to Child : Call Site

00 00007ffc`4a2bcafe : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!DbgBreakPoint

01 00007ffc`48307374 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!DbgUiRemoteBreakin+0x4e

02 00007ffc`4a23cc91 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : KERNEL32!BaseThreadInitThunk+0x14

03 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : ntdll!RtlUserThreadStart+0x21

分析线程4
1. 调用堆栈显示，线程4卡在了等待互斥锁的过程中，从堆栈顶端可以看出线程在 NtWaitForAlertByThreadId 上挂起，这通常表示线程正在等待某个锁的释放
2. MSVCP140D!mtx_do_lock+0xb3 和 MSVCP140D!_Mtx_lock+0x15 表示线程正在试图锁定一个互斥锁
3. leetcode_temp!std::_Mutex_base::lock+0x34 和 leetcode_temp!std::lock_guard<std::mutex>::lock_guard<std::mutex>+0x45
  显示代码正在使用 std::mutex 和 std::lock_guard 进行锁操作，这些代码出现在死锁的关键位置
4. 堆栈显示锁的操作发生在文件 leetcode_temp.cpp 的第 18 行，也就是 threadFunc1 函数中
分析线程5
1. 表现和线程4一样
2. 线程5也卡在了等待互斥锁的过程中（线程正在等待某个锁的释放）
3. 和线程4一样，线程5正在试图锁定一个互斥锁
4. 和线程4一样，线程5也在使用 std::mutex 和 std::lock_guard 进行锁操作，这些代码出现在死锁的关键位置
5. 不同的是，堆栈显示锁的操作发生在文件 leetcode_temp.cpp 的第 25行，也就是 threadFunc2 函数中
结论
1. 观察到在线程4和线程5中看到了锁相关内容
2. threadFunc1是线程4的入口函数，threadFunc2是线程5的入口函数
3. 在这两个函数中，都是先使用std::lock_guard<std::mutex>锁了一个std::mutex，然后在等待另一个锁的释放
4. 可以得出死锁发生在了这两个函数中

进一步查看线程信息

在上一步确定它们发生了死锁的情况下，进一步验证
1. 切到目标线程

~4s

查看堆栈

0:004> kp

# Child-SP RetAddr Call Site

00 000000be`0d1ff508 00007ffc`4a219205 ntdll!NtWaitForAlertByThreadId+0x14

01 000000be`0d1ff510 00007ffb`ee932df3 ntdll!RtlAcquireSRWLockExclusive+0x165

02 000000be`0d1ff580 00007ffb`ee932b65 MSVCP140D!mtx_do_lock(struct _Mtx_internal_imp_t * mtx = 0x00007ff7`ab783050, struct _timespec64 * target = 0x00000000`00000000)+0xb3 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\mutex.cpp @ 93]

03 000000be`0d1ff5e0 00007ff7`ab7746f4 MSVCP140D!_Mtx_lock(struct _Mtx_internal_imp_t * mtx = 0x00007ff7`ab783050)+0x15 [D:\a\_work\1\s\src\vctools\crt\github\stl\src\mutex.cpp @ 165]

04 000000be`0d1ff610 00007ff7`ab773aa5 leetcode_temp!std::_Mutex_base::lock(void)+0x34 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\mutex @ 52]

05 000000be`0d1ff710 00007ff7`ab774a65 leetcode_temp!std::lock_guard<std::mutex>::lock_guard<std::mutex>(class std::mutex * _Mtx = 0x00007ff7`ab783050)+0x45 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\mutex @ 454]

06 000000be`0d1ff810 00007ff7`ab7737b9 leetcode_temp!threadFunc1(void)+0x85 [Q:\qym_code\leetcode_temp\leetcode_temp\leetcode_temp.cpp @ 18]

07 000000be`0d1ff990 00007ff7`ab773037 leetcode_temp!std::invoke<void (<function> ** _Obj = 0x00000264`341ac290)+0x29 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\type_traits @ 1704]

08 000000be`0d1ffa90 00007ffb`31082f95 leetcode_temp!std::thread::_Invoke<std::tuple<void (void * _RawVals = 0x00000264`341ac290)+0x87 [C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.41.34120\include\thread @ 60]

09 000000be`0d1ffbf0 00007ffc`48307374 ucrtbased!thread_start<unsigned int (void * parameter = 0x00000264`341aa5f0)+0xa5 [minkernel\crts\ucrt\src\appcrt\startup\thread.cpp @ 97]

0a 000000be`0d1ffc50 00007ffc`4a23cc91 KERNEL32!BaseThreadInitThunk+0x14

0b 000000be`0d1ffc80 00000000`00000000 ntdll!RtlUserThreadStart+0x21

发现第6条堆栈信息，表示是刚进入线程
1. 查看局部变量以及变量地址
2. 也可以直接查看全局变量（知道两个互斥量是全局的情况下，见下文）

0:004> dv

lock2 = class std::lock_guard<std::mutex>

lock1 = class std::lock_guard<std::mutex>

0:004> ?? &lock1

class std::lock_guard<std::mutex> * 0x000000be`0d1ff838

+0x000 _MyMutex : 0x00007ff7`ab783000 std::mutex

0:004> ?? &lock2

class std::lock_guard<std::mutex> * 0x000000be`0d1ff858

+0x000 _MyMutex : 0x00007ff7`ab783050 std::mutex

知道了两个锁的地址后，看看在线程4里面等待的是哪一个锁
1. 可以看到是0x00007ff7ab783050这个，也就是线程4等待的是lock2