躬行笔记 » 系统调用追踪神器strace，让程序运行过程无所遁形！

前几天遇到一个奇怪的问题，一个Python脚本在测试环境运行正常，但是部署到生产环境就莫名其妙地卡住了。日志里也没有明显的错误信息，真是让人抓狂。后来想起了strace这个工具，用它一追踪，立马就发现问题出在哪里了。今天就来跟大家分享一下这个系统调用追踪的神器。

strace是个什么东西

strace是Linux系统下的一个调试工具，它能够追踪程序运行时的系统调用和信号。简单来说，就是能让你看到程序在底层都做了什么操作。

你可能会问，为什么要关心系统调用？其实程序要想完成任何有意义的工作，比如读写文件、网络通信、创建进程等，都必须通过系统调用来实现。当程序出现问题时，通过strace可以清楚地看到程序卡在哪个系统调用上，或者哪个系统调用返回了错误。

我刚开始接触strace的时候，觉得输出的信息太多太复杂，看不懂。但是用多了之后发现，这些看似复杂的信息其实包含了程序运行的所有细节，是排查问题的宝贵线索。

基本使用方法

strace的基本用法很简单，直接在要执行的命令前面加上strace就行了：

strace ls -l

这样就能看到ls命令执行过程中的所有系统调用。不过输出信息会很多，刚开始可能会被刷屏的信息搞得眼花缭乱。

如果要追踪一个正在运行的进程，可以用-p参数：

strace -p 1234

这里1234是进程ID。这个功能特别有用，当你发现某个进程CPU占用很高或者卡住不动时，可以用这个方法看看它在干什么。

还有一个常用的参数是-f，可以追踪子进程：

strace -f ./my_program

这样如果程序创建了子进程，strace也会一并追踪。

过滤和输出控制

strace的输出信息通常很多，需要学会过滤才能快速找到有用的信息。

只追踪特定的系统调用：

strace -e trace=open,read,write ./my_program

这样只会显示open、read、write这三个系统调用。

追踪文件相关的系统调用：

strace -e trace=file ./my_program

追踪网络相关的系统调用：

strace -e trace=network ./my_program

将输出保存到文件：

strace -o output.txt ./my_program

这样就不会被刷屏了，可以慢慢分析输出文件。

显示时间戳：

strace -t ./my_program

加上-t参数会在每行前面显示时间，-tt会显示更精确的时间，-ttt会显示从epoch开始的秒数。

实际问题排查案例

让我分享几个用strace排查问题的真实案例。

案例1：程序启动缓慢

有一次一个Java应用启动特别慢，正常情况下几秒钟就能启动，但是那次要等好几分钟。用strace追踪了一下：

strace -f -e trace=file java -jar myapp.jar

发现程序在读取某个配置文件时卡住了很久。进一步检查发现，那个配置文件在NFS挂载的目录下，而NFS服务器响应很慢。问题找到了，解决方案就是把配置文件移到本地磁盘。

案例2：文件权限问题

还有一次，一个脚本在某台服务器上运行失败，但是错误信息很模糊。用strace一看：

strace -e trace=file ./myscript.sh

发现脚本在尝试写入某个目录时返回了EACCES错误，原来是权限不够。虽然这个问题看起来很简单，但是在复杂的环境中，有时候很难直接定位到具体是哪个文件的权限问题。

案例3：网络连接问题

前面提到的那个Python脚本问题，用strace追踪后发现：

strace -e trace=network python myscript.py

程序卡在connect系统调用上，一直在尝试连接某个IP地址。检查后发现，测试环境和生产环境的网络配置不同，生产环境无法访问那个IP。

理解strace的输出格式

strace的输出格式是固定的，理解了格式就能快速读懂信息。

一般格式是：

系统调用名(参数1, 参数2, ...) = 返回值

比如：

open("/etc/passwd", O_RDONLY) = 3
read(3, "root:x:0:0:root:/root:/bin/bash\n"..., 4096) = 1024
close(3) = 0

这表示程序打开了/etc/passwd文件，返回文件描述符3，然后读取了1024字节的数据，最后关闭了文件。

如果系统调用失败，会显示错误信息：

open("/nonexistent", O_RDONLY) = -1 ENOENT (No such file or directory)

ENOENT就是错误码，后面的括号里是错误描述。

常见系统调用的含义

了解一些常见系统调用的含义，有助于快速理解程序的行为。

文件操作：

open/openat：打开文件
read/write：读写文件
close：关闭文件
stat/lstat：获取文件信息
access：检查文件权限

进程管理：

fork/clone：创建进程
execve：执行程序
wait/waitpid：等待子进程
exit/exit_group：退出进程

网络操作：

socket：创建套接字
connect：连接服务器
bind：绑定地址
listen：监听连接
accept：接受连接

内存管理：

mmap：内存映射
munmap：取消内存映射
brk/sbrk：调整堆大小

性能分析功能

strace不仅能用来排查问题，还能用来分析程序性能。

统计系统调用：

strace -c ./my_program

这会在程序结束后显示系统调用的统计信息，包括每个系统调用的次数、总时间、平均时间等。这对于找出性能瓶颈很有帮助。

显示系统调用耗时：

strace -T ./my_program

-T参数会在每行末尾显示该系统调用的耗时。如果某个系统调用耗时特别长，就可能是性能瓶颈。

我曾经用这个功能发现一个程序频繁调用stat系统调用，每次都要几毫秒。虽然单次调用时间不长，但是调用次数太多，累积起来就成了性能问题。

高级使用技巧

追踪特定的文件操作：

strace -e trace=file -e write=1 ./my_program 2>&1 | grep "/tmp"

这样可以只看对/tmp目录的操作。

追踪信号：

strace -e trace=signal ./my_program

可以看到程序接收和处理的信号。

设置输出格式：

strace -s 200 ./my_program

-s参数控制字符串的显示长度，默认是32字符。如果需要看完整的字符串内容，可以增大这个值。

追踪多个进程：

strace -f -o trace.out ./my_program

使用-f追踪子进程时，输出文件会自动加上进程ID后缀，比如trace.out.1234。

与其他调试工具的配合

strace通常不是单独使用的，经常需要配合其他工具。

配合lsof：
当strace显示程序在操作某个文件描述符时，可以用lsof查看这个文件描述符对应的具体文件：

lsof -p 1234

配合netstat：
当发现网络相关的问题时，可以用netstat查看网络连接状态：

netstat -anp | grep 1234

配合ps：
查看进程的详细信息：

ps aux | grep my_program

在不同场景下的应用

Web应用调试：
当Web应用响应缓慢时，可以追踪Web服务器进程：

strace -p `pgrep nginx` -e trace=network,file

数据库问题排查：
数据库连接问题经常让人头疼，strace可以清楚地显示连接过程：

strace -e trace=network mysql -h localhost -u root -p

容器环境调试：
在Docker容器中也可以使用strace，不过需要特殊权限：

docker run --cap-add SYS_PTRACE myimage strace ./my_program

注意事项和限制

使用strace时有一些需要注意的地方。

性能影响：strace会显著影响程序性能，因为每个系统调用都要被拦截和记录。在生产环境使用时要特别小心。

权限要求：追踪其他用户的进程需要root权限。

输出量大：对于复杂的程序，strace的输出可能非常庞大。建议使用过滤参数或者将输出重定向到文件。

安全考虑：strace的输出可能包含敏感信息，比如密码、密钥等。在共享strace输出时要注意脱敏。

替代工具和扩展

除了strace，还有一些类似的工具：

ltrace：追踪库函数调用，而不是系统调用。对于调试应用层问题很有用。

ftrace：内核级别的追踪工具，功能更强大但是使用更复杂。

perf：性能分析工具，可以提供更详细的性能数据。

SystemTap：动态追踪工具，可以编写脚本进行复杂的追踪分析。

不过对于大部分日常调试工作，strace已经足够了。

实用的strace命令组合

这里分享一些我经常用的strace命令组合：

追踪文件访问：

strace -e trace=file -f ./my_program 2>&1 | grep -E "(open|access|stat)"

查找配置文件：

strace -e trace=file ./my_program 2>&1 | grep -E "\.(conf|cfg|ini|xml|json)"

监控网络活动：

strace -e trace=network -p 1234 2>&1 | grep -E "(connect|accept|send|recv)"

分析启动过程：

strace -f -e trace=file,process -o startup.log ./my_program

调试脚本和解释器

strace对于调试脚本语言程序特别有用，因为可以看到解释器的底层行为。

Python脚本：

strace -e trace=file python myscript.py 2>&1 | grep "\.py"

可以看到Python导入了哪些模块。

Shell脚本：

strace -f -e trace=file,process bash myscript.sh

可以看到脚本执行了哪些外部命令。

总结

strace是一个非常强大的调试工具，虽然学习曲线有点陡峭，但是掌握了之后对排查系统问题帮助很大。特别是那些没有明显错误信息的问题，strace往往能提供关键线索。

当然，strace也不是万能的。它主要适用于系统级别的问题，对于应用逻辑错误帮助有限。而且strace的输出信息很多，需要一定的经验才能快速找到有用的信息。

我的建议是，平时多用strace追踪一些简单的程序，熟悉常见系统调用的含义和输出格式。这样当真正遇到问题时，就能快速上手了。

另外，不要忘记strace只是调试工具箱中的一个工具。结合日志分析、性能监控、代码审查等其他手段，才能更有效地解决问题。

最重要的是，要理解程序的预期行为。只有知道程序应该做什么，才能通过strace的输出判断哪里出了问题。这需要对系统原理和程序逻辑有一定的了解。

如果你觉得这篇文章对你有帮助，欢迎点赞转发！也欢迎在评论区分享你使用strace的经验和遇到的有趣问题。想了解更多系统调试和运维相关的技术分享，记得关注@运维躬行录，我会持续分享一些实用的运维工具和排障经验！

系统调用追踪神器strace，让程序运行过程无所遁形！