管道符 “|” - 乐可夫斯基的博客

管道符（Pipeline）是一个用于连接多个命令的特殊符号，它可以将前一个命令的标准输出（stdout） 作为后一个命令的标准输入（stdin），实现命令间的数据传递和协同工作，是 Linux 命令行中高效处理数据的核心机制之一。

通过管道符，用户可以将简单命令组合成复杂的处理流程，无需临时文件即可完成数据的过滤、转换和分析。

 命令1 | 命令2 | 命令3 ...

其中，命令1 的输出直接作为 命令2 的输入，命令2 的输出再作为 命令3 的输入，以此类推，形成一个“管道链”。

核心作用与特性

数据流式传递：前一个命令的输出实时传递给后一个命令，无需等待前一个命令完全执行完毕，适合处理大文件或实时数据。
无临时文件：避免创建中间文件存储临时结果，节省磁盘空间并提高效率。
命令组合灵活性：可将文本处理命令（如 grep、awk、sed）、筛选命令（如 sort、uniq）、分页命令（如 less、more）等任意组合。

参考示例

示例1：过滤文件内容并分页查看 执行 cat /var/log/syslog | grep "ERROR" | less，流程为：
1. cat /var/log/syslog 读取系统日志文件内容并输出；
2. 管道符将输出传递给 grep "ERROR"，筛选包含“ERROR”的行；
3. 再通过管道将结果传递给 less，实现分页查看错误日志。
示例2：统计文件中关键词出现的次数 执行 grep "failed" /var/log/auth.log | wc -l，流程为：
1. grep "failed" /var/log/auth.log 从认证日志中筛选包含“failed”（失败）的行；
2. 管道符将筛选结果传递给 wc -l，wc -l 统计输入的行数，最终输出登录失败的次数。
示例3：排序并去重文件内容 执行 cat access.log | awk '{print $1}' | sort | uniq -c，流程为：
1. cat access.log 读取访问日志；
2. awk '{print $1}' 提取日志中第一列（通常是客户端 IP 地址）；
3. sort 对 IP 地址进行排序；
4. uniq -c 去除重复的 IP 并统计每个 IP 出现的次数，最终输出每个 IP 的访问量。
示例4：实时监控日志并筛选关键字 执行 tail -f /var/log/nginx/access.log | grep "404"，流程为：
1. tail -f 实时追踪日志文件的新增内容；
2. 管道符将新增内容传递给 grep "404"，实时筛选出包含“404”（页面不存在）的请求日志，便于监控网站错误。
示例5：复杂数据处理链 执行 ps aux | grep "java" | grep -v "grep" | awk '{print $2}'，流程为：
1. ps aux 列出所有进程信息；
2. grep "java" 筛选包含“java”的进程；
3. grep -v "grep" 排除自身 grep 进程（避免干扰结果）；
4. awk '{print $2}' 提取进程的 PID（第二列），最终输出所有 Java 进程的 ID。
示例6：管道与重定向结合 执行 ls -l /etc | grep ".conf" | tee config_files.txt | wc -l，流程为：
1. ls -l /etc 列出 /etc 目录下的文件详情；
2. grep ".conf" 筛选出配置文件（.conf 结尾）；
3. tee config_files.txt 将结果同时输出到终端和 config_files.txt 文件；
4. wc -l 统计配置文件的数量，实现“筛选+保存+统计”一站式处理。

注意：管道符仅传递标准输出（stdout），标准错误（stderr）默认不传递。若需传递错误输出，可使用 2>&1 将 stderr 重定向到 stdout，例如 command 2>&1 | grep "error"。

评论