当前位置: 首页 » 开发技巧 » Linux find命令与通配符(wildcard)常见错误

Linux find命令与通配符(wildcard)常见错误

本文长度500多字,阅读大概需要2分钟。

在Linux平台下find是常用命令,并且经常是配合通配符(wildcard)一起使用,毕竟我们只能记住某个文件一部分;我们需要寻找当前目录下所有的sh文件,随手敲一条命令:find . -name *.sh,目测逻辑完美,可以运行,只实际上这条命令在执行时有些许问题。

find使用中的错误

手边有环境的话,可以执行下会发现,结果是这样:

这种错误很奇怪,如果没看下文内容,完全不知道它想给我们什么提示。
为了说明问题,我们先编写一小段c代码。

#include <stdio.h>
int main(int argc, char *argv[]) {
    int i;
    printf("参数个数=%d\n", argc);
    for(i=0;i < argc; i++){
        printf("参数 %d: '%s'\n", i, argv[i]);
    }
    return 0;
}

执行gcc test.c,编译完毕后,直接执行a.out:./a.out,得到结果:

也就是说,我们在没有任何参数的情况下,程序认为有一个参数,就是程序名本身。
再次测试,./a.out *.sh

这就是文章想说的错误,在使用了通配符的情况下,程序先匹配了所有的sh文件,并将他们当成了参数。
回到文章开头的部分,多个sh文件名作为参数传递给了find,所以find . -name *.sh实际执行时是:find . -name change_es_log_level.sh change_es_mapping.sh data.sh es-docker.sh…,change_es_log_level.sh被find识别成了path参数,实际却是单个文件,导致了错误。

解决

先说解决方法,只需要稍微修改下,./a.out “*.sh”

这样就符合预期了,同理推论,需要查找当前目录下所有的sh文件,应该是find . -name “*.sh”,对比之前命令,只是多了一对引号。

为什么会这样?

这里只讲一个unix平台下的概念,globbing,我们可以在环境中执行man 7 glob,看看说明

Long ago, in UNIX V6, there was a program /etc/glob that would expand wildcard patterns. Soon afterward this became a shell built-in.

These days there is also a library routine glob(3) that will perform this function for a user program.

The rules are as follows (POSIX.2, 3.13).

A string is a wildcard pattern if it contains one of the characters ‘?’, ‘*’ or ‘[‘. Globbing is the operation that expands a wild‐
card pattern into the list of pathnames matching the pattern. Matching is defined by:

A ‘?’ (not between brackets) matches any single character.

A ‘*’ (not between brackets) matches any string, including the empty string.

  • 一个字符串包含了通配符时,shell会将通配符展开,将当前目录下,匹配到的文件名称作为参数传递给程序,所以才出现了我们上面看到的诡异现象。
  • 这种特性内置在shell中,受影响的不紧紧是find命令,使用通配符做参数时还是要小心,需要加上引号,比如你想计算44,这时可能被当作是通配符,而不是乘号。
  • shell中还有很多诡异的错误,都是有原因,只是我们没有时间或者懒得去找。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

滚动至顶部