C++命令行参数

前言

我们在Linux用到的命令常常支持很多参数,那么如何写一个程序,也像Linux命令一样支持很多参数呢?有什么什么优雅的处理方法?

命令行参数

在介绍如何处理命令行参数之前,简单介绍一下命令行参数,已经了解的朋友可以跳过此小节。
我们用一段代码,打印传给程序的每一个参数

int main(int argc, char *argv[])
{
    int i = 0;
    for(i = 0; i < argc; i++)
    {
        printf("the %d para is %s\n",i,argv[i]);
    }
    return 0;
}

其中argc代表输入的参数个数,而argv中保存着参数具体的值,我们编译运行:

$ gcc -o main main.c
$ ./main 编程珠玑 C C++ Java 博客
the 0 para is ./main
the 1 para is 编程珠玑
the 2 para is C
the 3 para is C++
the 4 para is Java
the 5 para is 博客

我们依次打印了程序的输入参数,其中特别注意的是,第一个(下标为0)的参数是程序本身。

如何优雅地处理命令行参数

实际上我们通过getopt函数很容易实现。
函数声明
getopt就可以非常方便地处理简单参数了,其声明如下:

extern int optind,opterr,optopt;
extern char *optarg;
int getopt(int argc,char *const argv[],const char *optstring);

参数介绍

几个参数说明如下:
• argc 参数个数,可从main函数入口传入
• argv 参数字符串数组,可从main函数入口传入
• optstring 支持的选项字符串
第一个和第二个参数我们很熟悉,它和main函数的参数是一样的:

int main(int argc,char *argv[]);

第三个参数是什么意思呢?指的是你支持的选项,假设你的程序支持-h,-a,-n选项,并且-n选项后面要跟具体参数,那么optstring可以是:
“han:”
选项后面有一个冒号表示这个选项需要带参数。
它的返回值是int类型,如果出错,则返回-1,如果命令参数不识别,则返回’?‘。

外部变量

它有四个外部变量,含义分别如下:
• optind 存放下一个要处理的字符串在argv数组中的下标,从1开始
• opterr 如果选项发生错误,getopt会打印出错消息,如果设置为0,则不打印。
• optopt 如果选项处理发生错误,它会指向导致出错的选项字符串
• optarg 如果一个选项需要参数,如前面提到的n参数,由于后面有:,所以它需要参数,处理到它时,optarg会指向这个参数。
程序示例
我们仍然通过一个示例程序来看:

extern int optind,opterr,optopt;
extern char *optarg;
int main(int argc,char *argv[])
{
    int c = 0; //用于接收选项
    /*循环处理参数*/
    while(EOF != (c = getopt(argc,argv,"han:")))
    {
        //打印处理的参数
        printf("start to process %d para\n",optind);
        switch(c)
        {
            case 'h':
                printf("we get option -h\n");
                break;
            case 'a':
                printf("we get option -a\n");
                break;
            //-n选项必须要参数
            case 'n':
                printf("we get option -n,para is %s\n",optarg);
                break;
            //表示选项不支持
            case '?':
                printf("unknow option:%c\n",optopt);
                break;
            default:
                break;
        }
    }

    return 0;
}

编译运行:

$ gcc -o main1 main1.c

输入正常选项时,我们可以看到能正确获取到选项,获取到之后自然就可以做对应的动作了。

$ ./main1 -h -a
start to process 2 para
we get option -h
start to process 3 para
we get option -a

如果输入的选项不支持,就会提示未知选项:

$ ./main1 -u
./main1: invalid option -- 'u'
start to process 2 para
unknow option:u

对于-n选项,我们需要参数,如果没有参数会怎样?

$ ./main1 -n
./main1: option requires an argument -- 'n'
start to process 2 para
unknow option:n

它会提示我们n选项需要参数,于是带上参数:

$ ./main1 -n
start to process 3 para
we get option -n,para is 2

怎么样?是不是很简单?

问题

但是不知道你有没有发现,上面的处理有个问题,那就是不支持长选项。
什么意思呢?

$ ./main1 -ha
start to process 1 para
we get option -h
start to process 2 para
we get option -a

这种情况下,-ha被当成了两个选项,而不是一个选项,选项名为ha。
那么这种情况应该如何处理呢?就需要用到后面的函数啦。
长选项处理
为了应对前面说的这种情况,需要用到下面两个函数中的一个:

int getopt_long(int argc, char * const argv[],
                  const char *optstring,
                  const struct option *longopts, int *longindex);

int getopt_long_only(int argc, char * const argv[],
                  const char *optstring,
                  const struct option *longopts, int *longindex);
struct option {
               const char *name;
               int         has_arg;
               int        *flag;
               int         val;
           };

它们的第一个第二个参数和getopt一样,第三个参数是一个struct option指针:
其成员含义分别如下:
• name 长选项名称
• has_arg 参数可选项,no_argument表示该选项后不带参,required_argument表示该选项后面带参数
• *flag 匹配到选项后,如果flag是NULL,则返回val;如果不是NULL,则返回0,并且将val的值赋给flag指向的内存
• val 匹配到选项后的返回值
longindex表示长选项在longopts中的索引值。
那getopt_long和getopt_long_only有什么区别呢?
实际上主要功能是差不多的,只是前者一个-时被解析成短选项,–被解析成长选项,而后者都被解析为长选项,举个例子,-help在前者被解析为h,e,l,p四个选项,而在后者是和–help一样的效果,即被认为是长选项。在getopt_long_only中,optstring可以为“”。
我们来看一个示例程序:

extern int optind,opterr,optopt;
extern char *optargi;
//定义长选项
static struct option long_options[] =
{
    {"help",no_argument,NULL,'h'},
    {"verbose",no_argument,NULL,'v'},
    {"number",required_argument,NULL,'n'}
};
int main(int argc,char *argv[])
{
    int index = 0;
    int c = 0; //用于接收选项
    /*循环处理参数*/
    while(EOF != (c = getopt_long(argc,argv,"hvn:",long_options,&index)))
    {
        switch(c)
        {
            case 'h':
                printf("we get option -h,index %d\n",index);
                break;
            case 'v':
                printf("we get option -v,index %d\n",index);
                break;
            //-n选项必须要参数
            case 'n':
                printf("we get option -n,para is %s\n",optarg);
                break;
            //表示选项不支持
            case '?':
                printf("unknow option:%c\n",optopt);
                break;
            default:
                break;
        }
    }
    return 0;
}

编译运行:

$ gcc -o main2 main2.c
$ ./main2 --verbose --help
we get option -v,index 1
we get option -h,index 0

注意,为什么-v参数的index是0?因为只有长选项才会对应index。
可以看到,使用–跟长选项,单个-后面跟短选项,但是如果是下面这样呢?

$ ./main2 -help
we get option -h,index 0
./main2: invalid option -- 'e'
unknow option:e
./main2: invalid option -- 'l'
unknow option:l
./main2: invalid option -- 'p'
unknow option:p

在这里,由于使用的getopt_long,它对于单个-的字符串,里面每个字符都当成了一个选项,因此help对它来说,其实是四个选项,但是后三个不被识别。如果想要-help也被当成长选项,那么就需要用到getopt_long_only函数了。
最后,再完整的用一遍:

$ ./main2 --help --verbose --number 10
we get option -h,index 0
we get option -v,index 1
we get option -n,para is 10

扩展说明

其实在处理选项的时候,如果参数前面有-,比如:
rm -bar
这里的-bar会被当成一个选项,而不是文件名,因此想要把它当成文件名,而不是选项,需要采用下面这种方式:
rm – -bar


   转载规则


《C++命令行参数》 吴杭沉 采用 知识共享署名 4.0 国际许可协议 进行许可。
 上一篇
C++ 流缓冲区 C++ 流缓冲区
C++ 的 I/O 是通过标准库中输入输出流来实现的。标准库在 iostream头文件当中,预定义了六个流对象,他们是: • istream <- std::cin/std::wcin,对应标准输入的输入流; • ostream &l
2024-09-04
下一篇 
std::ref std::ref
C++本身有引用&,为什么C++11又引入了std::ref?主要是考虑函数式编程如std::bind在使用时,是对参数直接拷贝,而不是引用。如下例子: void f(int& n1, int& n2, const
2024-09-03
  目录