Expresiones regulares en C: ejemplos?

Estoy man regex.h algunos ejemplos simples y las mejores prácticas de cómo usar expresiones regulares en ANSI C. man regex.h no proporciona tanta ayuda.

Las expresiones regulares en realidad no son parte de ANSI C. Parece que podría estar hablando de la biblioteca de expresiones regulares POSIX, que viene con la mayoría de (todos?) * Nixes. Aquí hay un ejemplo del uso de expresiones regulares POSIX en C (en base a esto ):

 #include  regex_t regex; int reti; char msgbuf[100]; /* Compile regular expression */ reti = regcomp(&regex, "^a[[:alnum:]]", 0); if (reti) { fprintf(stderr, "Could not compile regex\n"); exit(1); } /* Execute regular expression */ reti = regexec(&regex, "abc", 0, NULL, 0); if (!reti) { puts("Match"); } else if (reti == REG_NOMATCH) { puts("No match"); } else { regerror(reti, &regex, msgbuf, sizeof(msgbuf)); fprintf(stderr, "Regex match failed: %s\n", msgbuf); exit(1); } /* Free memory allocated to the pattern buffer by regcomp() */ regfree(&regex); 

Alternativamente, es posible que desee comprobar PCRE , una biblioteca para expresiones regulares compatibles con Perl en C. La syntax de Perl es más o menos la misma syntax utilizada en Java, Python y varios otros idiomas. La syntax POSIX es la syntax utilizada por grep , sed , vi , etc.

Probablemente no sea lo que quieres, pero una herramienta como re2c puede comstackr expresiones regulares POSIX (-ish) en ANSI C. Está escrito como un reemplazo para lex , pero este enfoque te permite sacrificar flexibilidad y legibilidad para el último bit de velocidad. si realmente lo necesitas

man regex.h informa que no hay una entrada manual para regex.h, pero man 3 regex le proporciona una página que explica las funciones POSIX para la coincidencia de patrones.

Las mismas funciones se describen en The GNU C Library: Regular Expression Matching , donde se explica que la GNU C Library admite tanto la interfaz POSIX.2 como la que GNU C Library ha tenido durante muchos años.

Por ejemplo, para un progtwig hipotético que imprime cuál de las cadenas pasadas como argumento coincide con el patrón pasado como primer argumento, puede usar un código similar al siguiente:

 #include  #include  #include  #include  #include  void print_regerror (int errcode, size_t length, regex_t *compiled); int main (int argc, char *argv[]) { regex_t regex; int result; if (argc < 3) { // The number of passed arguments is lower than the number of // expected arguments. fputs ("Missing command line arguments\n", stderr); return EXIT_FAILURE; } result = regcomp (&regex, argv[1], REG_EXTENDED); if (result) { // Any value different from 0 means it was not possible to // compile the regular expression, either for memory problems // or problems with the regular expression syntax. if (result == REG_ESPACE) fprintf (stderr, "%s\n", strerror(ENOMEM)); else fputs ("Syntax error in the regular expression passed as first argument\n", stderr); return EXIT_FAILURE; } for (int i = 2; i < argc; i++) { result = regexec (&regex, argv[i], 0, NULL, 0); if (!result) { printf ("'%s' matches the regular expression\n", argv[i]); } else if (result == REG_NOMATCH) { printf ("'%s' doesn't the regular expression\n", argv[i]); } else { // The function returned an error; print the string // describing it. // Get the size of the buffer required for the error message. size_t length = regerror (result, &regex, NULL, 0); print_regerror (result, length, &regex); return EXIT_FAILURE; } } /* Free the memory allocated from regcomp(). */ regfree (&regex); return EXIT_SUCCESS; } void print_regerror (int errcode, size_t length, regex_t *compiled) { char buffer[length]; (void) regerror (errcode, compiled, buffer, length); fprintf(stderr, "Regex match failed: %s\n", buffer); } 

El último argumento de regcomp() debe ser al menos REG_EXTENDED , o las funciones usarán expresiones regulares básicas , lo que significa que (por ejemplo) necesitaría usar a\{3\} lugar de a{3} usado desde una extensión expresiones regulares , que es probablemente lo que espera usar.

POSIX.2 también tiene otra función para la coincidencia de comodines: fnmatch() . No permite comstackr la expresión regular u obtener las subcadenas que coincidan con una sub-expresión, pero es muy específica para verificar cuando un nombre de archivo coincide con un comodín (por ejemplo, usa el indicador FNM_PATHNAME ).

Si bien la respuesta anterior es buena, recomiendo usar PCRE2 . Esto significa que puedes usar literalmente todos los ejemplos de expresiones regulares ahora y que no tienes que traducir de una expresión regular antigua.

Hice una respuesta para esto, pero creo que también puede ayudar aquí …

Regex In C Para buscar números de tarjetas de crédito

 // YOU MUST SPECIFY THE UNIT WIDTH BEFORE THE INCLUDE OF THE pcre.h #define PCRE2_CODE_UNIT_WIDTH 8 #include  #include  #include  #include  int main(){ bool Debug = true; bool Found = false; pcre2_code *re; PCRE2_SPTR pattern; PCRE2_SPTR subject; int errornumber; int i; int rc; PCRE2_SIZE erroroffset; PCRE2_SIZE *ovector; size_t subject_length; pcre2_match_data *match_data; char * RegexStr = "(?:\\D|^)(5[1-5][0-9]{2}(?:\\ |\\-|)[0-9]{4}(?:\\ |\\-|)[0-9]{4}(?:\\ |\\-|)[0-9]{4})(?:\\D|$)"; char * source = "5111 2222 3333 4444"; pattern = (PCRE2_SPTR)RegexStr;// <<<<< This is where you pass your REGEX subject = (PCRE2_SPTR)source;// <<<<< This is where you pass your bufer that will be checked. subject_length = strlen((char *)subject); re = pcre2_compile( pattern, /* the pattern */ PCRE2_ZERO_TERMINATED, /* indicates pattern is zero-terminated */ 0, /* default options */ &errornumber, /* for error number */ &erroroffset, /* for error offset */ NULL); /* use default compile context */ /* Compilation failed: print the error message and exit. */ if (re == NULL) { PCRE2_UCHAR buffer[256]; pcre2_get_error_message(errornumber, buffer, sizeof(buffer)); printf("PCRE2 compilation failed at offset %d: %s\n", (int)erroroffset,buffer); return 1; } match_data = pcre2_match_data_create_from_pattern(re, NULL); rc = pcre2_match( re, subject, /* the subject string */ subject_length, /* the length of the subject */ 0, /* start at offset 0 in the subject */ 0, /* default options */ match_data, /* block for storing the result */ NULL); if (rc < 0) { switch(rc) { case PCRE2_ERROR_NOMATCH: //printf("No match\n"); // pcre2_match_data_free(match_data); pcre2_code_free(re); Found = 0; return Found; // break; /* Handle other special cases if you like */ default: printf("Matching error %d\n", rc); //break; } pcre2_match_data_free(match_data); /* Release memory used for the match */ pcre2_code_free(re); Found = 0; /* data and the compiled pattern. */ return Found; } if (Debug){ ovector = pcre2_get_ovector_pointer(match_data); printf("Match succeeded at offset %d\n", (int)ovector[0]); if (rc == 0) printf("ovector was not big enough for all the captured substrings\n"); if (ovector[0] > ovector[1]) { printf("\\K was used in an assertion to set the match start after its end.\n" "From end to start the match was: %.*s\n", (int)(ovector[0] - ovector[1]), (char *)(subject + ovector[1])); printf("Run abandoned\n"); pcre2_match_data_free(match_data); pcre2_code_free(re); return 0; } for (i = 0; i < rc; i++) { PCRE2_SPTR substring_start = subject + ovector[2*i]; size_t substring_length = ovector[2*i+1] - ovector[2*i]; printf("%2d: %.*s\n", i, (int)substring_length, (char *)substring_start); } } else{ if(rc > 0){ Found = true; } } pcre2_match_data_free(match_data); pcre2_code_free(re); return Found; } 

Instale PCRE usando:

 wget https://ftp.pcre.org/pub/pcre/pcre2-10.31.zip make sudo make install sudo ldconfig 

Comstackr usando:

 gcc foo.c -lpcre2-8 -o foo 

Verifique mi respuesta para más detalles.