Articles of regex

¿Es posible hacer coincidir los paréntesis nesteds con expresiones regulares sin usar grupos de recursión o balanceo?

StackOverflow fomenta las preguntas auto-respondidas, así que decidí crear esta publicación para compartir algo que descubrí recientemente. El problema : unir un grupo de paréntesis nesteds arbitrariamente con un sabor de expresiones regulares como java.util.regex de Java que no admite recursividad ni grupos de equilibrio. Es decir, unir los 3 grupos externos en: (Primera segunda […]

Traduzca expresiones regulares de Perl a .NET

Tengo algunas expresiones regulares útiles en Perl. ¿Hay alguna forma sencilla de traducirlos al dialecto de expresiones regulares de .NET? Si no, ¿hay una referencia concisa de las diferencias?

¿Cómo dividir una cadena separada por comas mientras se ignoran las comillas escapadas?

Necesito escribir una versión extendida de la función StringUtils.commaDelimitedListToStringArray que obtiene un parámetro adicional: el escape char. así que llamando a mi: commaDelimitedListToStringArray(“test,test\\,test\\,test,test”, “\\”) debería regresar: [“test”, “test,test,test”, “test”] Mi bash actual es usar String.split () para dividir el String usando expresiones regulares: String[] array = str.split(“[^\\\\],”); Pero la matriz devuelta es: [“tes”, “test\,test\,tes”, “test”] […]

¿Cómo puedo insertar un carácter de tabulación con sed en OS X?

Yo he tratado: echo -e “egg\t \t\t salad” | sed -E ‘s/[[:blank:]]+/\t/g’ Lo que resulta en: eggtsalad Y… echo -e “egg\t \t\t salad” | sed -E ‘s/[[:blank:]]+/\\t/g’ Lo que resulta en: egg\tsalad Lo que me gustaría: egg salad

¿Por qué no puedes usar cuantificadores de repetición en aserciones de aspecto de ancho cero?

Siempre tuve la impresión de que no se podían usar cuantificadores de repetición en aseriones de ancho cero (Perl Compatible Regular Expressions [PCRE]). Sin embargo, recientemente me ha sucedido que puede usarlos en las afirmaciones de anticipación. Entonces mi pregunta es: ¿Cómo funciona el motor de PCRE Regex cuando se busca con un aspecto de […]

Regex para que coincida con cualquier personaje, incluidas las nuevas líneas

¿Hay una expresión regular que coincida con “todos los caracteres, incluidas las líneas nuevas”? Por ejemplo, en la expresión regular a continuación, no hay salida de $2 porque (.+?) No incluye nuevas líneas al hacer coincidir. $string = “START Curabitur mollis, dolor ut rutrum consequat, arcu nisl ultrices diam, adipiscing aliquam ipsum metus id velit. […]

¿Puedo reemplazar grupos en Java regex?

Tengo este código, y quiero saber si puedo reemplazar solo los grupos (no todos los patrones) en Java regex. Código: //… Pattern p = Pattern.compile(“(\\d).*(\\d)”); String input = “6 example input 4”; Matcher m = p.matcher(input); if (m.find()) { //Now I want replace group one ( (\\d) ) with number //and group two (too (\\d) […]

C # Regex para Guid

Necesito analizar a través de una cadena y agregar comillas simples alrededor de cada valor de Guid. Estaba pensando que podría usar un Regex para hacer esto, pero no soy exactamente un gurú Regex. ¿Hay un buen Regex para identificar a un Guid? Mi segunda pregunta es que una vez que he encontrado una expresión […]

Negando una referencia inversa en expresiones regulares

si una cadena tiene este formato predicho: value = “hello and good morning” Donde “(citas) también podría ser” (comillas simples), y el carácter de cierre (“o”) será el mismo que el de apertura. Quiero hacer coincidir la cadena entre las comillas. \bvalue\s*=\s*([“‘])([^\1]*)\1 (los dos son para permitir cualquier espacio cerca del signo =) El primer […]

eliminar caracteres de un rango Unicode específico de una cadena

Tengo un progtwig que analiza los tweets en tiempo real de la API de Twitter. Antes de almacenarlos, los estoy codificando como utf8. Ciertos personajes terminan apareciendo en la cadena como?, ??, o ??? en lugar de sus respectivos códigos Unicode y causar problemas. Tras una investigación más profunda, descubrí que los personajes problemáticos son […]