Articles of dividir

Emular split () con dplyr group_by: devuelve una lista de marcos de datos

Tengo un gran conjunto de datos que estrangula split() en R. Puedo usar dplyr group_by (que es una forma preferida de todos modos) pero no puedo persistir en el grouped_df resultante como una lista de marcos de datos, un formato requerido por mi consecutivo pasos de procesamiento (necesito forzar a SpatialDataFrames y similares). considere un […]

Dividir un archivo csv con comillas como delimitador de texto usando String.split ()

Tengo un archivo separado por comas con muchas líneas similares a la siguiente. Sachin,,M,”Maths,Science,English”,Need to improve in these subjects. Quotes se usa para escapar de la coma de delimitador utilizada para representar valores múltiples. Ahora, ¿cómo puedo dividir el valor anterior en el delimitador de comas usando String.split() si es posible?

¿Cómo subconjunto un dataframe por un factor y repetir un diagtwig para cada subconjunto?

Soy nuevo en R. Perdóname si esto si esta pregunta tiene una respuesta obvia pero no he podido encontrar una solución. Tengo experiencia con SAS y puedo estar pensando en este problema de la manera incorrecta. Tengo un conjunto de datos con medidas repetidas de cientos de sujetos y cada sujeto tiene múltiples medidas en […]

¿Cómo analizo eficientemente un archivo CSV en Perl?

Estoy trabajando en un proyecto que implica analizar un gran archivo con formato csv en Perl y estoy buscando hacer las cosas más eficientes. Mi enfoque ha sido split() el archivo por líneas primero, y luego split() cada línea nuevamente por comas para obtener los campos. Pero esto es poco óptimo ya que se requieren […]

Divida una columna de datos concatenados delimitados por comas y recodifique la salida como factores

Estoy tratando de limpiar algunos datos que han sido ingresados ​​incorrectamente. La pregunta para la variable permite respuestas múltiples de cinco opciones, numeradas del 1 al 5. Los datos se han ingresado de la siguiente manera (esto es solo un ejemplo: hay muchas más variables y muchas más observaciones en los datos reales) marco): data […]

¿Cuál es el algoritmo detrás de la función `split` del núcleo R?

split es una función especialmente importante en R core. Muchas soluciones de Stack Overflow que ofrecen soluciones de base R basadas en la manipulación de datos se basan en él. Es la rutina de caballo de batalla de cualquier grupo por operaciones. También hay muchas preguntas cuya solución es solo una línea con split . […]

¿Hay una función para dividir una cadena en PL / SQL?

Necesito escribir un procedimiento para normalizar un registro que tenga múltiples tokens concatenados por un char. Necesito obtener estos tokens dividiendo la cadena e insertando cada uno como un nuevo registro en una tabla. ¿Oracle tiene algo así como una función de “división”?