Articles of pandas

Anotar puntos de datos al trazar desde Pandas DataFrame

Me gustaría anotar los puntos de datos con sus valores al lado de los puntos en la ttwig. Los ejemplos que encontré solo tratan con xey como vectores. Sin embargo, me gustaría hacer esto para un DataFrame de pandas que contiene múltiples columnas. ax = plt.figure().add_subplot(1, 1, 1) df.plot(ax = ax) plt.show() ¿Cuál es la […]

Agregar una columna que es resultado de la diferencia en filas consecutivas en pandas

Digamos que tengo un dataframe como este AB 0 ab 1 cd 2 ef 3 gh 0,1,2,3 son tiempos, a, c, e, g es una serie temporal y b, d, f, h es otra serie temporal. Necesito poder agregar dos columnas al dataframe de orignal que se obtiene al calcular las diferencias de filas consecutivas […]

Pandas: encuentra la columna cuyo nombre contiene una cadena específica

Por lo tanto, tengo un dataframe con nombres de columna, y quiero encontrar el que contiene una determinada cadena, pero no coincide exactamente. Estoy buscando ‘spike’ en nombres de columna como ‘spike-2’ , ‘hey spike’ , ‘spiked-in’ (la parte ‘spike’ siempre es continua). Quiero que el nombre de la columna se devuelva como una cadena […]

Seaborn: countplot () con frecuencias

Tengo un Panda DataFrame con una columna llamada “AXLES”, que puede tomar un valor entero entre 3-12. Estoy tratando de usar la opción de cuenta de punta de Seaborn () para lograr la siguiente gráfica: el eje y izquierdo muestra las frecuencias de estos valores que ocurren en los datos. El eje se extiende son […]

Concatenar cadenas de varias filas usando Pandas groupby

Quiero fusionar varias cadenas en un dataframe basado en un agrupado en Pandas. Este es mi código hasta ahora: import pandas as pd from io import StringIO data = StringIO(“”” “name1″,”hej”,”2014-11-01″ “name1″,”du”,”2014-11-02″ “name1″,”aj”,”2014-12-01″ “name1″,”oj”,”2014-12-02″ “name2″,”fin”,”2014-11-01″ “name2″,”katt”,”2014-11-02″ “name2″,”mycket”,”2014-12-01″ “name2″,”lite”,”2014-12-01″ “””) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=[“name”,”text”,”date”],parse_dates=[2]) # add column with month […]

Importar la columna del dataframe pandas como cadena no int

Me gustaría importar las siguientes csv como cadenas no como int64. Pandas read_csv lo convierte automáticamente a int64, pero necesito esta columna como cadena. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824 00013007854817840017963235 00013007854817840018860166 df = read_csv(‘sample.csv’) df.ID >> 0 -9223372036854775808 1 -9223372036854775808 2 -9223372036854775808 3 -9223372036854775808 4 -9223372036854775808 5 -9223372036854775808 6 -9223372036854775808 Name: ID Lamentablemente, el […]

Conversión de una columna dentro del dataframe pandas de int a cadena

Estoy empezando a trabajar con pandas. Tengo un dataframe en pandas con columnas mixtas de datos int y str. Quiero concatenar las primeras columnas dentro del dataframe, para hacer eso tengo que convertir la columna int en str . Intenté hacer eso así: mtrx[‘X.3’] = mtrx.to_string(columns = [‘X.3’]) o así mtrx[‘X.3’] = mtrx[‘X.3’].astype(str) pero en […]

Pandas groupby con unión de delimitador

Intenté usar groupby para agrupar filas con múltiples valores. col val A Cat A Tiger B Ball B Bat import pandas as pd df = pd.read_csv(“Inputfile.txt”, sep=’\t’) group = df.groupby([‘col’])[‘val’].sum() tengo A CatTiger B BallBat Quiero introducir un delimitador, para que mi salida se vea como A Cat-Tiger B Ball-Bat Lo intenté, group = df.groupby([‘col’])[‘val’].sum().apply(lambda […]

La importación de pandas muestra ImportError: no se puede importar el nombre hashtable

He instalado pandas en Python 3.3 y codificado así: import csv import pandas from pandas import DataFrame csvdata = pandas.read_csv(‘datafile.csv’) df = DataFrame(csvdata) Viene con el siguiente mensaje de error: cannot import name hashtable Traceback (most recent call last): File “C:\Users\document\test4.py”, line 5, in import pandas File “C:\Python33\lib\site-packages\pandas\__init__.py”, line 6, in from . import hashtable, […]

¿Aplica la función pandas a la columna para crear múltiples columnas nuevas?

Cómo hacer esto en pandas: Tengo una función extract_text_features en una sola columna de texto, devolviendo múltiples columnas de salida. Específicamente, la función devuelve 6 valores. La función funciona, sin embargo, no parece haber ningún tipo de retorno adecuado (pandas DataFrame / numpy array / Python list) para que la salida se pueda asignar correctamente […]