DataFrame

Constructor

pd.DataFrame(
    data=None, # ndarray (estructurado u homogéneo), Iterable, dict, o DataFrame
    index=None, # Índice a utilizar para el marco resultante. 
    columns=None, # Etiquetas de columna a utilizar para el marco resultante si no tienen.  RangeIndex(0, 1, 2, ..., n). 
    dtype=None, # Tipo de datos a forzar. Solo se permite un único dtype. Si es None, se inferirá.
    copy=None # Copiar datos de las entradas. Para datos dict, el valor predeterminado de None se comporta como copy=True. 
)

Atributos

T: La transposición del DataFrame.
at: Accede a un valor único para un par de etiquetas de fila/columna.
attrs: Diccionario de atributos globales de este conjunto de datos.
axes: Devuelve una lista que representa los ejes del DataFrame.
columns: Las etiquetas de las columnas del DataFrame.
dtypes: Devuelve los dtypes en el DataFrame.
empty: Indicador de si la Serie/DataFrame está vacío.
flags: Obtiene las propiedades asociadas con este objeto de pandas.
iat: Accede a un valor único para un par de fila/columna por posición entera.
iloc: (OBSOLETO) Indexación basada puramente en la ubicación entera para la selección por posición.
index: El índice (etiquetas de fila) del DataFrame.
loc: Accede a un grupo de filas y columnas por etiqueta(s) o un array booleano.
ndim: Devuelve un entero que representa el número de ejes/dimensiones del array.
shape: Devuelve una tupla que representa la dimensionalidad del DataFrame.
size: Devuelve un entero que representa el número de elementos en este objeto.
style: Devuelve un objeto Styler.
values: Devuelve una representación de Numpy del DataFrame.

Conversión

.astype(dtype[, copy, errors]) : Convierte un objeto de pandas a un tipo de datos especificado dtype.
.convert_dtypes[infer_objects, ...]) : Convierte columnas a los mejores tipos de datos posibles, utilizando tipos de datos que soportan pd.NA.
.infer_objects([copy]) : Intenta inferir mejores tipos de datos para columnas de tipo objeto.
.copy([deep]) : Hace una copia de los índices y datos de este objeto.
.bool() : (DEPRECATED) Devuelve el valor booleano de una Serie o DataFrame de un solo elemento.

Indexación e iteración

.head([n]) : Devuelve las primeras n filas.
.at: Accede a un único valor para un par etiqueta de fila/columna.
.iat: Accede a un único valor para un par de posición de fila/columna mediante un índice entero.
.loc: Accede a un grupo de filas y columnas por etiqueta(s) o un array booleano.
.iloc: (DEPRECATED) Indexación puramente basada en la ubicación entera para la selección por posición.
.insert(loc, column, value[, ...]) : Inserta una columna en el DataFrame en la ubicación especificada.
.__iter__() : Itera sobre el eje de información.
.items() : Itera sobre pares (nombre de columna, Serie).
.keys() : Obtiene el ‘eje de información’ (ver Indexación para más detalles).
.iterrows() : Itera sobre las filas del DataFrame como pares (índice, Serie).
.itertuples([index, name]) : Itera sobre las filas del DataFrame como namedtuples.
.pop(item) : Devuelve el item y lo elimina del marco.
.tail([n]) : Devuelve las últimas n filas.
.xs(key[, axis, level, drop_level]) : Devuelve una sección cruzada de la Serie/DataFrame.
.get(key[, default]) : Obtiene un item del objeto para una clave dada (por ejemplo, una columna del DataFrame).
.isin(values) : Determina si cada elemento en el DataFrame está contenido en values.
.where(cond[, other, inplace, ...]) : Reemplaza valores donde la condición es Falsa.
.mask(cond[, other, inplace, axis, ...]) : Reemplaza valores donde la condición es Verdadera.
.query(expr, *[, inplace]) : Consulta las columnas de un DataFrame con una expresión booleana.

Aplicación de Funciones, GroupBy y Ventanas

.apply(func[, axis, raw, ...]) : Aplica una función a lo largo de un eje del DataFrame.
.map(func[, na_action]) : Aplica una función elemento a elemento a un DataFrame.
.applymap(func[, na_action]) : (DEPRECATED) Aplica una función elemento a elemento a un DataFrame.
.pipe(func, *args, kwargs) : Aplica funciones encadenables que esperan Series o DataFrames.
.agg([func, axis]) : Agrega utilizando una o más operaciones sobre el eje especificado.
.aggregate([func, axis]) : Agrega utilizando una o más operaciones sobre el eje especificado.
.transform(func[, axis]) : Llama a func en sí mismo, produciendo un DataFrame con la misma forma de eje que sí mismo.
.groupby([by, axis, level, ...]) : Agrupa el DataFrame usando un mapeador o por una Serie de columnas.
.rolling(window[, min_periods, ...]) : Proporciona cálculos de ventana deslizante.
.expanding([min_periods, axis, method]) : Proporciona cálculos de ventana expansiva.
.ewm([com, span, halflife, alpha, ...]) : Proporciona cálculos ponderados exponencialmente (EW).

Cálculos / Estadísticas Descriptivas

.abs() : Devuelve una Serie/DataFrame con el valor numérico absoluto de cada elemento.
.all([axis, bool_only, skipna]) : Devuelve si todos los elementos son Verdaderos, potencialmente sobre un eje.
.any(*[, axis, bool_only, skipna]) : Devuelve si algún elemento es Verdadero, potencialmente sobre un eje.
.clip([lower, upper, axis, inplace]) : Recorta valores en los umbrales de entrada.
.corr([method, min_periods, ...]) : Calcula la correlación par a par de columnas, excluyendo valores NA/nulos.
.corrwith(other[, axis, drop, ...]) : Calcula la correlación par a par.
.count([axis, numeric_only]) : Cuenta celdas no-NA para cada columna o fila.
.cov([min_periods, ddof, numeric_only]) : Calcula la covarianza par a par de columnas, excluyendo valores NA/nulos.
.cummax([axis, skipna]) : Devuelve el máximo acumulativo sobre un eje de Serie o DataFrame.
.cummin([axis, skipna]) : Devuelve el mínimo acumulativo sobre un eje de Serie o DataFrame.
.cumprod([axis, skipna]) : Devuelve el producto acumulativo sobre un eje de Serie o DataFrame.
.cumsum([axis, skipna]) : Devuelve la suma acumulativa sobre un eje de Serie o DataFrame.
.describe([percentiles, include, ...]) : Genera estadísticas descriptivas.
.diff([periods, axis]) : Primera diferencia discreta de elemento.
.eval(expr, *[, inplace]) : Evalúa una cadena que describe operaciones en columnas de DataFrame.
.kurt([axis, skipna, numeric_only]) : Devuelve la curtosis imparcial solicitada sobre el eje.
.kurtosis([axis, skipna, numeric_only]) : Devuelve la curtosis imparcial sobre el eje solicitado.
.max([axis, skipna, numeric_only]) : Devuelve el máximo de los valores sobre el eje solicitado.
.mean([axis, skipna, numeric_only]) : Devuelve la media de los valores sobre el eje solicitado.
.median([axis, skipna, numeric_only]) : Devuelve la mediana de los valores sobre el eje solicitado.
.min([axis, skipna, numeric_only]) : Devuelve el mínimo de los valores sobre el eje solicitado.
.mode([axis, numeric_only, dropna]) : Obtiene la(s) moda(s) de cada elemento a lo largo del eje seleccionado.
.pct_change([periods, fill_method, ...]) : Cambio fraccional entre el elemento actual y uno anterior.
.prod([axis, skipna, numeric_only, ...]) : Devuelve el producto de los valores sobre el eje solicitado.
.product([axis, skipna, ...]) : Devuelve el producto de los valores sobre el eje solicitado.
.quantile([q, axis, numeric_only, ...]) : Devuelve valores en el cuantil dado sobre el eje solicitado.
.rank([axis, method, numeric_only, ...]) : Calcula los rangos de datos numéricos (1 a n) a lo largo del eje.
.round([decimals]) : Redondea un DataFrame a un número variable de lugares decimales.
.sem([axis, skipna, ddof, numeric_only]) : Devuelve el error estándar no sesgado de la media sobre el eje solicitado.
.skew([axis, skipna, numeric_only]) : Devuelve la asimetría no sesgada sobre el eje solicitado.
.sum([axis, skipna, numeric_only, ...]) : Devuelve la suma de los valores sobre el eje solicitado.
.std([axis, skipna, ddof, numeric_only]) : Devuelve la desviación estándar de la muestra sobre el eje solicitado.
.var([axis, skipna, ddof, numeric_only]) : Devuelve la varianza imparcial sobre el eje solicitado.
.nunique([axis, dropna]) : Cuenta el número de elementos distintos en el eje especificado.
.value_counts([subset, normalize, ...]) : Devuelve una Serie que contiene la frecuencia de cada fila distinta en el DataFrame.

Reindexación / Selección / Manipulación de Etiquetas

.add_prefix(prefix[, axis]) : Prefija las etiquetas con el prefijo de cadena.
.add_suffix(suffix[, axis]) : Sufija las etiquetas con el sufijo de cadena.
.align(other[, join, axis, level, ...]) : Alinea dos objetos en sus ejes con el método de unión especificado.
.at_time(time[, asof, axis]) : Selecciona valores en un momento particular del día.
.between_time(start_time, end_time) : Selecciona valores entre momentos particulares del día.
.drop([labels, axis, index, ...]) : Elimina las etiquetas especificadas de filas o columnas.
.drop_duplicates([subset, keep, ...]) : Devuelve DataFrame con filas duplicadas eliminadas.
.duplicated([subset, keep]) : Devuelve Serie booleana que denota filas duplicadas.
.equals(other) : Prueba si dos objetos contienen los mismos elementos.
.filter([items, like, regex, axis]) : Subconjunto de filas o columnas del dataframe según las etiquetas de índice especificadas.
.first(offset) : (DEPRECATED) Selecciona periodos iniciales de datos de series temporales basados en un desplazamiento de fecha.
.head([n]) : Devuelve las primeras n filas.
.idxmax([axis, skipna, numeric_only]) : Devuelve el índice de la primera ocurrencia del máximo sobre el eje solicitado.
.idxmin([axis, skipna, numeric_only]) : Devuelve el índice de la primera ocurrencia del mínimo sobre el eje solicitado.
.last(offset) : (DEPRECATED) Selecciona periodos finales de datos de series temporales basados en un desplazamiento de fecha.
.reindex([labels, index, columns, ...]) : Conforma DataFrame a nuevo índice con lógica de llenado opcional.
.reindex_like(other[, method, ...]) : Devuelve un objeto con índices coincidentes como otro objeto.
.rename([mapper, index, columns, ...]) : Renombra columnas o etiquetas de índice.
.rename_axis([mapper, index, ...]) : Establece el nombre del eje para el índice o las columnas.
.reset_index([level, drop, ...]) : Restablece el índice, o un nivel de este.
.sample([n, frac, replace, ...]) : Devuelve una muestra aleatoria de elementos de un eje del objeto.
.set_axis(labels, *[, axis, copy]) : Asigna el índice deseado al eje dado.
.set_index(keys, *[, drop, append, ...]) : Establece el índice del DataFrame usando columnas existentes.
.tail([n]) : Devuelve las últimas n filas.
.take(indices[, axis]) : Devuelve los elementos en los índices posicionales dados a lo largo de un eje.
.truncate([before, after, axis, copy]) : Trunca una Serie o DataFrame antes y después de algún valor de índice.

Manejo de Datos Faltantes

.backfill(*[, axis, inplace, ...]) : (DEPRECATED) Llena valores NA/NaN usando la siguiente observación válida para llenar el hueco.
.bfill(*[, axis, inplace, limit, ...]) : Llena valores NA/NaN usando la siguiente observación válida para llenar el hueco.
.dropna(*[, axis, how, thresh, ...]) : Elimina valores faltantes.
.ffill(*[, axis, inplace, limit, ...]) : Llena valores NA/NaN propagando la última observación válida al siguiente válido.
.fillna([value, method, axis, ...]) : Llena valores NA/NaN usando el método especificado.
.interpolate([method, axis, limit, ...]) : Llena valores NaN usando un método de interpolación.
.isna() : Detecta valores faltantes.
.isnull() : DataFrame.isnull es un alias de DataFrame.isna.
.notna() : Detecta valores existentes (no faltantes).
.notnull() : DataFrame.notnull es un alias de DataFrame.notna.
.pad(*[, axis, inplace, limit, ...]) : (DEPRECATED) Llena valores NA/NaN propagando la última observación válida al siguiente válido.
.replace([to_replace, value, ...]) : Reemplaza valores dados en to_replace con value.

Reestructuración, Ordenación, Transposición

.droplevel(level[, axis]) : Devuelve Series/DataFrame con nivel(es) de índice/columna solicitados eliminados.
.pivot(*, columns[, index, values]) : Devuelve DataFrame reorganizado por los valores de índice/columna dados.
.pivot_table([values, index, ...]) : Crea una tabla dinámica al estilo de una hoja de cálculo como un DataFrame.
.reorder_levels(order[, axis]) : Reorganiza niveles de índice usando el orden de entrada.
.sort_values(by, *[, axis, ...]) : Ordena por los valores a lo largo de cualquiera de los ejes.
.sort_index(*[, axis, level, ...]) : Ordena el objeto por etiquetas (a lo largo de un eje).
.nlargest(n, columns[, keep]) : Devuelve las primeras n filas ordenadas por columnas en orden descendente.
.nsmallest(n, columns[, keep]) : Devuelve las primeras n filas ordenadas por columnas en orden ascendente.
.swaplevel([i, j, axis]) : Intercambia niveles i y j en un MultiIndex.
.stack([level, dropna, sort, ...]) : Apila los niveles prescritos de columnas a índice.
.unstack([level, fill_value, sort]) : Desapila un nivel de las etiquetas de índice (necesariamente jerárquicas).
.swapaxes(axis1, axis2[, copy]) : (DEPRECATED) Intercambia ejes e intercambia los valores de los ejes apropiadamente.
.melt([id_vars, value_vars, ...]) : Desanida un DataFrame de formato ancho a largo, dejando opcionalmente identificadores establecidos.
.explode(column[, ignore_index]) : Transforma cada elemento de un tipo lista en una fila, replicando los valores de índice.
.squeeze([axis]) : Convierte objetos de eje unidimensional en escalares.
.to_xarray() : Devuelve un objeto xarray del objeto pandas.
.T: La transposición del DataFrame.
.transpose(*args[, copy]) : Transpone índice y columnas.

Combinación / Comparación / Unión / Fusión

.assign(kwargs) : Asigna nuevas columnas a un DataFrame.
.compare(other[, align_axis, ...]) : Compara con otro DataFrame y muestra las diferencias.
.join(other[, on, how, lsuffix, ...]) : Une columnas de otro DataFrame.
.merge(right[, how, on, left_on, ...]) : Fusiona objetos DataFrame o Series nombradas con una unión al estilo de bases de datos.
.update(other[, join, overwrite, ...]) : Modifica en el lugar usando valores no NA de otro DataFrame.

Relacionado con Series Temporales

.asfreq(freq[, method, how, ...]) : Convierte series temporales a la frecuencia especificada.
.asof(where[, subset]) : Devuelve la(s) última(s) fila(s) sin ningún NaN antes de where.
.shift([periods, freq, axis, ...]) : Desplaza el índice por el número deseado de períodos con una frecuencia de tiempo opcional.
.first_valid_index() : Devuelve el índice del primer valor no NA o None, si no se encuentra ningún valor no NA.
.last_valid_index() : Devuelve el índice del último valor no NA o None, si no se encuentra ningún valor no NA.
.resample(rule[, axis, closed, ...]) : Reorganiza los datos de series temporales.
.to_period([freq, axis, copy]) : Convierte DataFrame de DatetimeIndex a PeriodIndex.
.to_timestamp[freq, how, axis, copy]) : Convierte a DatetimeIndex de marcas de tiempo, al comienzo del período.
.tz_convert(tz[, axis, level, copy]) : Convierte el eje consciente de tz a la zona horaria objetivo.
.tz_localize(tz[, axis, level, ...]) : Localiza el índice tz-naive de una Serie o DataFrame a la zona horaria objetivo.

Flags

Flags refer to attributes of the pandas object: Las propiedades del conjunto de datos (como la fecha en que se registró, la URL desde la que se accedió, etc.) deben almacenarse en DataFrame.attrs.

Flags(obj, *, allows_duplicate_labels) : Flags que se aplican a objetos pandas.

Metadatos

DataFrame.attrs: DataFrame.attrs es un diccionario para almacenar metadatos globales para este DataFrame.
Warning: DataFrame.attrs se considera experimental y puede cambiar sin previo aviso.
DataFrame.attrs: Diccionario de atributos globales de este conjunto de datos.

Plotting

.plot([x, y, kind, ax, ....]) : Accesor y método de plotting de DataFrame.
.plot.area([x, y, stacked]) : Dibuja un gráfico de área apilada.
.plot.bar([x, y]) : Gráfico de barras vertical.
.plot.barh([x, y]) : Crea un gráfico de barras horizontal.
.plot.box([by]) : Crea un diagrama de caja de las columnas del DataFrame.
.plot.density([bw_method, ind]) : Genera un gráfico de Estimación de Densidad Kernel usando kernels gaussianos.
.plot.hexbin(x, y[, C, ...]) : Genera un gráfico de agrupación hexagonal.
.plot.hist([by, bins]) : Dibuja un histograma de las columnas del DataFrame.
.plot.kde([bw_method, ind]) : Genera un gráfico de Estimación de Densidad Kernel usando kernels gaussianos.
.plot.line([x, y]) : Grafica Series o DataFrame como líneas.
.plot.pie(kwargs) : Genera un gráfico de tarta.
.plot.scatter(x, y[, s, c]) : Crea un gráfico de dispersión con tamaño y color de marcador variable.
.boxplot([column, by, ax, ...]) : Crea un diagrama de caja de las columnas del DataFrame.
.hist([column, by, grid, ...]) : Crea un histograma de las columnas del DataFrame.

Sparse accessor

Métodos específicos y atributos de dtype sparse se proporcionan bajo el accesor DataFrame.sparse.

.sparse.density: Razón de puntos no dispersos a puntos de datos totales (densos).
.sparse.from_spmatrix(data[, ...]) : Crea un nuevo DataFrame a partir de una matriz dispersa de scipy.
.sparse.to_coo() : Devuelve el contenido del marco como una matriz COO dispersa de SciPy.
.sparse.to_dense() : Convierte un DataFrame con valores dispersos a denso.

Serialización / IO / Conversión

.from_dict(data[, orient, dtype, ...]) : Construye DataFrame a partir de un diccionario de elementos tipo array o diccionarios.
.from_records(data[, index, ...]) : Convierte ndarray estructurado o de registros a DataFrame.
.to_orc([path, engine, index, ...]) : Escribe un DataFrame en formato ORC.
.to_parquet([path, engine, ...]) : Escribe un DataFrame al formato binario parquet.
.to_pickle(path, *[, compression, ...]) : Serializa (pickle) el objeto a archivo.
.to_csv([path_or_buf, sep, na_rep, ...]) : Escribe el objeto a un archivo de valores separados por comas (csv).
.to_hdf(path_or_buf, *, key[, ...]) : Escribe los datos contenidos en un archivo HDF5 usando HDFStore.
.to_sql(name, con, *[, schema, ...]) : Escribe registros almacenados en un DataFrame a una base de datos SQL.
.to_dict([orient, into, index]) : Convierte el DataFrame a un diccionario.
.to_excel(excel_writer, *[, ...]) : Escribe el objeto a una hoja de Excel.
.to_json([path_or_buf, orient, ...]) : Convierte el objeto a una cadena JSON.
.to_html([buf, columns, col_space, ...]) : Renderiza un DataFrame como una tabla HTML.
.to_feather(path, kwargs) : Escribe un DataFrame al formato binario Feather.
.to_latex([buf, columns, header, ...]) : Renderiza el objeto a una tabulación LaTeX, longtable o tabla anidada.
.to_stata(path, *[, convert_dates, ...]) : Exporta el objeto DataFrame al formato dta de Stata.
.to_gbq(destination_table, *[, ...]) : (DEPRECATED) Escribe un DataFrame en una tabla de Google BigQuery.
.to_records([index, column_dtypes, ...]) : Convierte DataFrame a un arreglo de registros NumPy.
.to_string([buf, columns, ...]) : Renderiza un DataFrame a una salida tabular amigable para la consola.
.to_clipboard(*[, excel, sep]) : Copia el objeto al portapapeles del sistema.
.to_markdown([buf, mode, index, ...]) : Imprime DataFrame en formato amigable con Markdown.
.style: Devuelve un objeto Styler.
.\__dataframe\__([nan_as_null, ...]) : Devuelve el objeto de intercambio de dataframe que implementa el protocolo de intercambio.