Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
indice:uba:ingenieria:uba-xxi:pensamiento-computacional:guias-y-resueltos:guia-7 [2025/06/05 05:21] – upadmin | indice:uba:ingenieria:uba-xxi:pensamiento-computacional:guias-y-resueltos:guia-7 [2025/06/06 04:52] (actual) – upadmin | ||
---|---|---|---|
Línea 3: | Línea 3: | ||
* {{ : | * {{ : | ||
- | <file python Data_Frame_Pandas_-_Guía_de_Ejercicios_Nº_7.py> | + | |
- | # -*- coding: utf-8 -*- | + | |
- | """ | + | |
- | Automatically generated by Colab. | + | ===== Resueltos ===== |
- | Original | + | <file python resueltos_guia_7.py> |
- | https:// | + | # Datos y Creacion del Data Frame |
- | """ | + | |
import pandas as pd | import pandas as pd | ||
+ | print(pd.__version__) #version de pandas que se esta usando | ||
peliculas = {' | peliculas = {' | ||
Línea 27: | Línea 25: | ||
' | ' | ||
- | df = pd.DataFrame(peliculas) | + | df = pd.DataFrame(peliculas) |
- | df | + | |
- | df.iloc[3:] | + | #Algunas Funciones de Pandas |
+ | """ | ||
+ | print(df) #Imprime Data Frame | ||
+ | df.info() #da informacion sobre el Data Frame | ||
+ | print(df.describe()) #Algunas medidas como cual es el valor maximo, el minimo, los percentiles, | ||
+ | print(df.head(3)) #imprime 3 primeras filas del Data Frame (0;1;2) | ||
+ | print(df.iloc[3:5]) #imprime filas 3 y 4 del Data Frame (se cuenta desde 0 con lo cual estrictamente son la cuarta y quinta fila) | ||
+ | print(df.loc[3: | ||
+ | print(df.loc[df.index[[3, | ||
+ | print(df[df[" | ||
+ | print(df[df[" | ||
+ | print(df[(df[" | ||
+ | print(df[(df[" | ||
+ | print(df[(df[" | ||
+ | print(df[df[" | ||
+ | df.loc[4," | ||
+ | print(df) | ||
+ | print(df[" | ||
+ | print(df.groupby(" | ||
+ | df.loc[10] = ["El silencio de los inocentes", | ||
+ | print(df) | ||
+ | df = df.drop(10) #borra una fila, en este caso la 10 | ||
+ | print(df) | ||
+ | print(df[" | ||
+ | df=df.sort_values(by=[" | ||
+ | print(df) | ||
+ | df[" | ||
+ | print(df) | ||
+ | df[" | ||
+ | print(df) | ||
+ | """ | ||
+ | # 1) Mostrar la información del DataFrame con el método info(), ¿Cómo se llaman y qué tipo de dato tiene cada columna? ¿Cuántos elementos nulos hay en cada columna? Interpretar qué información se guarda en esta tabla y para qué puede servir. | ||
df.info() | df.info() | ||
+ | print() | ||
+ | """ | ||
+ | En la columna puntaje hay 3 nulos. En el resto no hay nulos. | ||
+ | Se guarda la cantidad de columnas, el nombre de las columnas, la cantidad de filas, la cantidad de datos no nulos en cada columna y los tipos de objetos que hay en cada columna. | ||
+ | """ | ||
- | df.describe() | + | # 2) Mostrar sólo los nombres de las primeras 3 películas del DataFrame. |
- | # Mostrar la información del DataFrame con el método info(), ¿Cómo se llaman y qué tipo de dato tiene cada columna? ¿Cuántos elementos nulos hay en cada columna? Interpretar qué información se guarda en esta tabla y para qué puede servir. | + | print(df.loc[0: |
+ | print() | ||
+ | """ | ||
+ | print(df.head(3)[" | ||
+ | print() | ||
+ | # 3) Mostrar sólo el director y el género de todas las películas. | ||
+ | print(df.loc[:, | ||
+ | print() | ||
- | # Mostrar | + | # 4) Mostrar las películas |
- | # Mostrar sólo el director y el género | + | print(df[df[" |
+ | print() | ||
- | # Mostrar las películas | + | # 5) ¿Qué cantidad de películas |
- | # ¿Qué cantidad de películas hay de cada género? | + | print(df[" |
+ | print() | ||
- | # Mostrar las películas que tengan puntaje entre 6 y 8 y cuyo año de estreno sea anterior a los 2000 | + | # 6) Mostrar las películas que tengan puntaje entre 6 y 8 y cuyo año de estreno sea anterior a los 2000. |
- | # Mostrar las películas que no hayan sido puntuadas | + | print(df[(df[" |
+ | print() | ||
- | # Calcular el promedio del puntaje de todas las películas. | + | # 7) Mostrar |
- | # Ordenar las películas en orden alfabético descendente. | + | print(df[df[" |
+ | print() | ||
- | # Mostrar | + | # 8) Calcular el promedio del puntaje de todas las películas. |
- | # Mostrar sólo el nombre y el año de las 3 películas más nuevas. | + | print(df[" |
+ | print() | ||
- | # Agregar una columna que indique si la película fue vista, o no. Una película fue vista cuando tiene puntaje no nulo | + | # 9) Ordenar las películas en orden alfabético descendente. |
+ | print(df.sort_values(by=[" | ||
+ | print() | ||
- | </ | + | # 10) Mostrar las 3 películas más antiguas. |
+ | df_ordenada_por_año=df.sort_values(by=[" | ||
+ | print(df_ordenada_por_año.head(3)) | ||
+ | print() | ||
- | ===== Resueltos ===== | + | # 11) Mostrar sólo el nombre y el año de las 3 películas más nuevas. |
+ | df_ordenada_por_año_mas_nuevo=df.sort_values(by=[" | ||
+ | print(df_ordenada_por_año_mas_nuevo.iloc[: | ||
+ | print() | ||
+ | |||
+ | # 12) Agregar una columna que indique si la película fue vista, o no. Una película fue vista cuando tiene puntaje no nulo | ||
+ | |||
+ | df[" | ||
+ | print(df) | ||
+ | </ |