¡Esta es una revisión vieja del documento!
Guía 7
<file python Data_Frame_Pandas_-_Guía_de_Ejercicios_Nº_7.docx.py> # -*- coding: utf-8 -*- “”“Ejercicios_semana_8_pandas.ipynb
Automatically generated by Colab.
Original file is located at
https://colab.research.google.com/drive/1onufzB7CnauWQFHuMMrDQxXkevqCGeAj
”“”
import pandas as pd
peliculas = {'nombre': ['Titanic', 'Kil Bill', 'Matrix', 'El padrino', 'Avatar',
'Casablanca', 'El exorcista', 'Soy leyenda', 'El club de la pelea', 'Mujercitas'], 'director': ['James Cameron', 'Quentin Tarantino', 'Hermanas Wachowski', 'Francis Ford Coppola', 'James Cameron', 'Michael Curtiz', 'William Friedkin', 'Francis Lawrence','David Fincher', 'Greta Gerwig'], 'año': [1997, 2003, 1999, 1972, 2009, 1942, 1973, 2007, 1999, 2019], 'género': ['romance', 'acción', 'ciencia ficción', 'drama', 'ciencia ficción', 'drama', 'terror', 'ciencia ficción', 'drama', 'drama'], 'puntaje': [8.6, None, 6.9, 7.5, 9.1, 6.0, None, None, 9.4, 8.0]}
df = pd.DataFrame(peliculas) df
df.iloc[3:]
df.info()
df.describe()
# Mostrar la información del DataFrame con el método info(), ¿Cómo se llaman y qué tipo de dato tiene cada columna? ¿Cuántos elementos nulos hay en cada columna? Interpretar qué información se guarda en esta tabla y para qué puede servir.
# Mostrar sólo los nombres de las primeras 3 películas del DataFrame.
# Mostrar sólo el director y el género de todas las películas.
# Mostrar las películas que sean de drama
# ¿Qué cantidad de películas hay de cada género?
# Mostrar las películas que tengan puntaje entre 6 y 8 y cuyo año de estreno sea anterior a los 2000
# Mostrar las películas que no hayan sido puntuadas (que el puntaje tenga un valor nulo).
# Calcular el promedio del puntaje de todas las películas.
# Ordenar las películas en orden alfabético descendente.
# Mostrar las 3 películas más antiguas.
# Mostrar sólo el nombre y el año de las 3 películas más nuevas.
# Agregar una columna que indique si la película fue vista, o no. Una película fue vista cuando tiene puntaje no nulo
<\file>