From 222f889240f73882f0cde91abce4cac8dc4a35ea Mon Sep 17 00:00:00 2001
From: Aurelien PINTRAND <Aurelien.PINTRAND@etu.uca.fr>
Date: Fri, 9 Feb 2024 13:34:29 +0100
Subject: [PATCH] script

---
 getRatingsActeur.py | 47 +++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 47 insertions(+)
 create mode 100644 getRatingsActeur.py

diff --git a/getRatingsActeur.py b/getRatingsActeur.py
new file mode 100644
index 0000000..9d91e37
--- /dev/null
+++ b/getRatingsActeur.py
@@ -0,0 +1,47 @@
+import numpy as np 
+import pandas as pd 
+import matplotlib as plt 
+
+# # filter by actor / actress 
+# df = pd.read_csv("title.principals.tsv", sep="\t")
+# actors = df.loc[(df.category == 'actor') | (df.category =='actress')]
+# actors.to_csv("actors.tsv", sep="\t", index=False) # outputs actors.tsv
+
+# # merges actors and movies to have each actor that played in a movie
+# actors = pd.read_csv("actors.tsv", sep="\t")
+# ratings = pd.read_csv("title.ratings.tsv", sep="\t")
+# names = pd.read_csv("name.basics.tsv", sep="\t")
+# actorsRatings = actors.merge(ratings, left_on="tconst", right_on="tconst", how="inner")
+# actorsRatings.to_csv("actorsRatings.tsv", sep="\t", index=False) # outputs actorsRatings.tsv
+
+actorsRatings = pd.read_csv("actorsRatings.tsv", sep="\t")
+grouped = actorsRatings.groupby("nconst").agg({"averageRating": ["mean", "count"]})
+# Aplatir l'index des colonnes et renommer
+grouped.columns = ['averageRatingMean', 'averageRatingCount']  # Aplatir et renommer les colonnes
+
+# Réinitialiser l'index pour inclure 'nconst' comme une colonne régulière
+grouped.reset_index(inplace=True)
+
+# Enregistrer dans un fichier CSV avec les noms de colonnes personnalisés
+grouped.to_csv("actorsRatingsGrouped.tsv", index=False, sep="\t")
+
+# actorNames = names[['nconst','primaryName']]
+# groupedWithActorNames = grouped.merge(actorNames, left_on="nconst", right_on="nconst", how="inner")
+# groupedWithActorNames.to_csv("actorsRatingsGroupedWithName.tsv", index=True, sep="\t")
+
+# # Chargement des données
+# actorsRatings = pd.read_csv("actorsRatings.tsv", sep="\t")
+# actorsRatingsGrouped = pd.read_csv("actorsRatingsGrouped.tsv", sep="\t")
+
+# # Joindre les deux DataFrames sur 'nconst' pour associer chaque 'tconst' avec les 'averageRating'
+# # Note : Assurez-vous que 'nconst' est présent dans les deux DataFrames comme clé de jointure
+# merged = pd.merge(actorsRatings[['tconst', 'nconst']], actorsRatingsGrouped[['nconst', 'averageRating']], on='nconst')
+
+# # Grouper par 'tconst' et agréger 'averageRating' dans une liste pour chaque 'tconst'
+# grouped = merged.groupby('tconst')['averageRating'].apply(list).reset_index()
+
+# # Convertir le DataFrame agrégé en un dictionnaire
+# allActorRatingsMovies = pd.Series(grouped.averageRating.values,index=grouped.tconst).to_dict()
+
+# actorsRatingsPerMovie = pd.DataFrame(list(allActorRatingsMovies.items()), columns=['tconst', 'ratings'])
+# actorsRatingsPerMovie.to_csv("actorsRatingsPerMovie.tsv", index=False, sep="\t")
\ No newline at end of file