calculsIA fournis un modele de regression qui fonctionne, il faut appeler clf.predict() avec une liste de 4 acteurs et ça marche

1 year ago · 67e38077e9
parent 36cffbfe04
commit 67e38077e9
3 changed files with 908199 additions and 2 deletions
--- a/calculsIA.py
+++ b/calculsIA.py
@ -0,0 +1,42 @@
 import pandas as pd
 import numpy as np
 import matplotlib.pyplot as plt
 import sklearn as sk
 #dfRatingsTropGrand = pd.read_csv("processedData/actorsRatingsPerMovie.tsv",sep='\t')
 #tconst	ratings	actorNames	averageRatingMovie
 #dfRatings = dfRatingsTropGrand[dfRatingsTropGrand['ratings'].apply(lambda x: len(eval(x)) >= 4)]
 #dfRatings.to_csv("processedData/actorsRatingsPerMovieGoodToUse.tsv", index=False, sep="\t")
 dfRatings = pd.read_csv("processedData/actorsRatingsPerMovieGoodToUse.tsv", sep="\t")
 #listMovies = dfRatings.head(1000)['tconst'].values
 listMovies = dfRatings['tconst'].values
 listRatingsA = []
 listRatingsM = []
 datas = []
 nbDiese = 0
 for i in range(len(listMovies)):
 	print(i/len(listMovies)*100,"%", end="\r")
 	film = listMovies[i]
 	bob = (dfRatings.averageRatingMovie.loc[dfRatings.tconst == film].values[0],eval(dfRatings.ratings.loc[dfRatings.tconst == film].values[0]))
 	listRatingsA.append(bob[1][:4])
 	listRatingsM.append(bob[0])
 print("")
 from sklearn.model_selection import train_test_split
 x=listRatingsA
 y=listRatingsM
 xtrain, xtest, ytrain, ytest = train_test_split(x,y,test_size=0.3)
 xtrain = np.array(xtrain)
 from sklearn.linear_model import LinearRegression
 lnrg = LinearRegression()
 #clf = lnrg.fit(xtrain,ytrain)
 clf = lnrg.fit(x,y)
--- a/getRatingsActeur.py
+++ b/getRatingsActeur.py
@ -93,10 +93,14 @@ def data_manipulation(DataIsLoaded = None):
        'actorNames': grouped['primaryName'],
        'averageRatingMovie': grouped['averageRating']  # Ajoute 'averageRating' comme 'averageRatingMovie'
    })
-
+    
    actorsRatingsPerMovie.to_csv("processedData/actorsRatingsPerMovie.tsv", index=False, sep="\t")
-    
+
    moviesWhereNbActorsAtLeastFour = actorsRatingsPerMovie[actorsRatingsPerMovie['ratings'].apply(lambda x: len(eval(x)) >= 4)]
    moviesWhereNbActorsAtLeastFour.to_csv("processedData/actorsRatingsPerMovieGoodToUse.tsv", index=False, sep="\t")
    # actorsRatingsPerMovie = pd.DataFrame(list(allActorRatingsMovies.items()), columns=['tconst', 'ratings'])
    # actorsRatingsPerMovie.to_csv("actorsRatingsPerMovie.tsv", index=False, sep="\t")
--- a/processedData/actorsRatingsPerMovieGoodToUse.tsv
+++ b/processedData/actorsRatingsPerMovieGoodToUse.tsv