dernier tp

1 year ago · b73d40fcc4
parent 36cffbfe04
commit b73d40fcc4
2 changed files with 921846 additions and 0 deletions
--- a/interface.py
+++ b/interface.py
@ -0,0 +1,105 @@
+import csv
+import os
+from typing import List
+import numpy as np
+import pandas as pd
+
+def levenshtein_distance(s1, s2):
+    if len(s1) < len(s2):
+        return levenshtein_distance(s2, s1)
+
+    if len(s2) == 0:
+        return len(s1)
+
+    previous_row = range(len(s2) + 1)
+    for i, c1 in enumerate(s1):
+        current_row = [i + 1]
+        for j, c2 in enumerate(s2):
+            insertions = previous_row[j + 1] + 1
+            deletions = current_row[j] + 1
+            substitutions = previous_row[j] + (c1 != c2)
+            current_row.append(min(insertions, deletions, substitutions))
+        previous_row = current_row
+
+    return previous_row[-1]
+
+def find_closest_actor_name(input_name, actor_names, actor_ids):
+    closest_name = None
+    closest_id = None
+    min_distance = float('inf')
+    for i in range(len(actor_names)):
+        actor_name = actor_names[i]
+        actor_id = actor_ids[i]
+        distance = levenshtein_distance(input_name, actor_name)
+        if distance < min_distance:
+            min_distance = distance
+            closest_name = actor_name
+            closest_id = actor_id
+    return (closest_name,closest_id)
+
+def getUniqueActorNames(filePath):
+    # Lire le fichier TSV
+    df = pd.read_csv(filePath, sep='\t')
+    actor_names = df['primaryName'].tolist()
+    actor_ids = df['nconst'].tolist()  # Supposer que la colonne s'appelle 'ActorName'
+  # Supposer que la colonne s'appelle 'ActorName'
+    return (actor_names,actor_ids)
+
+def saveUniqueActorsSorted(inputFilePath, outputFilePath):
+    # Lire le fichier TSV
+    df = pd.read_csv(inputFilePath, sep='\t')
+    
+    # Trier le DataFrame par 'primaryName' en ordre alphabétique
+    df_sorted = df.sort_values(by='primaryName')
+    
+    # Écrire les données triées dans le fichier CSV
+    with open(outputFilePath, mode='w', newline='', encoding='utf-8') as file:
+        writer = csv.writer(file, delimiter='\t')
+    
+        # Écrire l'en-tête
+        writer.writerow(['primaryName', 'nconst'])
+        
+        # Écrire chaque ligne du DataFrame trié dans le fichier CSV
+        for index, row in df_sorted.iterrows():
+            writer.writerow([row['primaryName'], row['nconst']])
+
+
+if __name__ == "__main__":
+    mustContinue = True
+    if not os.path.exists("processedData/uniqueActorNames.tsv"):
+        saveUniqueActorsSorted("processedData/actorsRatingsGroupedWithName.tsv", "processedData/uniqueActorNames.tsv")
+    tupleActors = getUniqueActorNames("processedData/uniqueActorNames.tsv")
+    selectedActorNames = []
+
+
+    print("Bienvenue dans MoviePrecog!")
+    while(mustContinue):
+        print("1: Ajouter un acteur à la liste (4 acteurs / actrices requis)")
+        print("2: Afficher la liste")
+        print("3: Vider la liste")
+        print("4: Lancer la prévision")
+        print("5: Quitter")
+        userChoice = input("Votre choix: ")
+        if(userChoice == "1"):
+            actorName = input("Quel acteur voulez-vous chercher ? ")
+            actorFound = find_closest_actor_name(actorName, tupleActors[0], tupleActors[1])
+            print("L'acteur/actrice trouvé est: " + actorFound)
+            sublevelMustContinue = True
+            leave = False
+            correctActorChoice = input("Est-ce le bon acteur/actrice ? (o = oui, n = non)")
+            if(correctActorChoice == "n"):
+                while(sublevelMustContinue):
+                    leave = input("Sortir ou relancer ? (sortir = s, relancer = r)")
+                    if(leave == "r"):
+                        actorName = input("Quel acteur voulez-vous chercher ? ")
+                        actorFound = find_closest_actor_name(actorName, tupleActors[0], tupleActors[1])
+                        print("L'acteur/actrice trouvé est: " + actorFound)
+                        sublevelMustContinue = True
+                        correctActorChoice = input("Est-ce le bon acteur/actrice ? (o = oui, n = non)")
+                        if(correctActorChoice == o):
+                            sublevelMustContinue = False
+                    else if(leave != "r" or (leave != "s" and leave ))
+
+
+            
+print(find_closest_actor_name("Robert downey jr",tupleActors[0],tupleActors[1]))
--- a/processedData/uniqueActorNames.tsv
+++ b/processedData/uniqueActorNames.tsv