Classement thématique des sujets de journaux télévisés (janvier 2000 - décembre 2020)
14K
5K
22
3

🧠 Introduction — Évaluer la proximité éditoriale des chaînes TV par les thèmes traités
Dans ce projet, l’objectif est d’analyser la proximité éditoriale entre les journaux télévisés des principales chaînes françaises, à partir des thèmes qu’elles abordent dans leurs contenus, sur la période Janvier 2000 à Décembre 2020.
🎯 Problématique :
Il ne s’agit pas simplement de compter combien de fois un thème est abordé par une chaîne, mais de comprendre les affinités éditoriales entre chaînes, et de déterminer quelles chaînes sont les plus pertinentes pour traiter un thème donné.
🧭 Démarche mise en œuvre :
Exploration des données
Visualisation de la répartition des thèmes et des volumes de diffusion par chaîne pour construire une première intuition.
Analyse non supervisée (KMeans, PCA)
Construction de clustering des chaînes, et projection dans l’espace éditorial pour observer les proximités naturelles.
Moteur de recommandation
Utilisation de la similarité cosinus pour proposer les chaînes les plus pertinentes à partir d’un thème donné.
Extension NLP
Intégration d’un module de classification automatique d’un prompt utilisateur vers un thème du dataset, afin de créer un assistant intelligent capable de recommander des chaînes à partir d’une requête libre.
Vues
14K
5K
22
3
Il n'y a pas encore d'API associées