Profils d'utilisateurs Twitter French Ambassador for Digital Affairs / Ambassadeur pour le numérique Mis à jour le 28 juin 2021Métadonnées :Bon (78 %) 3K7801Ce dataset permet d’entrainer l’algorithme qui détermine la probabilité qu’un compte soit un bot ou non (https\://github.com/ambanum/social-networks-bot-finder/) Liste des dataset fusionnés : Cresc…
Base Étendue, Améliorée et Unifiée des Annonces des Marchés Publics BeauAMPAdrien DeschampsMis à jour le 19 avr. 2026Métadonnées :Bon (100 %) 10K6K03Initialement publiées en 2024 (pour la période 2015-2023), ces données ont été adaptées en 2025 au format eForms (entré en vigueur début 2024 en France). Cette mise à jour a permis de rattraper le re…
Modèles de classification (et ses résultats) entrainés sur certains ressources CSV de data.gouv.fr Pavel SorianoMis à jour le 24 juin 2020Métadonnées :Bon (78 %) 6K49700Contexte Data.gouv.fr (DGF) contient des milliers de ressources de type CSV. Déterminer à la main quels sont les ressources qui pourront être utiles pour faire des explications/tutoriels en Machine …
Jeux de toxicité des mots WebCressonTech Mis à jour le 22 janv. 2025Métadonnées :Bon (89 %) 2K17600Voici un dictionnaire de mots toxiques permettant l'entraînement d'une potentielle machine Learning ou autres. C'est mots sont triés en Label "1" pour l'étiquetage des données. Vous pouvez en rajou…
Image microtomographiques de matériaux composites de type Glass Fiber Reinforced Poymer (GFRP) à plusieurs couches impactés (Machine Learning) RX_Impacted_GFRP_MLIRL 2958 Georgia Tech - CNRS Mis à jour le 10 mars 2026Métadonnées :Bon (89 %) 3325000Description globale: Ce jeu de données présente l'ensemble des images obtenues par tomographie aux rayons X de matériaux composites de type Glass Fiber Reinforced Polymer (GFRP) à 4 couches tissées.…