LeSpot

Description

LeSpot est une application parisienne conçue pour aider les habitants et les visiteurs à découvrir des activités gratuites dans les 20 arrondissements de la capitale. Portée par une équipe d'étudiants Internationaux passionnés par Paris, la plateforme recense plus de 1 500 événements et lieux culturels accessibles à tous, avec l'ambition de rendre Paris plus accessible, plus vivante et plus connectée.

  ---

Fichiers mis à disposition

  Le jeu de données est composé de trois fichiers :

  - data/activities.json — 409 spots et activités parisiens soigneusement sélectionnés (parcs, musées, salles de concert, marchés, espaces sportifs, etc.)

  - data/paris_locations.json — 542 lieux nommés de Paris avec leurs coordonnées géographiques et arrondissement

  - data/paris_events.json — 1 337 événements publics parisiens issus de sources de données ouvertes

  ---

Format des fichiers

Les trois fichiers sont au format JSON, structurés comme des tableaux d'objets. Chaque entrée du fichier activities.json contient des champs riches : nom, description, catégorie, coordonnées GPS, arrondissement, horaires d'ouverture, ambiances (vibe), contexte social (solo, couple, groupe), humeurs attendues (outcome_moods), accessibilité, budget étudiant, et bien d'autres. Les événements (paris_events.json) incluent titre, description, dates, adresse, coordonnées, catégorie, accessibilité PMR et tags sémantiques.

  ---

Fréquence de mise à jour

Les événements sont actualisés chaque semaine par l'équipe LeSpot, notamment les mardis. Les spots et lieux sont mis à jour de façon continue au fil des ajouts et vérifications de l'équipe éditoriale.

  ---

Motivations pour la création du jeu de données

Ce jeu de données est né du constat que les données sur les activités gratuites à Paris sont éparpillées, incomplètes ou enfouies derrière des interfaces peu accessibles. L'objectif est double : d'une part alimenter l'application LeSpot avec des données structurées et enrichies sémantiquement, d'autre part partager ces données en open data pour permettre à d'autres développeurs, chercheurs et créateurs de construire des outils au service de la culture parisienne.

  ---

Composition du jeu de données

Le jeu de données couvre l'ensemble des 20 arrondissements de Paris. Il réunit des lieux permanents (jardins, musées, salles de sport en plein air, bibliothèques) et des événements ponctuels ou récurrents (concerts gratuits, expositions, projections, marchés). Chaque entrée est enrichie de métadonnées sémantiques produites ou vérifiées par l'équipe : tags d'ambiance, contexte social, niveau d'affluence, compatibilité météo, accessibilité linguistique.

  ---

Processus de collecte des données

Les données proviennent de trois sources principales :

  1. Curation manuelle par l'équipe LeSpot — des étudiants et habitants de Paris qui connaissent la ville et vérifient chaque spot sur le terrain ou par des sources fiables.

  2. Sources ouvertes de la Ville de Paris — notamment l'API Open Data de Paris (agenda culturel, équipements sportifs, espaces verts).

  3. Partenaires et agrégateurs — dont Eventbrite et des sources institutionnelles franciliennes pour les événements temporaires.

  ---

Pré-traitement des données

Les données brutes sont enrichies via un pipeline automatisé couplé à une vérification humaine. Chaque spot reçoit des tags sémantiques (ambiances, activités possibles, contexte social, humeurs) générés par modèle de langage puis validés. Les descriptions sont traduites en anglais lorsque nécessaire. Les images associées passent par un processus de validation automatique avant publication.

  ---

Diffusion du jeu de données

Le jeu de données est publié sur Hugging Face sous licence Creative Commons Attribution 4.0 (CC BY 4.0), permettant une réutilisation libre à condition de citer la source. Il est accessible publiquement à l'adresse : https://huggingface.co/datasets/LeSpot/lespot-paris-dataset.

  ---

Maintenance du jeu de données

La maintenance est assurée par l'équipe LeSpot. Les nouvelles entrées sont ajoutées au fil de la curation éditoriale, et les événements passés sont retirés ou archivés régulièrement. Les erreurs ou signalements peuvent être soumis via l'application ou le profil Hugging Face de l'organisation.

  ---

Considérations légales et éthiques

Le jeu de données ne contient aucune donnée personnelle : ni profil utilisateur, ni historique de navigation, ni données de géolocalisation individuelle. Toutes les informations publiées concernent des lieux et événements publics. Les données issues de partenaires ou de sources ouvertes sont utilisées dans le respect de leurs conditions d'utilisation respectives. L'équipe LeSpot s'engage à ne diffuser que des contenus vérifiés et à respecter la vie privée de toute personne pouvant apparaître dans les ressources associées.

Producteur
Clarence de Gheldere
Ce jeu de données a été publié à l'initiative et sous la responsabilité de Clarence de Gheldere.
Licence
License Not Specified
Dernière mise à jour
15 avril 2026

Vues

0

Téléchargements

0

  • Fréquence de mise à jour non respectée

  • Couverture temporelle non renseignée

Votre question porte sur autre chose que ce jeu de données ? Visiter notre forum

0 discussions

Il n'y a pas encore de discussion