Analyse des relations entre étudiants et secteurs d'activité MF-ARSA
Description
Myfuture aide depuis 2015 les jeunes à s'orienter et a permis à des milliers de collégiens/lycéens/étudiants de réaliser des stages dans toute la France.
Les jeux de données anonymes qui suivent aident à comprendre l'intérêt pour des jeunes pour différents secteurs d'activité.
Principe général de la plateforme
Le principe général de la plateforme stagedecouverte.fr proposée par Myfuture consiste en créer des liens entre :
- des entreprises, d'une part
- des personnes (essentiellement des collégiens/lycéens/étudiants) souhaitant découvrir le monde professionnel ou bien un secteur d'activité, d'autre part
Cette mise en relation s'effectue de la façon suivante :
- une offre est publiée par un professionnel. Une offre est située à une adresse donnée et a un ou plusieurs sous-domaines liés. Le professionnel peut indiquer quel public il recherche, quelles sont ses disponibilités (...)
- un étudiant s'inscrit et indique qu'il recherche des offres à une adresse donnée et qu'il est intéressé par des secteurs d'activité donnés
- l'étudiant verra apparaître l'offre et pourra marquer son intérêt (statut liked) ou non (statut disliked)
- l'étudiant, s'il le souhaite, peut aussi postuler à l'offre
- le professionnel recevra la candidature, pourra échanger avec l'étudiant pour comprendre son projet et ses motivations, et pourra confirmer la candidature s'il le souhaite
Présentation du fichier "aggregationdepartementdomaine.csv"
=> Présentation des colonnes
- les colonnes sousDomaine et domaine correspondent à la nomenclature "IDÉO-NOMENCLATURE ONISEP DOMAINES ET SOUS DOMAINES" disponible ici http://opendata.onisep.fr/data/5fa58d750a60c/2-ideo-nomenclature-onisep-domaines-et-sous-domaines.htm. Elle sont simplement "slugifiées" pour en faire des "clefs" plus robustes
- la colonne departement correspond au département où se situe l'offre de stage
- la colonne nbOffres correspond au nombre d'offres sur le département et correspondant au sous-domaine en question. ATTENTION, il n'est pas possible sur ce fichier de sommer la colonne nbOffres pour arriver au nombre d'offres total sur la plateforme (plus de 15 000). En effet, certaines offres ayant plusieurs sous-domaines renseignés, elles apparaissent dans plusieurs "lignes" et sont donc comptées plusieurs fois si on somme la colonne nbOffres
- la colonne nbElevesAyantInteragi correspond au nombre d'élèves ayant intéragi avec les offres en question (celles de nbOffres) (en la "likant" ou bien en la "dislikant")
- la colonne nbElevesInteresses correspond au nombre d'élèves ayant "liké"
- la colonne nbCandidatures correspond au nombre de candidatures
- la colonne nbConfirmes correspond au nombre de candidatures ayant été validées par le professionnel correspondant
Présentation du fichier "rawexportutilisateurdomainestatut.csv"
Il s'agit d'un fichier brut de toutes les intéractions ayant eu lieu sur la plateforme. Ce fichier peut permettre d'analyser des comportements utilisateur (en préservant leur anonymat évidemment).
Il ne contient pas les dates d'interaction, son focus est véritablement sur ce avec quoi les étudiants ont intéragi, dans un département donné.
A noter, certains étudiants auraient peut-être interagi avec d'autres offres, dans d'autres secteurs d'activité, si elles avaient été disponibles dans leur région.
=> Présentation des colonnes
- la colonne idUtilisateur correspond à l'id d'un étudiant donné
- la colonne departement correspond au département de l'étudiant
- la colonne genre correspond au genre renseigné (cette colonne peut parfois être vide ou "unknown" en fonction de ce qu'a voulu renseigner l'utilisateur (à sa discrétion))
- la colonne idOffre correspond à l'id d'une offre sur la plateforme
- la colonne domaines correspond aux domaines (séparés par des virgules et slugifiés comme indiqué plus haut pour le fichier aggregationdepartementdomaine.csv)
- la colonne statut correspond au statut de l'intéraction (les statuts principaux correspondent au scénario évoqué plus haut : liked, disliked, sent, confirmed)
Producteur
Dernière mise à jour
27 août 2021
Licence
Licence Ouverte / Open Licence
Qualité des métadonnées :
Description des données renseignée
Documentation des fichiers manquante
Licence renseignée
Fréquence de mise à jour respectée
Formats de fichiers standards
Couverture temporelle renseignée
Couverture spatiale renseignée
Tous les fichiers sont disponibles
Qualité des métadonnées
Documentation des fichiers manquante
Il n'y a pas encore de réutilisation pour ce jeu de données.
Il n'y a pas encore de discussion pour ce jeu de données.
Il n'y a pas encore de ressources communautaires pour ce jeu de données.
Informations
Mots-clés
Licence
ID
6128ad76f6a8d721446c4a72
Temporalité
Création
27 août 2021
Fréquence
Ponctuelle
Couverture temporelle
09/2016 à 08/2021
Dernière mise à jour
27 août 2021
Couverture spatiale
Couverture territoriale
France
Granularité de la couverture territoriale
Département français
Actions
Intégrer sur votre site
Statistiques des 12 derniers mois
Visites
898
Téléchargements
6
Réutilisations de ce jeu de données
0
Abonnés
0