Analyse des relations entre étudiants et secteurs d'activité MF-ARSA
Description
Myfuture aide depuis 2015 les jeunes à s'orienter et a permis à des milliers de collégiens/lycéens/étudiants de réaliser des stages dans toute la France.
Les jeux de données anonymes qui suivent aident à comprendre l'intérêt pour des jeunes pour différents secteurs d'activité.
Principe général de la plateforme
Le principe général de la plateforme stagedecouverte.fr proposée par Myfuture consiste en créer des liens entre :
- des entreprises, d'une part
- des personnes (essentiellement des collégiens/lycéens/étudiants) souhaitant découvrir le monde professionnel ou bien un secteur d'activité, d'autre part
Cette mise en relation s'effectue de la façon suivante :
- une offre est publiée par un professionnel. Une offre est située à une adresse donnée et a un ou plusieurs sous-domaines liés. Le professionnel peut indiquer quel public il recherche, quelles sont ses disponibilités (...)
- un étudiant s'inscrit et indique qu'il recherche des offres à une adresse donnée et qu'il est intéressé par des secteurs d'activité donnés
- l'étudiant verra apparaître l'offre et pourra marquer son intérêt (statut liked) ou non (statut disliked)
- l'étudiant, s'il le souhaite, peut aussi postuler à l'offre
- le professionnel recevra la candidature, pourra échanger avec l'étudiant pour comprendre son projet et ses motivations, et pourra confirmer la candidature s'il le souhaite
Présentation du fichier "aggregationdepartementdomaine.csv"
=> Présentation des colonnes
- les colonnes sousDomaine et domaine correspondent à la nomenclature "IDÉO-NOMENCLATURE ONISEP DOMAINES ET SOUS DOMAINES" disponible ici http://opendata.onisep.fr/data/5fa58d750a60c/2-ideo-nomenclature-onisep-domaines-et-sous-domaines.htm. Elle sont simplement "slugifiées" pour en faire des "clefs" plus robustes
- la colonne departement correspond au département où se situe l'offre de stage
- la colonne nbOffres correspond au nombre d'offres sur le département et correspondant au sous-domaine en question. ATTENTION, il n'est pas possible sur ce fichier de sommer la colonne nbOffres pour arriver au nombre d'offres total sur la plateforme (plus de 15 000). En effet, certaines offres ayant plusieurs sous-domaines renseignés, elles apparaissent dans plusieurs "lignes" et sont donc comptées plusieurs fois si on somme la colonne nbOffres
- la colonne nbElevesAyantInteragi correspond au nombre d'élèves ayant intéragi avec les offres en question (celles de nbOffres) (en la "likant" ou bien en la "dislikant")
- la colonne nbElevesInteresses correspond au nombre d'élèves ayant "liké"
- la colonne nbCandidatures correspond au nombre de candidatures
- la colonne nbConfirmes correspond au nombre de candidatures ayant été validées par le professionnel correspondant
Présentation du fichier "rawexportutilisateurdomainestatut.csv"
Il s'agit d'un fichier brut de toutes les intéractions ayant eu lieu sur la plateforme. Ce fichier peut permettre d'analyser des comportements utilisateur (en préservant leur anonymat évidemment).
Il ne contient pas les dates d'interaction, son focus est véritablement sur ce avec quoi les étudiants ont intéragi, dans un département donné.
A noter, certains étudiants auraient peut-être interagi avec d'autres offres, dans d'autres secteurs d'activité, si elles avaient été disponibles dans leur région.
=> Présentation des colonnes
- la colonne idUtilisateur correspond à l'id d'un étudiant donné
- la colonne departement correspond au département de l'étudiant
- la colonne genre correspond au genre renseigné (cette colonne peut parfois être vide ou "unknown" en fonction de ce qu'a voulu renseigner l'utilisateur (à sa discrétion))
- la colonne idOffre correspond à l'id d'une offre sur la plateforme
- la colonne domaines correspond aux domaines (séparés par des virgules et slugifiés comme indiqué plus haut pour le fichier aggregationdepartementdomaine.csv)
- la colonne statut correspond au statut de l'intéraction (les statuts principaux correspondent au scénario évoqué plus haut : liked, disliked, sent, confirmed)
Producer
Latest update
August 27, 2021
License
Licence Ouverte / Open Licence
Metadata quality:
Data description filled
Files documentation missing
License filled
Update frequency followed
File formats are open
Temporal coverage filled
Spatial coverage filled
All files are available
Metadata quality
Files documentation missing
There are no reuses for this dataset yet.
There are no discussions for this dataset yet.
There are no community resources for this dataset yet.
Information
Tags
License
ID
6128ad76f6a8d721446c4a72
Temporality
Creation
August 27, 2021
Frequency
Punctual
Temporal coverage
2016/09 to 2021/08
Latest update
August 27, 2021
Spatial coverage
Territorial coverage
France
Territorial coverage granularity
French county
Actions
Embed
Statistics for the year
Reuses of this dataset
0
Followers
0