Visualisations des traces des étudiant·e·s de UP13
Application
Published on May 6, 2017 by Pierre Boudes (old)

This is a degraded experience of data.gouv.fr. Please enable JavaScript and use an up to date browser.
Il s'agit d'un jeu de données mis à jour annuellement la description ci-dessous concerne la première année de mise en ligne, depuis des mises à jour ont eu lieu en 2018 (données 2008-2017) et en 2019 (données 2009-2018).
L'université Paris 13 a enregistré dans son système d'information (logiciel Apogée), des données sur l'inscription des étudiant·e·s pour chaque année universitaire entre 2006(-2007) et 2015(-2016). Ces données portent sur les diplômes préparés, les étapes pour y parvenir, le régime (s'il s'agit de formation initiale ou d'apprentissage), les composantes concernées (UFR, IUT, etc.), et l'origine des étudiant·e·s (type de Bac, académie d'origine, nationalité). Chaque entrée concerne l'inscription principale d'un·e étudiant·e à l'université pour une année. Les attributs de ces données sont les suivants.
L'université Paris 13 rend publique une partie de ce jeu de données à travers plusieurs ressources, dans le respect de l'anonymat de ses étudiant·es.
Partant de 213 289 entrées qui correspondent à toutes les inscriptions des 106 088 individus ayant étudié à l'université Paris 13 au cours des dix années universitaires entre 2006(-2007) et 2015(-2016), nous avons sélectionné plusieurs ressources correspondant chacune à une partie des données. Pour produire chaque ressource nous avons choisi un petit nombre d'attributs, puis nous avons supprimé une petite proportion des entrées, de façon à satisfaire une contrainte de k-anonymisation avec k = 5, c'est à dire de faire en sorte que, dans chaque ressource, chaque entrée apparait au moins 5 fois à l'identique (autrement l'entrée est supprimée). Les quatre ressources produites sont matérialisés par les fichiers suivants.
Le fichier up13_etapes.csv
concerne les étapes de diplôme, il contient les attributs "CODE_ETAPE", "LIBELLE_COURT_ETAPE", "LIBELLE_LONG_ETAPE", "NIVEAU_APRES_BAC", "LIBELLE_COURT_COMPOSANTE", "LIB_DIPLOME", "LIBELLE_DISCIPLINE_DIPLOME", "CODE_SISE_DIPLOME", "NIVEAU_DANS_LE_DIPLOME" et son anonymisation occasionne une perte de 918 entrées.
Le fichier up13_Academie.csv
concerne l'académie du Bac et il contient les attributs "LIBELLE_ACADEMIE_BAC", "NIVEAU_APRES_BAC", "NIVEAU_DANS_LE_DIPLOME", "CONTINENT", "LIBELLE_REGIME", "LIB_DIPLOME", "LIBELLE_COURT_COMPOSANTE" et son anoymisation occasionne la perte de 7525 entrées.
Le fichier up13_Bac.csv
concerne le type de Bac et le niveau atteint après le Bac, il contient les colonnes "REGROUPEMENT_BAC", "NIVEAU_APRES_BAC", "LIBELLE_REGIME", "CONTINENT", "LIBELLE_COURT_COMPOSANTE", "LIB_DIPLOME", "NIVEAU_DANS_LE_DIPLOME" et son anonymisation occasionne la perte de 3 933 entrées.
Le fichier up13_annees_etapes.csv
concerne le inscriptions dans les étapes de diplôme année après année, il contient les colonnes "ANNEE_INSCRIPTION", "LIBELLE_COURT_COMPOSANTE", "NIVEAU_APRES_BAC", "LIB_DIPLOME", "CODE_ETAPE" et son anonymisation occasionne la perte de 3 532 entrées.
D'autres tableaux extraits de la même donnée initiale et construits selon la même méthode d'anonymisation, peuvent être fourni sur demande (préciser les colonnes souhaitées).
Un second ensemble de ressources propose le suivi des étudiant·es année après année, d'étape de diplôme en étape de diplôme. Dans ce jeu de données, nous appelons trace un tel suivi lorsque l'année d'inscription a été oubliée et que seule subsiste la séquence. Et nous appelons cursus une donnée décrivant cette succession d'étapes au fil des années. Pour l'anonymisation nous avons regroupé les traces ou les parcours identiques et dès lors qu'il y en avait moins de 10 nous n'indiquons pas leur nombre, ou, ce qui revient au même, nous mettons ce nombre à 1 (l'information étant qu'il y a au moins un·e étudiant·e ayant laissé cette trace ou suivi ce cursus). Cela conduit à oublier un certain nombre de parcours d'étude trop spécifiques et à n'en conserver qu'un seul comme témoin.
Partant de 106 088 parcours ou traces, nous produisons les ressources suivantes.
Le fichier up13_traces.csv
contient la séquence des code d'étapes de diplôme (une trace) et l'anonymisation nous fait oublier 10 089 traces.
Le fichier up13_traces_wt_etape.csv
contient des traces similaires, mais sans le code étape. C'est à dire que seul subsistent le diplôme, le niveau après bac et la composante concernée. L'anonymisation nous fait oublier 4 447 traces.
Le fichier up13_traces_bac_wt_etape.csv
contient les mêmes données que dans le fichier up13_traces_wt_etape.csv
mais avec le type de Bac en plus. L'anonymisation nous fait oublier 8 067 traces.
Le fichier up13_cursus_wt_etape.csv
contient les mêmes données que dans le fichier up13_traces_wt_etape.csv
avec les années d'inscription en plus. L'anonymisation nous fait oublier 8 324 cursus.
September 3, 2019
Licence Ouverte / Open Licence
Data description filled
Resources documented
License filled
Update frequency not followed
File formats are open
Temporal coverage not set
Spatial coverage not set
Update frequency not followed
Temporal coverage not set
Spatial coverage not set
Application
Published on May 6, 2017 by Pierre Boudes (old)
There is no discussions for this dataset yet.
There is no community resources for this dataset yet.
58e34f7dc751df5d2777388c
April 4, 2017
Annual
September 3, 2019