Données de scolarité de l'université Paris 13
Description
Il s'agit d'un jeu de données mis à jour annuellement la description ci-dessous concerne la première année de mise en ligne, depuis des mises à jour ont eu lieu en 2018 (données 2008-2017) et en 2019 (données 2009-2018).
L'université Paris 13 a enregistré dans son système d'information (logiciel Apogée), des données sur l'inscription des étudiant·e·s pour chaque année universitaire entre 2006(-2007) et 2015(-2016). Ces données portent sur les diplômes préparés, les étapes pour y parvenir, le régime (s'il s'agit de formation initiale ou d'apprentissage), les composantes concernées (UFR, IUT, etc.), et l'origine des étudiant·e·s (type de Bac, académie d'origine, nationalité). Chaque entrée concerne l'inscription principale d'un·e étudiant·e à l'université pour une année. Les attributs de ces données sont les suivants.
- CODE_INDIVIDU Donnée masquée
- ANNEE_INSCRIPTION Année d'inscription : 2006 pour 2006-2007, etc.
- LIB_DIPLOME Nom du diplôme
- NIVEAU_DANS_LE_DIPLOME 1, 2,… pour master 1, licence 2, etc.
- NIVEAU_APRES_BAC 1, 2,… pour Bac+1, Bac+2,…
- LIBELLE_DISCIPLINE_DIPLOME Rattachement du diplôme à une discipline
- CODE_SISE_DIPLOME Code du système d’information sur le suivi de l’étudiant
- CODE_ETAPE Code interne d'une étape (année, parcours) de diplôme
- LIBELLE_COURT_ETAPE Nom court de l'étape
- LIBELLE_LONG_ETAPE Nom plus intelligible de l'étape
- LIBELLE_COURT_COMPOSANTE Nom de la composante (UFR, IUT etc.)
- CODE_COMPOSANTE Code numérique de la composante (inutilisé)
- REGROUPEMENT_BAC Type de Bac (L, ES, S, techno STMG, techno ST2S,…)
- LIBELLE_ACADEMIE_BAC Académie du Bac (Créteil, Versailles, étranger,…)
- CONTINENT Déduit de la nationalité qui est une donnée masquée
- LIBELLE_REGIME Formation initiale, continue, pro, apprentissage
L'université Paris 13 rend publique une partie de ce jeu de données à travers plusieurs ressources, dans le respect de l'anonymat de ses étudiant·es.
Partant de 213 289 entrées qui correspondent à toutes les inscriptions des 106 088 individus ayant étudié à l'université Paris 13 au cours des dix années universitaires entre 2006(-2007) et 2015(-2016), nous avons sélectionné plusieurs ressources correspondant chacune à une partie des données. Pour produire chaque ressource nous avons choisi un petit nombre d'attributs, puis nous avons supprimé une petite proportion des entrées, de façon à satisfaire une contrainte de k-anonymisation avec k = 5, c'est à dire de faire en sorte que, dans chaque ressource, chaque entrée apparait au moins 5 fois à l'identique (autrement l'entrée est supprimée). Les quatre ressources produites sont matérialisés par les fichiers suivants.
Le fichier
up13_etapes.csv
concerne les étapes de diplôme, il contient les attributs "CODE_ETAPE", "LIBELLE_COURT_ETAPE", "LIBELLE_LONG_ETAPE", "NIVEAU_APRES_BAC", "LIBELLE_COURT_COMPOSANTE", "LIB_DIPLOME", "LIBELLE_DISCIPLINE_DIPLOME", "CODE_SISE_DIPLOME", "NIVEAU_DANS_LE_DIPLOME" et son anonymisation occasionne une perte de 918 entrées.Le fichier
up13_Academie.csv
concerne l'académie du Bac et il contient les attributs "LIBELLE_ACADEMIE_BAC", "NIVEAU_APRES_BAC", "NIVEAU_DANS_LE_DIPLOME", "CONTINENT", "LIBELLE_REGIME", "LIB_DIPLOME", "LIBELLE_COURT_COMPOSANTE" et son anoymisation occasionne la perte de 7525 entrées.Le fichier
up13_Bac.csv
concerne le type de Bac et le niveau atteint après le Bac, il contient les colonnes "REGROUPEMENT_BAC", "NIVEAU_APRES_BAC", "LIBELLE_REGIME", "CONTINENT", "LIBELLE_COURT_COMPOSANTE", "LIB_DIPLOME", "NIVEAU_DANS_LE_DIPLOME" et son anonymisation occasionne la perte de 3 933 entrées.Le fichier
up13_annees_etapes.csv
concerne le inscriptions dans les étapes de diplôme année après année, il contient les colonnes "ANNEE_INSCRIPTION", "LIBELLE_COURT_COMPOSANTE", "NIVEAU_APRES_BAC", "LIB_DIPLOME", "CODE_ETAPE" et son anonymisation occasionne la perte de 3 532 entrées.
D'autres tableaux extraits de la même donnée initiale et construits selon la même méthode d'anonymisation, peuvent être fourni sur demande (préciser les colonnes souhaitées).
Un second ensemble de ressources propose le suivi des étudiant·es année après année, d'étape de diplôme en étape de diplôme. Dans ce jeu de données, nous appelons trace un tel suivi lorsque l'année d'inscription a été oubliée et que seule subsiste la séquence. Et nous appelons cursus une donnée décrivant cette succession d'étapes au fil des années. Pour l'anonymisation nous avons regroupé les traces ou les parcours identiques et dès lors qu'il y en avait moins de 10 nous n'indiquons pas leur nombre, ou, ce qui revient au même, nous mettons ce nombre à 1 (l'information étant qu'il y a au moins un·e étudiant·e ayant laissé cette trace ou suivi ce cursus). Cela conduit à oublier un certain nombre de parcours d'étude trop spécifiques et à n'en conserver qu'un seul comme témoin.
Partant de 106 088 parcours ou traces, nous produisons les ressources suivantes.
Le fichier
up13_traces.csv
contient la séquence des code d'étapes de diplôme (une trace) et l'anonymisation nous fait oublier 10 089 traces.Le fichier
up13_traces_wt_etape.csv
contient des traces similaires, mais sans le code étape. C'est à dire que seul subsistent le diplôme, le niveau après bac et la composante concernée. L'anonymisation nous fait oublier 4 447 traces.Le fichier
up13_traces_bac_wt_etape.csv
contient les mêmes données que dans le fichierup13_traces_wt_etape.csv
mais avec le type de Bac en plus. L'anonymisation nous fait oublier 8 067 traces.Le fichier
up13_cursus_wt_etape.csv
contient les mêmes données que dans le fichierup13_traces_wt_etape.csv
avec les années d'inscription en plus. L'anonymisation nous fait oublier 8 324 cursus.
Producer
Latest update
September 3, 2019
License
Licence Ouverte / Open Licence
Metadata quality:
Data description filled
Files documented
License filled
Update frequency not followed
File formats are open
Temporal coverage not set
Spatial coverage not set
All files are available
Metadata quality
Update frequency not followed
Temporal coverage not set
Spatial coverage not set
1 API
1 Reuse
There are no discussions for this dataset yet.
There are no community resources for this dataset yet.
Information
Tags
License
ID
58e34f7dc751df5d2777388c
Temporality
Creation
April 4, 2017
Frequency
Annual
Latest update
September 3, 2019
Actions
Embed
Statistics for the year
Views
1.1k
Downloads
75
Reuses of this dataset
1
Followers
1