Données de scolarité de l'université Paris 13

Descripción

Il s'agit d'un jeu de données mis à jour annuellement la description ci-dessous concerne la première année de mise en ligne, depuis des mises à jour ont eu lieu en 2018 (données 2008-2017) et en 2019 (données 2009-2018).

L'université Paris 13 a enregistré dans son système d'information (logiciel Apogée), des données sur l'inscription des étudiant·e·s pour chaque année universitaire entre 2006(-2007) et 2015(-2016). Ces données portent sur les diplômes préparés, les étapes pour y parvenir, le régime (s'il s'agit de formation initiale ou d'apprentissage), les composantes concernées (UFR, IUT, etc.), et l'origine des étudiant·e·s (type de Bac, académie d'origine, nationalité). Chaque entrée concerne l'inscription principale d'un·e étudiant·e à l'université pour une année. Les attributs de ces données sont les suivants.

  • CODE_INDIVIDU Donnée masquée
  • ANNEE_INSCRIPTION Année d'inscription : 2006 pour 2006-2007, etc.
  • LIB_DIPLOME Nom du diplôme
  • NIVEAU_DANS_LE_DIPLOME 1, 2,… pour master 1, licence 2, etc.
  • NIVEAU_APRES_BAC 1, 2,… pour Bac+1, Bac+2,…
  • LIBELLE_DISCIPLINE_DIPLOME Rattachement du diplôme à une discipline
  • CODE_SISE_DIPLOME Code du système d’information sur le suivi de l’étudiant
  • CODE_ETAPE Code interne d'une étape (année, parcours) de diplôme
  • LIBELLE_COURT_ETAPE Nom court de l'étape
  • LIBELLE_LONG_ETAPE Nom plus intelligible de l'étape
  • LIBELLE_COURT_COMPOSANTE Nom de la composante (UFR, IUT etc.)
  • CODE_COMPOSANTE Code numérique de la composante (inutilisé)
  • REGROUPEMENT_BAC Type de Bac (L, ES, S, techno STMG, techno ST2S,…)
  • LIBELLE_ACADEMIE_BAC Académie du Bac (Créteil, Versailles, étranger,…)
  • CONTINENT Déduit de la nationalité qui est une donnée masquée
  • LIBELLE_REGIME Formation initiale, continue, pro, apprentissage

L'université Paris 13 rend publique une partie de ce jeu de données à travers plusieurs ressources, dans le respect de l'anonymat de ses étudiant·es.

Partant de 213 289 entrées qui correspondent à toutes les inscriptions des 106 088 individus ayant étudié à l'université Paris 13 au cours des dix années universitaires entre 2006(-2007) et 2015(-2016), nous avons sélectionné plusieurs ressources correspondant chacune à une partie des données. Pour produire chaque ressource nous avons choisi un petit nombre d'attributs, puis nous avons supprimé une petite proportion des entrées, de façon à satisfaire une contrainte de k-anonymisation avec k = 5, c'est à dire de faire en sorte que, dans chaque ressource, chaque entrée apparait au moins 5 fois à l'identique (autrement l'entrée est supprimée). Les quatre ressources produites sont matérialisés par les fichiers suivants.

  • Le fichier up13_etapes.csv concerne les étapes de diplôme, il contient les attributs "CODE_ETAPE", "LIBELLE_COURT_ETAPE", "LIBELLE_LONG_ETAPE", "NIVEAU_APRES_BAC", "LIBELLE_COURT_COMPOSANTE", "LIB_DIPLOME", "LIBELLE_DISCIPLINE_DIPLOME", "CODE_SISE_DIPLOME", "NIVEAU_DANS_LE_DIPLOME" et son anonymisation occasionne une perte de 918 entrées.

  • Le fichier up13_Academie.csv concerne l'académie du Bac et il contient les attributs "LIBELLE_ACADEMIE_BAC", "NIVEAU_APRES_BAC", "NIVEAU_DANS_LE_DIPLOME", "CONTINENT", "LIBELLE_REGIME", "LIB_DIPLOME", "LIBELLE_COURT_COMPOSANTE" et son anoymisation occasionne la perte de 7525 entrées.

  • Le fichier up13_Bac.csv concerne le type de Bac et le niveau atteint après le Bac, il contient les colonnes "REGROUPEMENT_BAC", "NIVEAU_APRES_BAC", "LIBELLE_REGIME", "CONTINENT", "LIBELLE_COURT_COMPOSANTE", "LIB_DIPLOME", "NIVEAU_DANS_LE_DIPLOME" et son anonymisation occasionne la perte de 3 933 entrées.

  • Le fichier up13_annees_etapes.csv concerne le inscriptions dans les étapes de diplôme année après année, il contient les colonnes "ANNEE_INSCRIPTION", "LIBELLE_COURT_COMPOSANTE", "NIVEAU_APRES_BAC", "LIB_DIPLOME", "CODE_ETAPE" et son anonymisation occasionne la perte de 3 532 entrées.

D'autres tableaux extraits de la même donnée initiale et construits selon la même méthode d'anonymisation, peuvent être fourni sur demande (préciser les colonnes souhaitées).

Un second ensemble de ressources propose le suivi des étudiant·es année après année, d'étape de diplôme en étape de diplôme. Dans ce jeu de données, nous appelons trace un tel suivi lorsque l'année d'inscription a été oubliée et que seule subsiste la séquence. Et nous appelons cursus une donnée décrivant cette succession d'étapes au fil des années. Pour l'anonymisation nous avons regroupé les traces ou les parcours identiques et dès lors qu'il y en avait moins de 10 nous n'indiquons pas leur nombre, ou, ce qui revient au même, nous mettons ce nombre à 1 (l'information étant qu'il y a au moins un·e étudiant·e ayant laissé cette trace ou suivi ce cursus). Cela conduit à oublier un certain nombre de parcours d'étude trop spécifiques et à n'en conserver qu'un seul comme témoin.

Partant de 106 088 parcours ou traces, nous produisons les ressources suivantes.

  • Le fichier up13_traces.csv contient la séquence des code d'étapes de diplôme (une trace) et l'anonymisation nous fait oublier 10 089 traces.

  • Le fichier up13_traces_wt_etape.csv contient des traces similaires, mais sans le code étape. C'est à dire que seul subsistent le diplôme, le niveau après bac et la composante concernée. L'anonymisation nous fait oublier 4 447 traces.

  • Le fichier up13_traces_bac_wt_etape.csv contient les mêmes données que dans le fichier up13_traces_wt_etape.csv mais avec le type de Bac en plus. L'anonymisation nous fait oublier 8 067 traces.

  • Le fichier up13_cursus_wt_etape.csv contient les mêmes données que dans le fichier up13_traces_wt_etape.csv avec les années d'inscription en plus. L'anonymisation nous fait oublier 8 324 cursus.

Producer

Latest update

3 de septiembre de 2019

Licencia

Licence Ouverte / Open Licence

Metadata quality
66.66666666666666/100

Update frequency not followed

Temporal coverage not set

Spatial coverage not set

There are no discussions for this dataset yet.

There are no community resources for this dataset yet.

Share your resources Learn more about the community

Information

Temporality

Creation

4 de abril de 2017

Frequency

Anual

Latest update

3 de septiembre de 2019

Actions

Embed

Statistics for the year

Views

1,1k

11 in nov 2024

Downloads

72

Reuses of this dataset

1

Followers

1