Prix moyen au m² des ventes de maisons et d'appartements par commune en 2019

Updated on May 11, 2020 — Open Data Commons Open Database License (ODbL)

This dataset has been published on the initiative and under the responsibility of Boris Mericskay
Published on May 11, 2020 and updated on May 11, 2020

Boris Mericskay

5 datasets
3 reuses

Informations

Temporality

Geographic dimensions

Embed

Permalink

Description

Ce jeu de données propose, à l'échelles des communes françaises métropolitaines, le nombre de ventes de maisons et d'appartements et le prix moyen au m² des transactions simples (pas des transactions multi-ventes) pour l'année 2019.

Le jeu de données se base sur les données DVF enrichies par Etalab pour le calcul du nombre de ventes et le prix moyen au m² ET le jeu de données ADMIN EXPRESS de l'IGN pour la nomenclature des communes.

La constitution du jeu de données s'est effectuée dans le logiciel R avec le package "Tidyverse". _

Attention: ce jeu de données n'a aucune valeur officielle et institutionnelle, le résultat est issu d'une méthodologie qui peux largement être améliorée

Pour plus d'informations sur la méthodologie me contacter directement.

Resources 1

See also: community resources

Community resources 1

You have built a more comprehensive database than those presented here? This is the time to share it!

1 downloads

prixm2+loyer_communes.csv.csv

Gauthier Thurin

Disponible
csv (4.7Mo)

Contenu

À l'échelle communale, prix moyen au m2 des ventes foncières (entre 2018 et 2019) ainsi que loyers moyens au m2.

Auteurs

LABARBARIE Pol, Master 2 Modélisation Statistique et Stochastique, Université de Bordeaux, labarbariepol@gmail.com

THURIN Gauthier, Master 2 Modélisation Statistique et Stochastique, Université de Bordeaux, thuringauthier@gmail.com

Source 1

https://www.data.gouv.fr/fr/datasets/prix-moyen-au-m2-des-ventes-de-maisons-et-dappartements-par-commune-en-2019/

Nous avons réutilisé les données fournies par Boris Mericskay ("à l'échelles des communes françaises métropolitaines, le nombre de ventes de maisons et d'appartements et le prix moyen au m² des transactions simples"). En regroupant les données fournies pour 2018 et pour 2019, nous avons rajouté un prix moyen au m2 pour chaque commune (moyenne pondérée par le nombre de ventes). Ceci comble, pour les petites communes n'ayant aucune vente en 2018 ou en 2019, les valeurs manquantes de l'un ou l'autre des csv de M. Boris Mericskay.

Source 2

https://www.data.gouv.fr/fr/datasets/carte-des-loyers-indicateurs-de-loyers-dannonce-par-commune-en-2018/

Également, nous avons regroupé des informations issues de la "carte des loyers" (indicateurs de loyers d’annonces, à l’échelle de la commune). Ces données "carte des loyers" sont utilisables librement, sous réserve de mentionner la source sous la forme suivante : « Estimations UMR 1041 CESAER (AgroSup Dijon-INRAE) à partir des données SeLoger, leboncoin, PAP ». Nous disposions de plus de communes pour ces indicateurs de loyers que pour les prix moyens (source 1). Nous nous sommes donc restreints aux communes présentes dans ce premier csv.

Variables

Ainsi, pour chaque commune, ce data comprend des informations communales (INSEE de la commune, INSEE du département, INSEE de la région, code EPCI, nom de la commune, population), le nombre de ventes de 2019 (Nb_Ventes), un prix moyen au m2 pour 2019 (PrixMoyen_M2), un prix moyen au m2 moyenné entre 2018 et 2019 (PrixMoyen_M2_1819), un loyer moyen au m2 de 2018 (un pour les appartements et un pour les maisons) ainsi qu'un coefficient de détermination (R2) associé à la prédiction du-dit loyer. Pour comprendre d'où vient ce R2, veuillez considérer la page "carte des loyers" sur data.gouv.

Codes R


prix_2019 = read.csv2("prixm2-communes-2019.csv") # Données publiées par Boris Mericskay
prix_2018 = read.csv("prixm2-communes-2018.csv") # Données publiées par Boris Mericskay

prix_2018 = prix_2018[,-1] 

prix_2018 = prix_2018[order(prix_2018$ID),] 
prix_2019 = prix_2019[order(prix_2019$ID),] 

prix_2018$Nb_Transac[is.na(prix_2018$Nb_Transac)] <- 0 
prix_2018$Prixm2_Moy[is.na(prix_2018$Prixm2_Moy)] <- 0 
prix_2019$Nb_Ventes[is.na(prix_2019$Nb_Ventes)] <- 0 
prix_2019$PrixMoyen_M2[is.na(prix_2019$PrixMoyen_M2)] <- 0 

prix_2019$PrixMoyen_M2_1819 = ((prix_2018$Nb_Transac * prix_2018$Prixm2_Moy) + (prix_2019$Nb_Ventes * prix_2019$PrixMoyen_M2)) / (prix_2018$Nb_Transac + prix_2019$Nb_Ventes )

loyers_apparts_2018 = read.csv2("indicateurs-loyers-appartements.csv") #données "carte des loyers"
loyers_maisons_2018 = read.csv2("indicateurs-loyers-maisons.csv") #données "carte des loyers"

loyers_maisons_2018[loyers_maisons_2018$INSEE %in% prix_2019$INSEE_COM,] 
loyers_apparts_2018[loyers_apparts_2018$INSEE %in% prix_2019$INSEE_COM,]

#On rajoute les infos des indicateurs de loyers dans prix_2019

prix_2019$loyer_apparts = rep(0,nrow(prix_2019))
for (i in 1:nrow(prix_2019)){
  if (nrow(loyers_apparts_2018[loyers_apparts_2018$INSEE==prix_2019$INSEE_COM[i],])!=0){
  prix_2019$loyer_apparts[i] = loyers_apparts_2018[loyers_apparts_2018$INSEE==prix_2019$INSEE_COM[i],]$loypredm2
  }
}

prix_2019$loyer_maisons = rep(0,nrow(prix_2019))
for (i in 1:nrow(prix_2019)){
  if (nrow(loyers_maisons_2018[loyers_maisons_2018$INSEE==prix_2019$INSEE_COM[i],])!=0){
    prix_2019$loyer_maisons[i] = loyers_maisons_2018[loyers_maisons_2018$INSEE==prix_2019$INSEE_COM[i],]$loypredm2
  }
}


write.csv(x = prix_2019, file = "prixm2+loyer_communes.csv")

Si vous réutilisez ces données, n'hésitez pas à nous contacter pour partager votre travail. Si vous trouvez des imprécisions pour ces données, n'hésitez pas à nous le faire remarquer par mail.

Type
MIME Type
text/csv
sha1
8822a76cdd2d2d717ec880625c384ddaaf410439
Created on
February 25, 2021
Modified on
February 25, 2021
Published on
February 25, 2021
Add a community resource

Reuses 0

You reused these data and published an article, a computer graphics, or an application? It's time to let you know! Reference your work in just a few clicks and increase your visibility.

Discussions 0

Discussion between the organization and the community about this dataset.