Dans la version modifiée le 22/07/2022, la variable `diametre` a pour valeur "cepee" pour 85 observations (84 sur le code Insee "57039" et 1 sur le 57447). Outre le fait de rendre ces observations non comparables sur cette variable, cela type en R la colonne en character au lieu de numérique.
Par ailleurs, le taux de non renseignement est très élevé :
17 variables sont intégralement non renseignées :
taux_na
famille_arbre 100 %
date_plantation 100 %
type_sol 100 %
type_enracinement 100 %
port_arbre 100 %
arbre_remarquable 100 %
arbre_protege 100 %
contraintes_sol 100 %
contrainte_aeriennes 100 %
eclairage 100 %
arrosage 100 %
allergie 100 %
remarque 100 %
hauteur 95.11 %
nom_vernaculaire 56.68 %
cultivar_variete_arbre 56.64 %
genre_arbre 56.62 %
matricule_arbre 55.86 %
espece_arbre 53.3 %
diametre 52.81 %
A quoi correspondent les valeurs "cepee" ? Peut-être trouveraient-elles leur place dans une autre variable ?
D'avance merci pour vos retours.