Statistiques Coronavirus (statcorona.fr)

4K

4

Votre question porte sur autre chose que cette réutilisation ? Visiter notre forum

2 discussions

anomalie + méthode graphique

Posté le 15 avril 2020
Bonjour, Je salue votre travail difficile de recueil des données et leur suivi. J'ai voulu répondre aux questions d'un enfant : combien y aura-t-il de morts (par Covid-19) ? ça va durer jusqu'à quand ? Pour bâtir la réponse, j'extrais les données décès de SPF (donnees-hospitalieres-covid19-2) ajoutées à celles de JHU avant le 18 mars. La dispersion des nombres quotidiens est telle que les petites anomalies du genre sexe 1 + sexe 2 n'est pas égal à sexe 0 sont sans incidence notable. À signaler quand même que les lignes 2123 à 2125 ne sont pas attribuées à un département ( mais zéro décès). En partant du cas de l'Italie, j'ai pu approcher la loi normale et répondre à ces deux questions dès la confirmation du premier point d'inflexion (28 mars) de la courbe de Gauss : toutes choses égales par ailleurs, hors rectifications SPF ultérieures à ce jour et pour les seuls décès à l'hôpital (donc hors EHPAD et autres), autour de 12 500 et fin de l'épisode vers le 6 mai. Ces résultats sont obtenus par un traitement simple des données réelles et les 4 opérations seulement ; donc accessibles et reproductibles dès le niveau CM2 (enfin, celui des années 60). Si ça vous intéresse, un court topo est possible.
Posté le 15 avril 2020
Producteur
Cela m'intéresse effectivement et cela intéressrait sûrement d'autres personnes. Sur quelles données exactement avez-vous appliqué la courbe de Gauss et comment avez vous mesurer le peak ? Je pose cette question parce que les données accessibles en France sont moins significatives par rapport aux autres pays: nous ne testons pas en masse, et nous ne suivons pas tous les patients décèdés. Cela explique par ailleurs une très hausse létalité en France, car les gens testés sont déjà des personnes ayant des symptômes en état grave. Néanmoins, je suis intéressé de mettre une graphe indicative et informative sur le site pour ceux qui s'intéressent et j'aurais aimer avoir un peu plus de détail sur comment vous l'avez calculé.
Posté le 19 avril 2020
Bonjour Aochen Yang Pouvez vous préciser ce à quoi correspondent les hospitalisés et les cas actifs. Leur différence au 18 avril est de 22 688. Or ce nombre est très inférieur aux personnes guéries et sorties de l'hôpital (35 983) et celui des décédés en hôpital (11 834 selon les données hospitalières). Merci par avance et cordialement
Posté le 19 avril 2020
Bonjour Aochen Yang Réponse d'abord sur le cas de l'Italie tout juste mis à jour. À partir des données brutes fournies par Le Monde, tirer une "moyennée" d'après la formule de régression suivante : =1/10*((4/9*(B6+B14))+(55/63*(B7+B13))+(401/315*(B8+B12))+(1518/945*(B9+B10+B11))) où A6 est le jour N°1(26 février) et B6 le nb de décès du jour (ici, 2). Le coefficient de tangence montre une croissance jusque vers 18-19 mars (jr 22, 23) : c'est le premier point d'inflexion, à un sigma (environ 11) de la médiane. Le sommet est donc vers le 29 mars (2 jrs après le pic réel) à une altitude de 808 (5/3 de l'ordonnée de l'inflexion). La génération d'une courbe de Gauss passant par les ordonnées de -2sigma et de l'inflexion (-1sigma) donne la même médiane et un sommet un peu plus haut (825). Malheureusement, une nouvelle inflexion s'est marquée le 4 avril (jr 39), brisant la cohérence mathématique de la série. Nous sommes peut-être face à une somme de deux gaussiennes. Voilà très brièvement pour l'Italie. Donnez-moi une adresse où vous transmettre un document de quelques pages avec graphiques et feuilles de tableur. Dans un second message vous aurez le traitement des données françaises. Cdt.
Posté le 19 avril 2020
Producteur
Bonjour Patrick, TOTAL HOSPITALISÉS : représente le nombre des patients hospitalisés depuis le début de l'épidémie. HOSP. EN COURS : nombre de patients en cours d'hospitalisation GUÉRIS : personnes guéries et sorties de l’hôpital CAS ACTIFS : TOTAL CONFIRMÉS - DÉCÈS - GUÉRIS
Posté le 19 avril 2020
Merci Aochen Yang pour vos précisions. Le total confirmé affiché diminué des décès hospitaliers et ESMS ainsi que des guéris correspond bien au nombre affiché de cas actifs. Mais n'y a-t-il pas ici un curieux mélange de chiffres concernant les hôpitaux d'une part et les ESMS d'autre part ? Si les cas confirmés incluent ceux des ESMS cela voudrait dire qu'il n'y a eu que 49 270 personnes confirmées en hôpital, sois moins que de cas actifs. S'ils ne les incluent pas, pourquoi déduire les décès ESMS ? Merci des précisions que vous pourrez m'apporter. cordialement
Posté le 19 avril 2020
Producteur
Bonjour Yves, Je vous remercie de votre réponse. Vous pouvez nous écrire au statcorona@gmail.com. Cordialement, Aochen YANG
Posté le 19 avril 2020
Producteur
Bonjour PATRICK, Effectivement il faudrais enlever une partie des décès. Nous l'allons mettre à jour. Cordialement,

Les sources

Posté le 2 avril 2020
Bonjour, Je n'ai pas l'impression que vous utilisez mon jeu de données, si vous attachez votre réutilisation à mon jeu de données pour rendre visible votre site, c'est moche... (ce qui semble être le cas, puisque votre github n'a rien qui pointe vers mes fichiers...)
Posté le 2 avril 2020
Producteur
C'est des actions manuelles pour le moment :) j'integrerai les differentes sources que j'ai trouve quand j'ai un peu de temps
Posté le 2 avril 2020
👍
Posté le 4 avril 2020
Bonjour à tous, Je pense que ma question peut paraitre simpliste, mais je cherche à récupérer des données relatives au coronavirus au jour le jour et pour l'instant qu'en France. J'ai effectivement trouver certaines choses en Json : https://raw.githubusercontent.com/opencovid19-fr/data/master/dist/chiffres-cles.json mais il me semble que les valeurs du jour (ie 01/04/2020) soient une valeur calculée depuis le début (mars) et non pas la valeur du jour (+XXX cas). Y aurait-il moyen de récupérer un flux de données permettant d'avoir au jour : - Valeur somme (somme des valeur depuis le mars) - Valeur delta (nombre de "cas" dans ce jour), et ce pour toutes les valeurs mesurées (cas, réanimation, décés, rémission,...) Pour la France et par départements, incluant les TOM et DOM. Et bien évidemment la même chose pour certains pays d'europe comme (Angleterre, Allemagne, Italie, Espagne...) Merci de votre retour
Posté le 5 avril 2020
Producteur
Je compte le faire d'ici deux trois jours. Je peux vous partager un javascript (et / ou mettre un fichier json dans mon repos bitbucket). Pour les autres pays, vous pouvez recuperer un fichier XLSX depuis ECDC: https://www.ecdc.europa.eu/en/publications-data/download-todays-data-geographic-distribution-covid-19-cases-worldwide ensuite, vous trouvez dans mon repo worldwideXLSX.js qui fait le travail.
Posté le 5 avril 2020
Bonjour, Merci de votre retour. En fait, je vais, dans la mesure du possible et de certains critères, dev un simple site intranet (.net) pour la Ste dans laquelle je travaille. Ce site fournira : - Selection d'un pays (liste des disponibles dans la bdd) - Les params au jour le jour (valeur relative) (nouveaux cas,nb hospitalisation, nb de réanimations, nb de décès, nb de rémissions, Nb de patients rentrés chez eux (si possibilité de les distinguer avec les rémissions en cours d’hospitalisation)) Voila l'essence de ce que je souhaite faire. Le mode de fonctionnement : - 10 (ou plus, maxi 20) requetes par jour pour la mise à jour des données. - Tri/parsing/Génération de XML par pays selectionnées, servant de bdd au clients Donc un truc assez simple ;) Par contre, il doit y avoir des copyrights, et je me demande si la source des données est fiable. Perso, je préfère une source issue du gouvernement france, plutôt que celle d'un site web anglophone, même si celui-ci semble particulièrement serieux. Qu'en pensez-vous ? Patrick
Posté le 5 avril 2020
Producteur
ECDC = European Centre for Disease Prevention and Control (Centre européen de prévention et de contrôle des maladies). Je le considère comme une source fiable. En revanche, le pb est que les donnees datent de la matinee tous les jours. D'ou j'ai du faire des crawlers sur les autres sites + des ajustements manuels. Il me semble pas mals les donnees de Politologue.
Posté le 5 avril 2020
En effet, l'ECDC est serieux, mais comme vous le dite, les données sont actualisées le matin et j'en ai besoin tout au long de la journée, ré-actualisées à peu près toutes les heures (au mieux) ou les 6h (au pire). Ceci dit, à partir de 18h/19h, j'ai besoin d'avoir les chiffres de la journée. Il semble, comme vous le signalez que les données de Politologue soient pas mal aussi. Puis-je revenir vers vous d'ici quelques jours, il faut aussi que je puisse valider certaines contraintes technique avec les services informatiques de notre Ste et si OK, je dev cette "mini" application que mettra à dispo des XML. Merci.
Posté le 5 avril 2020
Producteur
Biensur. Pour le fichier json vous avez trouve, vous pouvez utiliser / vous inspirer de ce script pour parser en objet json: https://bitbucket.org/aochenyang/statscorona/src/master/offline/openCovidCrawler.js var lastStatPerDepartment = lastStatFilter(statPerArea, "DEP"); <-- donnees par departement var lastStatPerRegion = lastStatFilter(statPerArea, "REG"); <-- donnees par region Je ferais la generation de fichier json d'ici qq jours.
Posté le 6 avril 2020
Merci pour le script, mais vu que je suis sous Microsoft .NET, je vais directement utiliser les outils mis à dispo comme : - Newtonsoft.Json (https://www.newtonsoft.com/json) pour serialiser/deserialiser le Json/XML. Tenez moi au courant lorsque le process de mise à jour du fichier journalier sera en place. Merci
Posté le 6 avril 2020
Bonjour, Il semble que les données de : https://www.data.gouv.fr/fr/datasets/donnees-des-urgences-hospitalieres-et-de-sos-medecins-relatives-a-lepidemie-de-covid-19/ ne soient plus à jours depuis le 4 avril ? Je ne vous cache pas que cela m'inquiete sur la solidité des "livraisons" ?
Posté le 6 avril 2020
Producteur
Voici: https://bitbucket.org/aochenyang/statscorona/src/master/offline/sourceFiles/tmpStatPerDepartment.json https://bitbucket.org/aochenyang/statscorona/src/master/offline/sourceFiles/tmpStatPerRegion.json
Posté le 6 avril 2020
Producteur
De ce que je vois, ils sont a jour. Mais les dernieres donnees ne sont que 5 Avril, il manque de donnees en temps reel.
Posté le 6 avril 2020
Producteur
Attention, mes fichiers json plus haut ne contiennent pas les ESMS
Posté le 6 avril 2020
Ok, j'ai vu après coup que les fichiers sont à jour. Merci pour vos fichiers. J'arrive à les convertir sans problèmes en XML. Je reviens vers vous dès que je peux les utiliser. Je suppose que je dois mettre en avant la source de ces données, vous ?
Posté le 7 avril 2020
Producteur
Mettez un lien vers nos sites ;)
Posté le 7 avril 2020
Bonjour, Hummm, pas sur que je puisse le faire, car il est fort possible que ces données soient aussi utilisées pour un média TV (chaine d'info)...
Posté le 8 avril 2020
Bonjour, Je reviens vers vous, car j'ai bien évidemment une autres question : Les données depuis data.gouv : https://www.data.gouv.fr/fr/datasets/r/d2af5160-a21d-47b7-8f30-3c20dade63b1 ont 24h de retard, c'est à dire que la derniere date de mise à jour est le 6/04 alors que nous sommes le 8/04. Ce soir à 19h, la mise à jour sera pour le 7/04, etc... Savez-vous où peut-on avoir à 19h, les stats du jour même ? Merci
Posté le 8 avril 2020
par contre votre fichier est à jour : https://bitbucket.org/aochenyang/statscorona/src/master/offline/sourceFiles/tmpStatPerRegion.json ;)
Posté le 11 avril 2020
Producteur
Bonjour Patrick, Désolé pour la réponse tardive. Les données sur GEODES soit les plus à jour que j'ai trouvées. En revanche, cela a quand même quelques retards (de qq heures) par rapport aux chiffres de SPF pour la France entière. J'ai pris depuis opencovid (et derrière c'est GEODES) Cordialement
Posté le 12 avril 2020
Enfin un site simple et facile à lire / utiliser ! J'apprécie vraiment.
Posté le 12 avril 2020
Producteur
Avec plaisir :)
Posté le 16 avril 2020
Bonjour Aochen Yang Les décès figurant dans les chiffres clés dont un petite astérisque indique qu'il ne concernent que les hôpitaux intègrent pourtant les Ephad si je me réfère aux données hospitalières de data.gouv.fr. Attention le chiffre des EMS recouvre à la fois les Ephad et les EMS. Cordialement
Posté le 16 avril 2020
Producteur
Effectivement, merci de votre commentaire. Je l'ai mis à jour.