Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
Le blog des Bactéries et de l'Evolution

Google est ton épidémiologiste

13 Novembre 2008 , Rédigé par Benjamin Publié dans #Divers Sciences

Si un jour  vous avez posé une question sur internet, sur un forum, un salon de discussion, et si cette question était un peu naïve, on vous a peut-être répondu: "JFGI", c'est-à-dire "just fucking google it"; un peu plus poliment, on emploie volontiers la phrase "Google est ton ami", qui reflète le succès du moteur de recherche. Effectivement, Google détient la plupart des réponses à nos questions, et ce grâce à une technologie performante (mais qui n'est pas non plus exempte de faille, je vous renvoie par exemple aux google bombs). Autre preuve de sa notoriété (lui appellerait ça un "page rank"), "to google" est maintenant devenu un verbe à part entière dans la langue de Shakespeare, et pas seulement dans celle des geeks. Bon, je ne voulais pas refaire la success story du célèbre moteur de recherche, simplement souligner à quel point il était performant et largement utilisé.

Si on y réflechit cinq minutes, le nombre d'informations, voire de secrets que l'on fournit à Google est tout bonnement effarant. Rassurons-nous, la devise de Google inc. est "don't be evil" ("ne sois pas méchant", voir aussi cette série de strips de Dilbert), on peut donc croiser les doigts et espérer qu'ils en fassent quelque chose d'utile. Preuve de cette bonne volonté, il existe un moteur Google dédié aux sources scientifiques, Google Scholar. On dispose aussi de Google Trends, qui donne accès au volume de requêtes Google par mot-clef au cours du temps. On peut par exemple savoir ce que cela donne avec des mots comme bacteria, Obama, credit crisisscience (y a-t-il une désaffection pour celle-ci?) ... et ça peut servir à autre chose qu'à quantifier ou relayer du buzz. En coombinant plusieurs données de ce type, Google pense ainsi pouvoir suivre quasiment en temps réel la propagation de la grippe aux USA. En effet, lorsqu'une requête est envoyée à Google et contient les mots grippe + vaccin, une description des symptômes... il y a fort à parier qu'un cas de grippe est au bout du clavier. A l'échelle d'une population, il semble bien que ça fonctionne, et Google est donc en mesure d'agréger toutes ces requêtes, assorties de leur provenance géographique, afin de créer jour par jour une carte de la grippe aux USA. Le risque serait bien sûr de biaiser les prédictions, en faisant l'hypothèse que tous les foyers américains ont internet et font appel à Google, même malades. Il faut croire que la réalité n'est pas si différente, puisque l'alogrithme de Google fournit les mêmes données que les statistiques publiées par le CDC, l'organe chargé de la veille sanitaire aux USA... avec deux semaines d'avance sur ce dernier. Attention, c'est probablement sur ces mêmes données qu'ont été calibrés ces algorithmes... Voici un reportage sur le sujet:



Google n'est plus seulement notre ami, c'est aussi notre médecin, voire notre épidémiologiste. Véritable utilité ou énième gadget du web? Affaire à suivre, ces jours-ci la grippe est encore à un niveau assez faible aux Etats Unis... si l'on en croit Google.

Partager cet article

Repost 0

Commenter cet article

manu 18/11/2008 00:17

Google is your doctor... https://www.google.com/health

Timothée 14/11/2008 12:57

Argh, scoopé sur celui là!Très bon billet, sinon. Ce qui est drôle, c'est qu'en prenant les données par état, on peut suivre la propagation spatiale du pic épidémique, comme avec des 'vraies' données épidémio… Est-ce la naissance de la méta-épidémio?Je suis d'accord  avec Antoine sur la précédence de la recherche par rapport à la consultation. Je serai curieux de voir ce que ça donne avec d'autres maladies…PS : Dr Goulu : si tu cherches un co-auteur pour un billet sur ce thème, fais moi signe! 

Benjamin 14/11/2008 10:25

L'omission (qui procédait elle-même d'une correction hâtive) est corrigée.Pour ce qui est du calibrage: il a bien fallu à Google des données pour étalonner ses modéèles, pour savoir à combien de cas réels de grippe correspondait une requête sur son moteur de recherche. En effet, sur leur manuscrit accepté à Nature, on peut lire : "Publically available historical data from the CDC’s U.S. Influenza Sentinel Provider Surveillance Network was used to help build our models."

Enro 14/11/2008 07:58

"l'alogrithme de Google fournit les mêmes données que les statistiques publiées par le CDC, l'organe chargé de la veille sanitaire aux USA. Attention, c'est probablement sur ces mêmes données qu'ont été calibrés ces algorithmes..."Je ne crois pas que les données aient été calibrées, mais ce que tu omets de dire et qui fait tout l'intérêt de l'outil c'est que les courbes de Google précèdent de 10 jours celles du CDC. En effet, les internautes font une recherche sur les symptômes de la grippe dès les premiers signes, avant même de voir leur docteur, lequel signalera le cas au CDC encore plus tard  ! 

Dr. Goulu 14/11/2008 07:54

reçu une fois un e-mail avec une ligne de signature qui m'a fait pas mal réfléchir : "you had training, I have Google"fondamentalement , que doit-on apprendre à l'école ou à l'université lorsqu'on a un accès quasiment instantané à l'information ?je sens que je tiens le sujet d'un nouvel article....