Google est ton épidémiologiste
Si un jour vous avez posé une question sur internet, sur un forum, un salon de discussion, et si cette question était un peu naïve, on vous a peut-être répondu: "JFGI", c'est-à-dire "just fucking google it"; un peu plus poliment, on emploie volontiers la phrase "Google est ton ami", qui reflète le succès du moteur de recherche. Effectivement, Google détient la plupart des réponses à nos questions, et ce grâce à une technologie performante (mais qui n'est pas non plus exempte de faille, je vous renvoie par exemple aux google bombs). Autre preuve de sa notoriété (lui appellerait ça un "page rank"), "to google" est maintenant devenu un verbe à part entière dans la langue de Shakespeare, et pas seulement dans celle des geeks. Bon, je ne voulais pas refaire la success story du célèbre moteur de recherche, simplement souligner à quel point il était performant et largement utilisé.
Si on y réflechit cinq minutes, le nombre d'informations, voire de secrets que l'on fournit à Google est tout bonnement effarant. Rassurons-nous, la devise de Google inc. est "don't be evil" ("ne sois pas méchant", voir aussi cette série de strips de Dilbert), on peut donc croiser les doigts et espérer qu'ils en fassent quelque chose d'utile. Preuve de cette bonne volonté, il existe un moteur Google dédié aux sources scientifiques, Google Scholar. On dispose aussi de Google Trends, qui donne accès au volume de requêtes Google par mot-clef au cours du temps. On peut par exemple savoir ce que cela donne avec des mots comme bacteria, Obama, credit crisis, science (y a-t-il une désaffection pour celle-ci?) ... et ça peut servir à autre chose qu'à quantifier ou relayer du buzz. En coombinant plusieurs données de ce type, Google pense ainsi pouvoir suivre quasiment en temps réel la propagation de la grippe aux USA. En effet, lorsqu'une requête est envoyée à Google et contient les mots grippe + vaccin, une description des symptômes... il y a fort à parier qu'un cas de grippe est au bout du clavier. A l'échelle d'une population, il semble bien que ça fonctionne, et Google est donc en mesure d'agréger toutes ces requêtes, assorties de leur provenance géographique, afin de créer jour par jour une carte de la grippe aux USA. Le risque serait bien sûr de biaiser les prédictions, en faisant l'hypothèse que tous les foyers américains ont internet et font appel à Google, même malades. Il faut croire que la réalité n'est pas si différente, puisque l'alogrithme de Google fournit les mêmes données que les statistiques publiées par le CDC, l'organe chargé de la veille sanitaire aux USA... avec deux semaines d'avance sur ce dernier. Attention, c'est probablement sur ces mêmes données qu'ont été calibrés ces algorithmes... Voici un reportage sur le sujet:
Si on y réflechit cinq minutes, le nombre d'informations, voire de secrets que l'on fournit à Google est tout bonnement effarant. Rassurons-nous, la devise de Google inc. est "don't be evil" ("ne sois pas méchant", voir aussi cette série de strips de Dilbert), on peut donc croiser les doigts et espérer qu'ils en fassent quelque chose d'utile. Preuve de cette bonne volonté, il existe un moteur Google dédié aux sources scientifiques, Google Scholar. On dispose aussi de Google Trends, qui donne accès au volume de requêtes Google par mot-clef au cours du temps. On peut par exemple savoir ce que cela donne avec des mots comme bacteria, Obama, credit crisis, science (y a-t-il une désaffection pour celle-ci?) ... et ça peut servir à autre chose qu'à quantifier ou relayer du buzz. En coombinant plusieurs données de ce type, Google pense ainsi pouvoir suivre quasiment en temps réel la propagation de la grippe aux USA. En effet, lorsqu'une requête est envoyée à Google et contient les mots grippe + vaccin, une description des symptômes... il y a fort à parier qu'un cas de grippe est au bout du clavier. A l'échelle d'une population, il semble bien que ça fonctionne, et Google est donc en mesure d'agréger toutes ces requêtes, assorties de leur provenance géographique, afin de créer jour par jour une carte de la grippe aux USA. Le risque serait bien sûr de biaiser les prédictions, en faisant l'hypothèse que tous les foyers américains ont internet et font appel à Google, même malades. Il faut croire que la réalité n'est pas si différente, puisque l'alogrithme de Google fournit les mêmes données que les statistiques publiées par le CDC, l'organe chargé de la veille sanitaire aux USA... avec deux semaines d'avance sur ce dernier. Attention, c'est probablement sur ces mêmes données qu'ont été calibrés ces algorithmes... Voici un reportage sur le sujet:
Google n'est plus seulement notre ami, c'est aussi notre médecin, voire notre épidémiologiste. Véritable utilité ou énième gadget du web? Affaire à suivre, ces jours-ci la grippe est encore à un niveau assez faible aux Etats Unis... si l'on en croit Google.
Partager cet article
Pour être informé des derniers articles, inscrivez vous :
Commenter cet article
M
T
B
E
D