Dans la lignée de Freakonomics, le livre « Tout le monde ment » (Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are, Seth Stephens-Davidowitz, HarperCollins) est une mine d’or pour pour tout amateur d’analyse quantitative, d’autant plus pour ceux qui s’intéressent au SEO.
En s’appuyant sur des données de plusieurs sources de type Google, Facebook, ou encore Youporn, Seth parvient à démontrer que le biais de désirabilité sociale s’exprime dans nos statuts et prises de positions et nous fait mentir sur les réseaux sociaux et lors des sondages. La vérité se trouve chez Google qui devient l’oreille du web et reçoit toutes les confidences.
Comme l’écrit Usbek et Rica, Google, c’est « la plus grande base de données jamais collectée sur la psyché humaine ». Les sciences sociales ont enfin un moyen de mesure : le big data !
Tout le monde ment : formulation de requêtes sur Google et parti pris politique
Dans « Tout le monde ment », un enseignement applicable au SEO se trouve en page 10, dans un paragraphe consacré aux requêtes Google pendant l’élection de Trump:
Our research suggests that a person is significantly more likely to put the candidate they support first in a search that includes both candidates’ names (Page 10)
(Nos recherches nous montrent qu’une personne aura tendance à mettre le nom du candidat de son choix en premier, dans les requêtes qui contiennent les noms des 2 candidats.)
Cette tendance se confirme en France si l’on regarde les termes correspondants pour les élections présidentielles françaises:
Keyword | Searches |
debat macron le pen | 90500 |
debat le pen macron | 9900 |
débat hollande sarkozy | 210 |
débat sarkozy hollande | 170 |
Est-ce que cela signifie que les marques qui souhaitent cibler les clients de leurs concurrents, devraient s’arranger pour bien ranker sur les requêtes qui commencent par leurs noms ? A tester !
Cela peut aussi donner des indications de parts de marché. Dans les exemples ci-dessous, Android, Chrome et Sonos semblent être leader en France :
Keyword | Searches |
android ou ios | 590 |
ios ou android | 480 |
chrome ou firefox | 320 |
firefox ou chrome | 260 |
sonos ou bose | 320 |
bose ou sonos | 260 |
Biais sexiste dans les requêtes de Google sur les enfants (surdoués et en surpoids) aux Etats Unis, en France et en Grande Bretagne
Un autre sujet que Seth aborde dans son livre « Tout le monde ment », c’est l’existence de biais sexiste dans la façon dont les internautes s’expriment. Aux Etats Unis, les parents posent des questions différentes sur Google en fonction du genre de leurs enfants, sur des sujets comme le surpoids ou être surdoué.
Consider questions about a child’s weight. Parents Google “Is my daughter overweight?” roughly twice as frequently as they Google “Is my son overweight?”(pp. 135-136).
(Considérons les questions à propos du poids des enfants. Les parents vont googler « est-ce que ma fille est en surpoids » quasiment 2 fois plus que «mon fils est en surpoids»)
Voici les données du Google Keyword Planner pour les Etats Unis, la France et la Grande Bretagne:
Etats Unis
Keyword | Monthly Searches |
is my child gifted | 590 |
is my child overweight | 210 |
is my son gifted | 110 |
is my daughter gifted | 70 |
is my daughter overweight | 50 |
is my son overweight | 30 |
is my son a genius | 10 |
is my daughter a genius |
On peut noter un écart de 40 entre les requêtes filles (70) et garçons (110) surdoués, et un écart de 20 pour le surpoids (50/30).
France
Keyword | Searches |
enfant surdoué | 1600 |
enfant en surpoids | 210 |
ma fille est en surpoids | 30 |
comment savoir si mon enfant est surdoué | 30 |
comment savoir si mon fils est surdoué | 20 |
mon fils est surdoué | 10 |
mon fils est en surpoids | |
ma fille est surdouée | |
comment savoir si ma fille est surdouée | |
comment savoir si ma fille est en surpoids | |
comment savoir si mon fils est en surpoids |
En France, la formulation est différente, avec aucune requête sur des questions telles que « est-ce que ma fille est en surpoids » ou « comment savoir que ma fille est en surpoids ».
Par contre l’expression « ma fille est en surpoids » est tapée 30 fois par mois, contre entre 0 et 10 pour les garçons. Les garçons suscitent aussi 20 requêtes mensuelles pour « comment savoir si mon fils est surdoué », contre entre 0 et 10 pour les filles. Soit des écarts potentiel de 30 et 20.
Grande Bretagne
Keyword | Avg. Monthly Searches |
is my child overweight | 170 |
is my child gifted | 90 |
is my son gifted | 20 |
is my daughter overweight | 20 |
is my daughter gifted | 10 |
is my son overweight | 10 |
is my son a genius | 10 |
is my daughter a genius |
Pour les britanniques, le surpoids semble être un sujet plus populaire que celui de la précocité des enfants.
Mais pour les deux sujets, l’écart entre fille et garçon n’est que de 10 requêtes mensuelles, ce qui fait de la Grande Bretagne le pays le moins biasé par le genre dans les 3 étudiés.
En conclusion, et comme le suggérait Seth dans son livre, il y a beaucoup à faire en terme de Big Data appliquées aux Sciences Sociales, et les consultants SEO peuvent être de parfaits interlocuteurs pour les chercheurs. N’hésitez pas à me contacter si vous lisez cet article !
« Social science is becoming a real science. And this new, real science is poised to improve our lives. »(p. 272). HarperCollins.
(Les sciences sociales sont en train de devenir une vraie science. Et cette nouvelle vraie science va améliorer nos vies)
Il serait intéressant de continuer l’analyse pour l’Allemagne et l’Espagne, l’Italie … Des SEO locaux volontaires ?
En savoir plus :