closeCet article a été publié il y a 1 an 9 mois 8 jours, il est donc possible qu’il ne soit plus à jour. Les informations proposées sont donc peut-être expirées.

Les français trahissent-ils leur intention de vote au travers des recherches qu’ils effectuent sur Google ? C’est ce que j’ai voulu vérifier à six semaines d’une échéance électorale importante. Au travers de cet article, je vous expliquerai la démarche adoptée pour vérifier cette hypothèse.

« Google Tendance des Recherches », est un outil gratuit en ligne qui permet à ses utilisateurs de comparer pour une ou plusieurs expressions de recherche, l’évolution des index de volume de recherches dans Google. Cette application est principalement utilisée par les professionnels pour l’optimisation du référencement naturel (SEO), et pour les études de marché. C’est cet outil que j’ai utilisé pour connaitre les tendances de recherche des français.

Pour réaliser mon expérience, j’ai choisit des expressions de recherche qui soient discriminantes des autres recherches sur le nom du candidat et l’échéance électorale et de même poids pour chacun des candidats :

  • « sarkozy 2012 »
  • « hollande 2012 »
  • « le pen 2012 »
  • « bayrou 2012 »
  • « mélenchon 2012 »

 

Le choix des candidats s’est fait sur leur popularité et leur représentativité de l’éventail politique français :

Echantillonage des candidats à l'élection présidentielle.

Une fois les expressions de recherche introduites dans l’outil, celui-ci nous donne beaucoup d’informations intéressantes, et notamment ce graphique :

On peut voir ici, l’évolution des index de volume de recherche pour chacun des candidats sur les douze derniers mois. On constate à ce stade trois éléments qui vont dans le sens de mon hypothèse :

  • Le volume de recherches augmente significativement au fur et à mesure que l’on se rapproche de l’échéance électorale.
  •  Les dates fortes de la campagne impactent positivement le volume de recherche (meeting du Bourget de Hollande le 22 janvier, meeting de Villepinte de Sarkozy le 12 mars). On déduit de ce premier constat, que les expressions de recherche qui ont été adoptées pour cette expérience sont en corrélation avec les pics d’exposition médiatique des candidats à l’élection présidentielle.
  •  Si l’on compare l’ordre des candidats dans les sondages d’opinion et dans le volume de recherches, on s’aperçoit qu’il est très proche.

Pour aller plus loin, je me suis intéressé aux index de volume de recherches des candidats pour chacune des régions de France. Pour obtenir depuis ces données locales, des résultats nationaux de bonne qualité, j’ai pondéré chaque résultat régional par son nombre d’habitant divisé par le nombre total d’habitant des régions représentées.

 

J’ai ensuite comparé ce résultat à la moyenne des résultats de plusieurs sondages publiés dans le courant du mois de mars.

 

 

Le résultat est impressionnant, puisque l’écart moyen entre les deux procédés est de 2,98% avec un écart-type relativement faible. La principale différence que l’on constate est au niveau du candidat Hollande dont l’écart entre mes résultats et ceux des sondages atteint quasiment 7 points. En revanche, si je n’applique pas ma méthode de pondération en fonction du nombre d’habitant de chaque région, j’obtiens un écart moyen entre les deux procédés de 2,2% et un écart-type nul. Cependant, cela ne prouve pas que la méthode soit plus fiable sans pondération. Un certain nombre de biais sont introduits par ma méthode (voir ci-dessous), mais les résultats restent intéressant à observer.

 

 

Biais possibles :

  • La population des internautes n’est représentative en volume, que de 70 à 80% de la population française. Certains biais comme l’âge moyen, le niveau d’étude ou la catégorie socioprofessionnelle peuvent-être introduits au regard de la population française.
  • L’abstentionnisme générationnel n’est pas pris en compte.
  • Absence de données pour les DOM, TOM et la Corse.
  • Biais qualitatif de l’hypothèse : « Les français trahissent-ils leur intention de vote au travers des recherches qu’ils effectuent sur Google ». Le volume des recherches effectuées sur un candidat (en quantité) est-il explicatif de l’intention de vote (en qualité) ?
  • L’ensemble des résultats régionaux ont été pondérées par le nombre d’habitants de chaque région. Cela introduit un biais de non-discrimination du taux régional d’habitants votants (nombre d’habitants votants / nombre d’habitants total).
  • Google n’est pas le seul point d’entrée sur l’information relative aux candidats présidentiels.