« Il n’est pas normal que tout site Web avec une nouvelle idée se trouve à la merci de Google Search »

/vie-en-ligne-il-n-est-pas-normal-que-to

  • Vie en ligne : « Il n’est pas normal que tout site Web avec une nouvelle idée se trouve à la merci de Google Search »
    https://www.lemonde.fr/idees/article/2020/11/07/vie-en-ligne-il-n-est-pas-normal-que-tout-site-web-avec-une-nouvelle-idee-se

    Le professeur de communication Charles Cuvelliez et le cryptographe Jean-Jacques Quisquater expliquent, dans une tribune au « Monde », comment Google est parvenu à protéger de toute concurrence son moteur de recherche.

    Tribune. Dans son combat contre les GAFA (Google, Apple, Facebook, Amazon), le ministère américain de la justice a décidé de cibler Google Search, le moteur de recherche de la firme de Mountain View. Le rapport de la commission antitrust du Congrès américain lui en donne les clés, à savoir pourquoi aucun concurrent à Google ne verra jamais le jour sans un coup de pouce réglementaire ?

    La commission distingue deux types de moteurs de recherche : horizontaux et verticaux.

    Les premiers ont une vocation généraliste.

    Les seconds sont spécialisés : ils ne cherchent que dans une catégorie donnée de contenu, comme des images (Dreamstime), le transport aérien et les voyages (Expedia). Les moteurs de recherche monétisent leur service par le placement de publicité. Ils ne facturent pas l’utilisateur. Google est leader sur les moteurs horizontaux, avec 81 % de parts de marché sur les ordinateurs et 91 % sur les mobiles. Bing, le moteur de Microsoft, n’a que 6 % de parts de marché, Yahoo 3 % et Duckduckgo 1 % aux Etats-Unis.

    Le fonctionnement d’un moteur de recherche comprend trois activités distinctes.

    Il y a d’abord le crawl : parcourir Internet avec un robot pour collecter une copie de toutes les pages Web qu’il peut trouver. Puis ce matériel est indexé et organisé en une carte géante consultable en temps réel. Enfin vient l’indexation qui consiste à organiser l’information dans un format adéquat et dans des bases de données pour la dernière étape : la réponse aux requêtes des utilisateurs, de manière pertinente. Ces dernières ne sont que la pointe visible de l’iceberg.
    Article réservé à nos abonnés Lire aussi Concurrence : « Ni Apple ni Google n’avaient besoin de ces comportements prédateurs »

    L’indexation a un coût plus élevé et exige une infrastructure importante. C’est tout Internet ou quasiment qui s’y retrouve. Google a été le premier à l’indexer en entier. Son algorithme, PageRank, le lui impose : plus il cherche, plus les résultats sont adaptés. PageRank part du principe que les liens dans une page Web vers un autre site Web sont le meilleur critère pour détecter le contenu le plus pertinent.

    Retour de la pertinence

    Qui mieux que celui qui a conçu le site A et y a placé des liens vers le site B peut identifier que le site B a le contenu en adéquation par rapport à ce qu’il annonce sur son propre site ? C’est bien plus efficace que de répertorier indépendamment le site A et le site B et de les indexer. Google Search a donc intérêt à naviguer toujours plus dans tout Internet en suivant les renvois de site en site.

    Jusqu’ici, rien de grave : c’est l’avantage du premier arrivé sur le marché avec une innovation. Mais les grands sites Web ne se laissent plus indexer par n’importe qui. Se faire palper par trop de robots, c’est du trafic inutile, sauf si c’est celui de Google que tout le monde consulte. Bonne chance alors à un nouveau venu avec son moteur de recherche et ses robots, qui seront bloqués !

    C’est à un point tel que Yahoo et Duckduckgo sont obligés d’acheter un accès à l’index de Google. Seuls Bing, le moteur de recherche de Microsoft, a aussi l’index de tout Internet (mais sa taille est trois à cinq fois moins grande).

    Un second avantage concurrentiel irrattrapable par la concurrence, c’est la manière dont les usagers réagissent à la présentation des résultats de Google Search, sur quels liens ils ont cliqué. C’est un précieux retour de la pertinence des résultats présentés par Google. Il l’utilise ensuite dans son algorithme. C’est encore plus vrai pour les requêtes les plus rares. Savoir que ce lien-là est pertinent pour cette recherche si particulière et y laisser s’engouffrer PageRank pour collecter de là encore plus de contenu spécialisé, voilà un autre secret de la performance de Google.
    Google paie Apple

    Un troisième avantage concurrentiel est le placement par défaut du moteur de recherche de Google, tant dans Android que chez Apple !

    Pour le premier, c’est une condition pour placer les autres outils de Google si prisés (Gmail, Youtube).

    Quant à Apple, Google lui paie 12 milliards de dollars (environ 10,15 milliards d’euros) pour qu’il soit le moteur de recherche par défaut, une preuve s’il en est de l’avantage stratégique d’être pré-installé. Apple a accéléré le développement de son propre moteur de recherche pour n’être pas emporté dans la tourmente des poursuites du ministère américain de la justice.

    Google Chrome, le navigateur, propose bien évidemment Google Search par défaut. Ce dernier incite en plus l’utilisateur à installer Google Chrome. Il a 51 % de parts de marché. Safari, le navigateur d’Apple, aussi avec Google Search par défaut, occupe 31 % de parts de marché. Il ne reste plus grand-chose.

    Le quatrième défi qui se poserait aux audacieux concurrents de Google Search concerne les petits plus que ce dernier offre désormais à la présentation des résultats. Ce sont les cartes qui sont proposées quand on tape une adresse, la présentation de la fréquentation du magasin qu’on cherchait, les images, un cadre explicatif sur la droite de l’écran à propos d’une ville, de l’organisme qu’on recherche, les réponses rapides à des questions pratiques sans devoir cliquer sur rien (une perte de trafic pour le site dont le contenu a été emprunté à cet effet) : un nouvel entrant aurait du pain sur la planche pour répéter tout cela.

    Pénalité

    Comme l’a montré la commission antitrust du Congrès américain, le salut ne viendra pas des moteurs de recherche verticaux. Ils ont besoin d’un accès à des données et à des ressources spécialisées, comme les données de vols pour les sites de réservation de voyages ou de billets d’avion. Les moteurs de recherche basés sur des recommandations ont, eux, besoin des interactions des usagers. En revanche, ils ne doivent pas indexer le Web. Mais ces moteurs doivent attirer des utilisateurs qui les trouvent par… Google Search.

    Ces moteurs de recherche verticaux ont avoué à la commission dépendre de Google pour 80 % à 95 % de leur trafic. Yelp, spécialisé dans la recherche locale, avait vu son contenu aspiré par Google pour son nouveau service vertical « Google Local ». Yelp a demandé à Google de retirer son contenu, mais Google lui a répondu que le seul moyen était de délister Yelp.

    Des documents ont prouvé que Google ajustait son algorithme de recherche de façon à privilégier ses propres services verticaux qu’il a commencé à développer dès 2005. Il avait identifié que la relation à long terme que ces sites pouvaient créer avec les utilisateurs allait le priver de trafic sur le long terme, même si sur le court terme, c’était l’inverse.

    L’algorithme de Google impose même une pénalité aux sites dits « de mauvaise qualité », comme, par hasard, le site de Kelkoo. Comme le disait un témoin, il n’est pas normal que tout nouveau site Web avec une nouvelle idée qui aurait réussi aux premiers temps d’Internet se trouve à la merci de Google Search qui peut le délister sous un quelconque prétexte et le copier sans même chercher à atteindre la même qualité. La moitié des clicks dans Google Search atterrirait sur des sites de… Google.

    Charles Cuvelliez (Professeur à l’Ecole polytechnique de l’université libre de Bruxelles) et Jean-Jacques Quisquater (Professeur à l’Ecole polytechnique de Louvain, université de Louvain et au Massachusetts Institute of Technology)

    #Apple #Google #Microsoft #Altaba/Yahoo ! #DoJ #DuckDuckGo #Bing #Expedia #Gmail #GoogleSearch #Kelkoo #Yelp #YouTube #Android #Chrome #PageRank #Safari #domination #algorithme (...)

    ##Altaba/Yahoo_ ! ##bot