Martin

Jeux vidéo et trucs divers

  • Y’a pas à dire, Google Suggest est une vraie arme de manipulation des masses, particulièrement néfaste à l’e-réputation :

    Martine à la plage : le feuilleton de l’été
    http://reflets.info/martine-a-la-plage-le-feuilleton-de-l%e2%80%99ete

    Je veux dire... Est-il vraiment algorithmiquement difficile d’éviter d’associer des termes injurieux envers des personnalités publiques ? En quoi est-il pertinent et informatif de conserver « aubry alcoolique » dans les suggestions de recherche de Google Suggest ? Parce que mine de rien, personne ou presque ne va creuser la question, alors que cette suggestion fait boule de neige.

    Alors ici, je réagis sur Martine Aubry, la star du moment, après l’expression de son opinion sur les réseaux sociaux et ses utilisateurs. Mais on peut rebondir sur d’autres personnalités politiques, tel Dominique de Villepin, dont l’une des premières suggestions de recherche, lorsque vous tapez « villepin » (suivi d’un espace) dans la barre de recherche de Google, est « villepin femme », suivie de « villepin divorce », avec pour premier résultat de recherche temps-réel « Dominique De Villepin se fait larguer par sa femme ! »

    Le pire ?

    Le pire, c’est que je crains que mon petit billet ici va conforter Google dans ses choix, à savoir qu’aux yeux de ces algorithmes douteux qui ignorent le respect des personnes, « lire » ces expressions risque de le conforter dans l’idée que, statistiquement parlant, ces requêtes ont du « sens ».

    Bon, je veux bien qu’on parle de liberté d’expression et que l’on lutte contre la censure, mais sérieusement, les robots ont-ils droit à la liberté d’expression ? Pour autant que je me souvienne, il n’existe pas encore de Déclaration Universelle des Droits du Robot. Il faudrait que je révise un peu mes cours d’Astro le Petit Robot, tiens (on a la culture qu’on a) :

    Astro, le petit robot
    http://fr.wikipedia.org/wiki/Astro,_le_petit_robot
    Tobio est recueilli par un savant, le professeur Ochanomizu, qui le prend sous son aile et décide de faire de lui un super-héros, renommé Astro, qui combattra pour la paix, la justice et la tolérance dans un monde où les robots sont souvent objets de discrimination par les humains.

    #google #google_suggest #astro #dessin_animé #culture #politique #martine_aubry #dominique_de_villepin #eréputation #abus #algorithme #liberté_d_expression #censure

    • Alors, première suggestion :

      – christine lagarde -> lesbienne
      – dominique strauss-kahn -> viol (juif vient après)
      – martin korolczuk -> rien
      – stéphane bortzmeyer -> cv (c’est mon employeur qui va être content)
      – jean-luc mélenchon -> blog (puis wikipédia, puis juif)
      – nicolas sarkozy -> agressé (puis facebook puis taille)
      – françois fillon -> wikipédia (gay en troisième position).
      – frédéric lefebvre -> zadig
      – claude guéant -> wiki (juif est quatrième)
      – marine le pen -> sondage (puis nu, sans e)

      Internet, c’est vraiment n’importe quoi.

    • Je me suis fait la remarque il y a peu : alors que l’année dernière, le fait de taper Sarkozy, Nagui ou DSK faisait systématiquement apparaître la suggestion Google « juif », ces mots ont désormais été détrônés par d’autres, beaucoup plus anecdotiques :
      – Sarkozy (agressé, bousculé, juif, agrippé).
      – DSK (porsche, news, alibi, complot). Le mot « porsche » avait suffi à chasser le mot « juif » quelque jours avant l’affaire Sofitel
      – Nagui (wiki, juif, biographie, europe 1, fam)

      La première fois que j’ai constaté le phénomène, j’avais trouvé que les mots suggérés étaient particulièrement « anecoditiques » au point que l’idée qu’ils soient fréquemment cherchés semblait étrange (j’étais tombé sur un Sarkozy Sarlat en première suggestion, ou un truc du genre)

      N’est-il pas possible d’orienter les suggestions de google avec un Google Bombing similaire à celui du « trou du cul du web » de 2007 (http://www.generation-nt.com/google-bombing-sarkozy-actualite-841481.html) ?

    • @fil C’est bien la lecture de cet article de Reflets (indiqué en référence plus haut) qui m’a fait réagir. Je ne suis pas particulièrement l’eréputation des personnalités, mais il existe des outils de suivi et d’alerte qui permettent de repérer ce genre de suggestions, que cela soit dans Google, Bing, Yahoo ! ou ailleurs.

      J’en profite pour remarquer que si Google semble le plus touché du trio de tête (et, compte tenu de ses parts de marché en France, dépassant 90 % du marché de la recherche, en particulier si l’on compte ses affiliés), Yahoo ! pose aussi un problème de diffamation dès les résultats de recherche suggérés, mais que Bing échappe à cette mode, j’ignore cependant si cela vient du fait que Bing ait mis un filtre sur ses algorithmes, ou bien s’il s’agit d’un moteur épargné par l’« attaque ».

      @stephane Le mojo de Google, « Don’t be evil », semble totalement omettre l’idée que les gens, eux, le sont, vils. Et il suffit d’une minorité de personnes pour manipuler les suggestions de recherche de Google, qui se défend derrière la popularité de ces recherches et un choix objectif et algorithmique des résultats.

      Pourtant, en informatique, on m’a appris dès l’école à ne pas faire confiance dans les données obtenues de tiers, et à en vérifier la pertinence. Sous prétexte que les tiers soient nombreux, les données deviennent fiables et ne réclament aucun filtre ? Pourtant, ce sont bel et bien les employés de Google qui écrivent les algorithmes, à savoir en définissent les règles. Plutôt que d’ajouter des algorithmes additionnels pour protéger l’individu, Google a pris la décision d’en faire l’économie. Ce serait « Don’t be evil », cette approche ?

      Il est intéressant que Google défende davantage les intérêts commerciaux des majors en censurant désormais les suggestions automatiques liées au piratage des œuvres culturelles — comme quoi c’est techniquement possible —, mais en omettant de protéger la réputation des individus.

      @wardlittell Google a longtemps ignoré le phénomène de Google Bombing, pour finir par mettre un algorithme le rendant plus difficile. Mais Google fait habituellement trop confiance aux textes figurant sur la partie cliquable des liens (le « texte d’ancre de lien »). Or, ces textes sont fournis par des tiers : les webmasters, blogueurs, forumeurs, et j’en passe.

      http://petitnuage.fr/referencement-web/influence-texte-ancre-liens-positionnement-4253
      En référencement naturel, on considère que les liens externes sont essentiels à un bon positionnement sur les moteurs de recherche. Parmi les critères figurent la diversité de ces liens, et le texte d’ancre.

      Ainsi, pour faire grimper une page dans les résultats de recherche sur la requête « trou du cul du web », il « suffit » de publier un grand nombre de liens vers cette page portant le texte « trou du cul du web ». Si l’absence de cette expression rend le positionnement difficile, l’absence de toute concurrence — du moins préalable — facilite la manœuvre.

      Attention toutefois, la jurisprudence rend l’auteur d’un lien juridiquement responsable, comme nous l’apprend l’affaire NRJ contre Europe 2 :

      http://owni.fr/2010/07/23/la-marais-noire-du-web-submerge-la-hadopi
      En septembre 2001, Marie-Françoise Marais condamna, en appel, Europe 2 à 500.000 francs de dommages et intérêts, plus 100.000 francs pour l’insertion de sa décision dans deux journaux, au motif que “la mention “anti-NRJ” reproduite par la société Europe 2 Communication sur son site constituait un acte de contrefaçon de marque (et) de concurrence déloyale” dans la mesure où “la création de ce lien procède d’une démarche délibérée et malicieuse, entreprise en toute connaissance de cause“.

      Pour ce qui est de la manipulation de Google Suggest, elle n’est guère plus difficile. Il suffit qu’un grand nombre (tout est relatif) d’Internautes (ou de robots se passant pour tels) tapote une requête équivalente dans la barre de recherche, puis clique sur l’un des résultats obtenus. Par « grand nombre », je parle d’environ 100 individus. C’est à la portée de tout Internaute doté d’amis, ou astucieux, ou prêt à dépenser une somme folle, à savoir... 5 € :

      Comment faire du Negative SEO qui fonctionne, en 9 minutes
      http://www.deliciouscadaver.com/comment-definitivement-pourrir-la-e-reputation-de-quelquun-pour-5e
      Voici donc la marche à suivre :

      1) Ouvrez un compte sur Amazon Mechanical Turk

      2) Créez un HIT qui consiste à faire taper votre recherche sur Google.fr en langue FR et à cliquer sur le premier résultat (très important, plusieurs expériences l’ont montré).

      3) Consacrez un budget de 5$ (100 hits à 0,05$ ou moins si vous êtes pingre). Le HIT est accompli en quelques minutes.

      4) Laissez mijoter 1 mois ou beaucoup moins si le nombre de recherche est élevé (pour la suggestion de la photo de ben laden mort, c’était au bout de quelques heures).

      5) Ouvrez le four et sortez-en votre suggest modifié

      Notons qu’Amazon Mechanical Turk désapprouve ce type de procédés. Mais ce n’est pas non plus le seul service du genre (bien que le plus populaire de la place).

      En revanche, les parades contre ce genre d’attaques sont peu évidentes à mettre en place. En effet, il faudrait faire de même avec d’autres requêtes, et de préférence de manière pro-active. Une fois que l’attaque concurrente a donné ses fruits, il faut intensifier la démarche préventive, dans l’espoir que celle-ci s’avère plus puissante, et surtout, s’armer de patience.

      Discuter avec Google est difficile : il se retranche derrière ses algorithmes, comme s’il s’agissait d’une justification légitime. Les résultats en justice contre Google au sujet de Google Suggest sont habituellement très longues, très coûteuses et présentent des résultats tout à fait incertains.

      Bon, je râle, mais en fait, ce genre de situations permet de développer un nouveau marché, celui de l’e-réputation en général et du personal branding en particulier. Je fais une partie de mon chiffre d’affaires là dessus. Pour autant, ça me révolte. Plutôt que de gagner sa vie à faire des choses réellement utiles, positives, bref, construire quelque chose qui sert, on en vient à lutter contre les effets pervers et parasites de technologies pourries à la base, qui n’ont que peu de valeur ajoutée, présentent des failles patentes, et qui présentent des effets particulièrement indésirables. Pas très constructif, ni glorifiant. :-(