#spam_web

  • Computer-Generated Articles Are Gaining Traction
    http://www.nytimes.com/2011/09/11/business/computer-generated-articles-are-gaining-traction.html

    In five years, a computer program will win a Pulitzer Prize — and I’ll be damned if it’s not our technology.

    L’un des fondateurs de Narrative Science espère ainsi que son bébé — un générateur automatique de contenu — recevra le Prix Pulitzer dès 2017. Un article de 500 mots est généré — par ordinateur — dans l’instant de la réception des données sources, facturé $10 au client. C’est plus rapide qu’un humain, a priori, mais aussi plus cher que de l’écriture off-shore. Quant à la qualité... on verra en 2017, donc.

    Le site web de la société :

    Narrative Science
    http://www.narrativescience.com

    We Turn Data Into Stories

    Narrative Science transforms data into high-quality editorial content. Our technology application generates news stories, industry reports, headlines and more — at scale and without human authoring or editing. Narratives can be created from almost any data set, be it numbers or text, structured or unstructured.

    Whether you maintain your own proprietary database, or cover subjects supported by broadly available data including public data sources, our technology cost-effectively turns facts and figures into compelling stories in real time.

    #ferme_contenu #content_farm #spam #spam_web #narrative_science #intelligence_artificielle #ia #contenu #rédactionnel #prix_pulitzer #journalisme #presse

    • C’est le problème de ce genre d’outils : ils ne font que présenter sous forme de mots des données chiffrées, ou encore reformuler ce que des humains ont écrit à la base, quitte à plagier des écrits déjà parus.

      Bref, ce n’est certainement pas avec ce type d’« intelligence artificielle » que ces gens-là vont remporter un prix de journalisme d’investigation.

      Enfin, peu importe combien il y a de PhD dans l’équipe, ça reste du spam web comme beaucoup d’autres solutions existantes par ailleurs.


  • Le spam web souffre d’encore plus d’amateurisme que le spam mail.

    À l’instant, je viens de voir une tentative (échouée) de spam de commentaires sur l’un de mes blogs personnels assez grotesque. Mon blog ne publie que des commentaires en « nofollow », donc ne transmettant aucune visibilité aux liens figurant dans les commentaires. Certains spammeurs sont pourtant convaincus du contraire. Soit.

    Ce spammeur publie donc un lien... cassé. Oui, l’URL est cassée par un saut à la ligne intempestif, du fait du spammeur seul, rendant l’interprétation du lien impossible. « Heureusement » pour lui (est-ce voulu ?), le site destination rattrape son erreur via une « redirection 301 » (suivie par les moteurs de recherche, mais avec « perte de jus »). La cible du lien ? Un autre commentaire de spam, lui aussi « nofollow ». La cible du lien de ce nouveau commentaire ? Une page facebook individuelle. Je soupçonne soit une tentative manuelle et maladroite de diffamation, avec usurpation d’identité, la même IP soumettant des commentaires aux contenus douteux et insistant avec lourdeur sur des informations personnelles (nom, prénom, âge, etc.)

    On n’en parle pas assez, mais le spam web coûte une fortune aux webmasters. Il existe bien des solutions anti-spam (et Akismet en fait partie), mais elles engendrent tout de même des coûts, que ce soit en abonnement (Akismet est payant, sauf utilisation personnelle sur une plateforme dépourvue de publicités et tout autre aspect commercial ou promotionnel), ou en repêchage de faux positifs et faux négatifs, nécessairement manuel, donc très coûteux en temps).

    #eréputation-personal_branding-diffamation #spam-web-akismet #spam-web-coût #seo-301 #seo-nofollow