Martin

Jeux vidéo et trucs divers

  • Un dessin vaut mille mots ?

    Spin Visualizer Spin Visualizer – Petit Nuage
    http://petitnuage.fr/?attachment_id=4299

    C’est en 2007 que j’ai développé mon outil de content spinning :

    Content spinning : génération automatique de texte
    http://unearaigneeauplafond.fr/story-teller-un-generateur-dhistoires-semi-automatique

    Cependant, après de nombreux essais, je me suis aperçu que le principe, se basant sur le parcours aléatoire d’une suite d’expressions, éventuelles imbriquées les unes dans les autres, posait un problème. En effet, pour « garantir » une originalité suffisante d’un « bon spin », il fallait y consacrer plus d’efforts de préparation que l’écriture directe manuelle d’autant de versions, d’autant qu’en l’absence d’outils d’aide à la rédaction de ce type de textes, il est peu aisé de rédiger un spin dépourvu de fautes, qu’il s’agisse de majuscules omises, de virgules manquantes, de raccords étonnants, d’erreurs d’accords et autres problèmes réclamant de toutes façons une relecture manuelle, suivie de correctifs, augmentant de ce fait de manière non négligeable le coût de production via cette technique.

    J’avais alors essayé des extensions, comme des macros, mais l’essai pratique avec un autre utilisateur m’a vite découragé : tout ce qui n’était pas évident était ignoré. Le but effectivement recherché par les rédacteurs de spins n’est pas d’améliorer la qualité, mais d’augmenter la quantité, le tout en produisant un contenu suffisant pour déjouer les filtres anti-contenu dupliqué des moteurs de recherche, et surtout pas plus. Il va de soi que l’économie exigée par les utilisateurs de cette technique exclue tout suivi lié au devenir des textes ainsi mis en ligne, et exclue toute étude d’impact.

    En effet, ce que retient la plupart des spammeurs, c’est qu’ils peuvent produire des millions de textes à peu de frais, tous différents, et ce même si en réalité, en en produisant autant, seul un mot diffère dans tout le texte, et que le paradoxe des anniversaires fait que même avec 365 versions d’une même expression, il suffit d’à peine 23 versions pour dépasser 50 % de chances de voir la même expression ressortir deux fois, ou encore d’à peine 57 versions pour dépasser 99 % de chances de duplication avérée. Or, un « bon spin » ne propose jamais autant de variantes d’une même expression, alors que chaque nouvelle expression augmente les chances de repérage de ses consœurs issues d’un même corps de texte principal.

    Beaucoup considèrent qu’il est impossible de repérer du « spin de qualité ». À croire qu’ils n’ont jamais utilisé Google Actualités, un service capable de rassembler, automatiquement, des textes portant sur le même sujet, même si les contenus sont issus de sites indépendants, rédigés par des journalistes différents, et expriment des opinions parfois opposées. Mais il existe des outils autrement plus simples pour repérer le spin, comme repérer les liens promus (directs et indirects), dont leurs textes d’ancres, ou encore tout bêtement de compter le nombre de paragraphes des textes aux champs lexicaux similaires, le nombre de phrases par paragraphe, le nombre de mots par phrase, et ainsi de suite. Ce ne sont donc pas les moyens — évidents — qui manquent pour repérer — pour éventuellement pénaliser — du contenu dupliqué dans le fond, de par une forme très similaire.

    Bref, personnellement, dans le cadre du référencement naturel, je me sers avant tout du spinning pour ajouter de la variété aux textes que je retouche à la main, notamment dans le cadre de la diffusion de communiqués de presse :

    Chaîne de production des communiqués de presse
    http://petitnuage.fr/referencement-web/seo-methodologie-communique-presse-4179

    En effet, paraphraser un même texte original en de nombreuses versions à la main engendre des duplicatas involontaires du fait de l’absence de variété dans l’inspiration de l’acte de réécriture. Le content spinning est donc intéressant pour ajouter la variété nécessaire aux textes sources avant l’acte de réécriture, qui va au-delà du remplacement de mots ou de phrases, allant habituellement à la permutation des paragraphes — avec les conséquences de sens qui s’y rapportent —, voire au changement de structure du texte, de l’argumentaire, des exemples.

    Enfin, le content spinning est une forme d’écriture automatique parmi d’autres. Il existe de plus en plus de filières universitaires partout dans le monde qui cherchent à faire acquérir une double formation de journaliste et d’informaticien, notamment dans le cadre de l’écriture, à savoir dans la forme des informations présentées.

    Il existe toute une littérature sur les commentaires sportifs, ciblant les événements locaux, tel le rapport d’un match entre deux écoles de quartier rapporté dans l’édition locale d’un village, qui ne pourraient être rédigés à la main du fait de la très faible audience ciblée.

    À y regarder de plus près, les sites de la presse nationale préparent dans des temps records des articles sur des événements a priori imprévisibles, et pourtant alimentés en continu d’informations en temps-réel, puisés habituellement dans les dépêches d’agences, automatiquement, parfois accompagnés de commentaires de journalistes de la rédaction, voire même de commentaires de lecteurs préalablement filtrés, automatiquement ou non.

    Ceci pour dire que le content spinning s’inscrit dans cette voie, sans toutefois apparaître comme une solution ultime. Pour autant, le développement d’outils d’aide à la rédaction, ou encore de visualisation, présente un intérêt économique pertinent.

    Alors comme ça, tu t’intéresses au content spinning ?
    https://labs.petitnuage.fr/storyteller/cache/201107/spin-81e55b2a5276ce5f0ffe85b02dcd4050971a2526.svg

    #outil #développement #content_spinning #journalisme #presse #rédaction #écriture #automatisation #seo #spam