tbn

récoltes et semailles

  • Twitter vient d’annoncer qu’il mettait en place une #indexation précise de tous nos tweets depuis la création du réseau social en 2006. https://blog.twitter.com/2014/building-a-complete-tweet-index

    Comme l’explique le Washington Post, « un tweet de 2006 peut sembler techniquement accessible, mais il est enterré sous 8 ans de sédiments numériques, des milliers voire des dizaines de milliers de tweets, qui apparaissent du plus récent au plus ancien, fossilisant les plus vieux tweets, les rendant inaccessibles dans les résultats de recherche ». Et le journal explique qu’avant, on pouvait se dire que ce genre de recherche fonctionnait comme un droit à l’oubli : le tweet existait, mais il n’était pas indexé.

    « A l’origine, Twitter a construit son outil de recherche pour fournir un accès rapide à ce que les gens tweetent en ce moment, pas à ce qu’ils ont tweeté par le passé », raconte le site WIRED. Des premières versions ont déjà été lancées en 2012 et 2013, mais l’outil de recherche est désormais complet. Selon l’entreprise, la recherche inclut désormais « près de 1.000 milliards de documents, est 100 fois plus grand que l’outil de recherche en temps réel, et grandit de plusieurs milliards de tweets par semaine ».

    (…) De plus, Twitter a expliqué que « l’indexation complète est un investissement d’#infrastructure majeur et fait partie d’améliorations à venir dans la recherche et l’expérience de découverte sur Twitter ». Des outils extérieur comme le site Topsy vont pouvoir affiner leurs résultats de recherche. Reste à savoir jusqu’où « l’expérience » va aller.

    http://www.slate.fr/story/94829/twitter-vieux-tweets-recherche

    #archivage #archives #index #twitter #data via @opironet

    Twitter Engineering sur Twitter
    https://twitter.com/TwitterEng/status/534763087757189120

    Un des responsables du projet : https://twitter.com/yz