Seenthis
•
 
Identifiants personnels
  • [mot de passe oublié ?]

 
RSS: Fil
tous les messages de Fil

Fil

@fil

geek — fil@rezo.net - https://twitter.com/recifs

http://rezo.net
  • Fil ☂ @fil 20/11/2010 09:53

    Browser Memento - Carnets de La Grange
    http://www.la-grange.net/2010/11/18/browser-memento

    “How many times have you been frustrated because a link you had linked to 10 years ago vanished in the zillions of dead stars of the #Web galaxy? Some experiments have been done in this field such as #HTTP #Archive system from Gerald Oskoboiny. He created a proxy on his own machine and kept a #copy of everything he was actually browsing.”

    Je préfère la méthode #proxy filtrant à celle du #browser, mais l’idée est séduisante.

    • #Gerald Oskoboiny
    Fil ☂ @fil
    • Fil ☂ @fil 20/11/2010 09:55

      On pourrait facilement conserver une version PDF de chaque page marquée sur #seenthis ; en fait hum, j’ai déjà codé ça.

      Fil ☂ @fil
    • Fil ☂ @fil 20/11/2010 10:08

      à base de #wkhtml bien sûr http://code.google.com/p/wkhtmltopdf

      Fil ☂ @fil
    • Seenthis @seenthis CC BY-NC 20/11/2010 11:19

      Ça me semble plutôt devoir être un service séparé. Dans lequel, d’ailleurs, tu pourrais balancer n’importe quel flux entrant.

      Mon gros souci immédiat, c’est de tenir la charge. Plus je mets de trucs dans Seenthis, moins j’y parviendrai avec des moyens modestes. Tant qu’on est une poignée d’utilisateurs, OK, dès que j’ouvre le truc, pfiout, server down.

      Seenthis @seenthis CC BY-NC
    • Seenthis @seenthis CC BY-NC 20/11/2010 13:23

      J’ai fait ce que je voulais faire : je récupère le contenu réel de la page (de manière « intelligente », à la façon du bouton « Lecteur » de Safari), et je le stocke. Comme ça j’ai :
      – un truc pas lourd,
      – une archive du contenu pertinent,
      – donc de quoi alimenter mon moteur de recherche de manière pertinente,
      – et au passage, la langue du lien (hreflang, pour faire plaisir aux sémiophiles).

      Seenthis @seenthis CC BY-NC
    • Fil ☂ @fil 12/06/2012 23:15

      une approche concurrente de #wkhtmltopdf est #wkpdf (http://plessl.github.com/wkpdf), qui fait grosso modo la même chose. autre possibilité, #princexml, qui permet en outre d’utiliser les CSS3 pour gérer les numéros de page et faire de « vrais » livres
      #ebooks #pdf

      • #PDF
      • #HTML
      • #HTML
      • #Mac OS X
      Fil ☂ @fil
    Écrire un commentaire

thèmes

  • #archive
  • #browser
  • #copy
  • #http
  • #proxy
  • #web

  • Person: Gerald Oskoboiny
thématisation automatique par OpenCalais
À propos de Seenthis Propriété intellectuelle Recommandations API