• Bon, je me demande si j’ai bien tout compris de #git-annex...

    Je pensais qu’il était possible, avec git-annex assistant, c’est à dire, sans se soucier de rien (il tourne en arrière plan), de synchroniser un dossier de mon ordi avec mon disque dur externe, et d’avoir les mêmes fichiers aux deux endroits.

    Mais non, apparemment, le disque dur externe est utilisé comme « transfer repository », et permet « juste » de synchroniser mon ordi avec, disons, un autre ordi au bureau, en utilisant le disque dur externe comme intermédiaire. Mais sur celui-ci, pas de trace directe des fichiers en question, juste des fichiers abscons (qui sont apparemment ce que contiennent les répertoires .git/ : branches/, hooks/, info/, logs/, ...)

    Du coup, c’est beaucoup moins tentant, puisque ça fait de l’espace perdu. J’aimerais voir mes photos aussi sur ce disque dur externe.

    Ou est-ce que je me suis planté dans la configuration ?

    • Les manipulations (les mêmes opérations peuvent se faire avec un disque distant par SSH)

      créer un dépôt sur la clé USB

      1. créer un dépôt avec la webapp git-annex assistant sur mon ordi (/home/severo/gitannex/test/) et déposer les fichiers que je veux synchroniser
      2. sur la clé USB, cloner le dépôt

      cd /media/USB/gitannex/
      git clone /home/severo/gitannex/test/

      3. dans la webapp git-annex assistant, ajouter un nouveau dépôt USB, en pointant vers /media/USB/gitannex/test/ et accepter d’utiliser le dépôt existant (qu’on a créé à l’étape 2.)

      MAJ du dépôt sur la clé USB

      Maintenant, tout fichier ajouté dans le répertoire local sera envoyé directement (grâce au démon git-annex assistant) vers la clé USB. MAIS il n’apparaîtra pas dans le système de fichiers, c’est seulement le répertoire .git qui sera mis à jour. Pour MAJ aussi la copie de travail, il faudra synchroniser manuellement :

      cd /media/USB/gitannex/test/
      git annex sync

      MAJ du dépôt local après ajout d’un fichier sur la clé USB

      Dans l’autre sens, pour ajouter un fichier sur la clé USB, et la voir synchronisée sur mon disque local :
      0. la copie du nouveau fichier sur la clé USB

      cp nouveaufichier /media/USB/gitannex/test/

      1. la prise en compte du fichier par git-annex
      cd /media/USB/gitannex/test/
      git annex add /media/USB/gitannex/test/nouveaufichier

      2. la synchronisation
      git annex sync

      C’est alors, seulement, que le fichier sera rapatrié sur le disque dur par le démon git-annex assistant.

      À noter : pour savoir quels sont les fichiers de la clé USB non gérés par git-annex, il suffit de faire

      cd /media/USB/gitannex/test/
      git annex status

      et les fichiers non gérés sont affichés avec un point d’interrogation
      ? tmp.txt
    • J’ai tenté la même manip, en changeant le mode « external drive » par « local repo », mais avec les mêmes résultats : la synchro n’est automatique que sur 1 seule des deux copies. Sur l’autre il faut faire explicitement sync (et même sync --content si on tourne sans l’assistant et si j’en crois http://git-annex.branchable.com/sync).

      J’ai aussi essayé en passant les deux repos en mode direct ; c’est à mon sens plus joli (notamment on peut supprimer tout le répertoire .git/ sans perdre ses fichiers) ; ça n’a rien changé au problème.

    • Perso je stocke toutes mes photos (40 000 à ce jour) sur #flickr, avec un script que j’ai développé pour l’occasion. Elles sont presque toutes en mode “privé”. Un second script me permet de retélécharger soit tout (pour avoir une copie locale), soit par album, par tag, etc.

      Mais il faut qu’il identifie un peu plus précisément son besoin : archivage, classement, partage ?

      Aussi, Flickr ne permet d’héberger que des JPEG, pas de RAW, enfin je crois.

    • J’avais répondu à l’ami (on parle de 4To de données, sous forme de fichiers #RAW) :

      4TB probably forces you to have multiple hard drives, any of which will fail at any moment.

      Maybe your best software bet is to use #git-annex assistant.
      http://git-annex.branchable.com/assistant

      see the video, it shows how it works: it manages your files and puts them in several places of your choice, according to certain rules (for example, have at least 2 copies of each file in different locations). It’s all free software and there are no tricks, so if for some reason it’s broken, your files will still be available by other means.

      Then you’ll have to do some maths to know how much it’s going to cost.

      If you have your own hard drives, you must set them up with #RAID, and an off-site #backup, which means you need at least 500€ of hard drives. You’ll have to replace them once in a while, because they fail. Also, add in electricity :^)

      In the cloud:

      – If you use #Gandi_Simple_Hosting, you’ll need 4 instances that each costs 186,52 €/month

      – With #OVH_Cloud_storage ( http://www.ovh.com/fr/cloud/stockage ), you’ll pay something like 360€/month.

      – If you choose #Amazon_S3 to store the data, it will cost about the same: 440$/month.

      – A much better option financially is to store your data on #Amazon_Glacier ; it will cost you “only” 44$/month ( http://aws.amazon.com/fr/s3/pricing ); it’s probably an excellent option for backup, but you have to know that it is very slow when you need to retrieve a file.

      Also, if you want to share files with people, or look at your photos through a website, you’ll probably need another system, just for that. This system would only need to have the database of your files, and thumbnail images, and know how to communicate with the large storages. This, in terms of hosting, is cheap. But it will need a little programming.

    • Finally I decided for this options:
      – 2 hard disks 2,5 inches of 2TB each usb3 always with me when I travel. I found a really cheap offer less of 200€ for the couple.
      – When my wallet will be ready around 300/500 € I’ll install my NAS 4HD with a proper Raid system inside a friend’s web-farm.

      After many investigations I decided for these indepenpent solutions. My archive is made up 95% by RAW files.

    • Coucou, alors de mon coté :

      j’ai entre 5TO et 6TO de donnés photos à gerer ( des raws en particulier )

      – sur ma machine de retouche, j’ai 6TO en raid que je sauvegarde sur un Drobo en FW 800 toute les semaines .

      – je sauvegarde les 6TO sur amazon glacier avec le logiciel Arq sur macosx . Amazon glacier ne coute quasi rien par rapport aux autres solutions mais c’est du stockage lent . Il faut faire fondre la sauvegarde pour recuperer les fichiers.

      – je sauvegarde certaines series sur photoshelter et sur flickr .