on peut en parler ici :)
Si je résume, ces scripts permettent de faire un peu de ménage dans ses archives d’images.
jpeg-recompress peut recompresser des images sans perte de qualité perceptible. En gros il essaie plusieurs niveaux de compression JPG, mesure à chaque étape la « perte perceptible de qualité », et quand elle celle-ci est inférieure à epsilon, il valide l’image.
Je viens de l’appliquer sur les 1200 images de @visionscarto et je passe l’espace disque utilisé de 1,6 Go à 540 Mo, donc un gain des 2/3. Ca permet aussi d’optimiser les images d’un site web.
jpeg-hash appliqué à une image, renvoie un code du type 01000101000100100010111101000100101
; si deux images renvoient le même code il est possible (probable) qu’il s’agisse d’un doublon visuellement (et pas par une comparaison des fichiers eux-mêmes). Donc une bonne idée pourrait être de calculer le code de chaque image du disque dur, et de faire des listes de doublons potentiels.
jpeg-compare calcule la « distance » (visuelle, là encore) entre deux images. Si la distance est 0, on est dans le cas d’un même code de jpeg-hash. Mais avec une distance, on peut faire plus subtil et (peut-être) ordonner les images par « proximité visuelle ». Ça permettait de remettre un peu d’ordre dans des #collections de #photo, ce qui pourrait intéresser aussi @philippe_de_jonckheere et @archiloque :-) (Je n’ai pas encore essayé mais l’idée me chatouille, et si quelqu’un veut jouer je suis partant.)