Présentation détaillée de la démarche et des #outils utilisés #text-mining.
(avec une grosse étape manuelle d’identification et de #codage des noms)
Les armes informatiques de l’opération #OffshoreLeaks - Sciences et Avenir
▻http://sciencesetavenir.nouvelobs.com/decryptage/20130412.OBS7813/les-armes-informatiques-de-l-operation-offshoreleaks.htm
Problème : cette manne d’informations, si sensible que le ministre français du Budget a demandé à la presse de les transmettre à la justice (ce que Le Monde a refusé de faire), s’est avérée d’abord très difficile à exploiter, car trop massive, disparate et pas structurée. L’ICIJ a donc décidé de s’équiper de plusieurs logiciels, certains fournis gratuitement par des éditeurs, d’autres développés en interne spécialement pour le projet. Une véritablement machinerie informatique destinée à traiter et explorer une masse inédite de documentation.