Il y a un peu plus de 3 ans, un organisme pour lequel je travaille (cf. infra …) insiste pour que je fasse passer une batterie d’exercices, sorte de test de niveau pour valider les prérequis qui étaient demandés pour une formation « avancée » (sur Excel).
Je cherche un exemple de données publiques et retient l’excellente base de données sur les #mass_killings réalisée par USA Today après le massacre de Newtownn dont je vois d’ailleurs qu’elle est toujours maintenue à jour.
Accès ici, en forme narrative longue avec visualisations très bien faites et un lien quelque part vers les données
▻http://www.gannett-cdn.com/GDContent/mass-killings/index.html
Je monte donc un cas complet qui intégre une phase de préparation des données, du recodage, des comptages et leur représentation graphique et culmine avec une dernière question optionnelle pour réaliser une jointure entre tables (ça c’est pour moi, pour avoir une idée du niveau des participants et pour ces derniers pour qu’ils aient un aperçu du genre de trucs qu’on va faire).
J’avais un peu hésité pour le choix du sujet, mais au vu de l’évolution de mes relations avec cet organisme, à la suite d’un changement de direction, j’avais fini par le retenir.
Comme je m’y attendais un peu, l’organisme n’a jamais diffusé ce cas (un fichier Excel). Pour une fois que je proposais une réponse à la sempiternelle question de la validation des prérequis d’une formation… Nos relations ont donc continuer à se dégrader et six mois plus tard, l’organisme, avec lequel je travaillais depuis plus de 30 ans, cessait de faire appel à mes services. Entre autres, pour pouvoir mieux se développer sur la data science (en français dans le texte).