Entendu hier au Rendez-vous du groupe Méthodes et Logiciels de la Société française de statistique (SFdS) sur les Données massives
►http://www.sfds.asso.fr/323-Rendez_vous_SFdS_Methodes_et_Logiciels
Lors de la dernière intervention, non technique, de Joannès Vermorel de Lokad (voir ▻http://www.lokad.com/presskit)
(retranscription perso, pas forcément au mot à mot)
• L’objectif du #Big_data c’est la mécanisation de la réflexion intellectuelle , sortir l’humain de la boucle. En clair, virer des gens.
• Big , c’est relatif. Aujourd’hui, les vraiment gros jeux de données se trouvent dans la téléphonie mobile et certaines applications Web (Amazon, Google,…) Dans la grande distribution, l’historique des ventes (au niveau des tickets de caisse) tient sans problème sur une clé USB, à condition que le stockage de l’information soit optimisé (ex. la quantité achetée est massivement 1, il est très inefficace d’utiliser les formats d’entier standard). Dans ce ças, ça tient sans problème sur une station à 10 k€, ce qui est beaucoup moins cher que le simple coût de la configuration de Hadoop, le hype du moment.
• Considérer ses projets en mode fail fast . Si on n’arrive pas rapidement, inutile de s’acharner, arrêter rapidement et passer à autre chose.
Par ailleurs, pour compléter le portrait de J. Vermorel (voir notice dans le lien ci-dessus), il est enseignant à l’ENS et y tient un rôle d’évangéliste. Cf. son interview par Microsoft…
Interview de Joannès Vermorel | Microsoft Education
▻http://www.microsoft.com/france/education/superieur-et-recherche/enseignant-informatique/interviews/joannes-vermorel.aspx
Notamment, un certain nombre d’étudiants ont reconnu qu’en tant que « pro-Linux », ils avaient beaucoup de doutes au départ sur la pertinence de ce choix pédagogique, mais qu’au final, ils avaient découvert une profondeur dans les technologies Microsoft qu’ils ne suspectaient absolument pas.