schema.org - Getting Started http://schema.org/docs/gs.html...

/19902

  • http://googlewebmastercentral.blogspot.com/2011/06/introducing-schemaorg-search-engines.html

    Today we’re announcing schema.org, a new initiative from Google, Bing and Yahoo! to create and support a common set of schemas for structured data markup on web pages. Schema.org aims to be a one stop resource for webmasters looking to add markup to their pages to help search engines better understand their websites.

    Bon, alors, deux questions :

    1) Est-ce que c’est un concurrent de Dublin Core ? Si oui, est-ce mieux ou moins bien ?

    2) Dois-je modifier mon blog de suite pour utiliser ce truc ?

    #schema.org #DublinCore

    • C’est une initiative qui a déjà fait couler beaucoup de pixels. Un nouvelle épisode de la bataille pour choisir un format pour ajouter de la sémantique aux contenus Web. Schématiquement, il y a trois écoles :
      - RDF et sa déclinaison RDFa (défendus entre autres par le W3C). Très complet, extensible, mais peut-être un peu complexe à mettre en œuvre. Facebook l’utilise pour son Open Graph, ce qui a contribué à le démocratiser ;
      - les micro-formats, très simples, qui rajoutent des informations sémantiques via l’attribut class ;
      - micro-data introduit sauf erreur de ma part par le WHATWG dans le cadre des travaux sur HTML5. C’est censé être une solution plus complète que les micro-formats mais moins complexes que RDF ;

      Jusqu’à présent, les moteurs n’avaient pas d’avis très tranché sur la question. Google indiquait dans sa doc utiliser partiellement chacun des trois, je ne sais pas ce qu’il en est de Microsoft (Yahoo ne compte plus puisqu’il est allié à Microsoft).

      Avec schema.org, les trois moteurs disent deux choses :
      - désormais, on utilisera les informations exprimées avec micro-data ;
      - on a créé entre nous un vocabulaire, et c’est celui-là qu’on utilisera ;

      Donc :

      1) au sens où c’est un vocabulaire, ça peut être vu comme une alternative à DC (et également à FOAF, etc). Meilleure ou moins bonne, ça dépend de ton besoin. C’est moins complet que DC. Donc si tu as besoin de toutes les subtilités de DC, schema.org sera moins bon. Par contre si tu es perdu dans la jungle des propriétés de DC, schema.org est plus simple donc peut-être meilleur de ce point de vue ;

      2) je ne crois pas que les trois formats soient mutuellement exclusifs, ils peuvent cohabiter. Donc rien ne t’empêche d’ajouter des micro-datas sur ton blog.

      Et pour donner un avis personnel (je suis pour ma part partisan de RDFa, parce que j’ai suffisamment de culture informatique pour me dépatouiller avec, et que c’est le plus puisant), cela ressemble un peu à un putch des moteurs : en décidant de supporter essentiellement les micro-datas, ils assassinent les deux autres formats : pour être correctement référencés, les sites vont suivre et délaisser RDFa et les micro-formats. Et ils ont décidé à deux et demi du vocabulaire, alors que RDF permettait d’utiliser n’importe quelle ontologie (les évolutions de RDF lui-même étant gérées par le W3C, donc un collectif) et que les micro-formats étaient une œuvre relativement communautaire. La prochaine étape, en extrapolant, c’est Google et Microsoft qui décident des évolutions de HTML, puisqu’ils ont via leurs moteurs et navigateurs respectifs les moyens d’imposer ce qu’ils veulent. Entre l’attaque contre RDF, et le risque de duopole, je suis plutôt circonspect.

    • micro-data, micro-format et RDFa servent à mettre de la sémantique dans du HTML. Ton flux est un document XML utilisant trois espaces de nom : ATOM, DC et HTML. Il n’est donc pas concerné. Par contre, tu peux utiliser RDFa, les micro-data ou les micro-formats dans la maquette des pages HTML de ton blog pour marquer sémantiquement leurs éléments.
      Pour ce qui est de la simplicité de DC, elle est relative lorsqu’on commence à entrer dans les raffinements du « Qualified Dublin Core » qui permet de préciser les éléments de base.