Voici un squelette que je viens de me bidouiller pour récupérer le contenu d’un blog #Wordpress dans #SPIP. Pas envie d’y passer ma vie, accès limités aux serveurs… bref j’ai fait ça rapidement et ça m’a suffit. Je viens de récupérer 800 billets d’un Wordpress (hébergé chez Wordpress, d’ailleurs) à partir de l’export en XML, aspiré le logo de chacun et ça fonctionne.
Comme je n’ai rigoureusement aucune expérience de Wordpress, je ne sais pas si c’est générique, je sais que ça ne reprend aucune structure (ni mots-clés, ni « rubriques ») mais bon : #çamsuffit et je te file le code si ça peut te servir.
Le mode d’emploi est dans le début du code. Principalement : il faut installer le plugin « sale » de SPIP :
▻http://plugins.spip.net/sale.html
dans lequel il faut modifier le fichier plugin.xml pour lui dire qu’il fonctionne avec SPIP 3. Et dans le fichier « wordpress.date.xml », il faut faire deux chercher-remplacer rudimentaires, parce que je ne sais pas comment accéder à des nœuds XML nommés avec des deux-points.
#CACHE{0}
[(#REM)
# Convertir une sauvegarde Wordpress vers SPIP
#
# activer le plugin «sale» de SPIP (si nécessaire, modifier les limites dans plugin.xml pour l'activer)
#
# dans "wordpress.xml"
# remplacer "content:encoded" par "contentencoded"
# et "wp:post_date" par "wp_post_date"
#
# renseigner #SET{fichier}
# renseigner #SET{id_rubrique} (la rubrique SPIP qui accueille les billets Wordpress)
#
# parcourir une première fois (via les liens de pagination)
# ce qui provoque le chargement des images distantes
# puis passer #SET{mysql,oui}
# et reparcourir la pagination - cette fois tout est en base et les images sont copiées
]
#SET{fichier,wordpress.2013-12-28.xml}
#SET{id_rubrique,48}
#SET{mysql,non}
#SET{reg_img, src=\"(.*)(\?w=[0-9]+)?\"}
#SET{reg_caption, caption=\"(.*)(\?w=[0-9]+)?\"}
#SET{reg_vides,\\[\-\>.*\\]}
<B_cite>
#PAGINATION
<ul>
<BOUCLE_cite(DATA)
{source xml, #GET{fichier}}
{datapath channel/0}
{cle==item}
{pagination 50}
>
<li>
<h2>[(#VALEUR{0/title/0}|typo)]</h2>
<h4>[(#VALEUR{0/wp_post_date/0}|affdate)]</h4>
[(#SET{logo,[(#VALEUR{0/contentencoded/0}|sale|match{#GET{reg_img}, Uims, 1}|copie_locale)]})]
[(#SET{term,[(#GET{logo}|match{(jpg|png|gif)$, "",1}]})]
<br>
[(#VALEUR{0/contentencoded/0}|sale|match{#GET{reg_caption}, Uims, 1})]
[(#VALEUR{0/contentencoded/0}
|replace{"<span .*>", "", Uims}
|replace{"</span>", "", Uims}
|replace{"<(strong|em)><(strong|em)>","<\1> <\2>"}
|replace{"<(strong|em)><(strong|em)>","<\1> <\2>"}
|replace{"</(strong|em)></(strong|em)>","</\1> </\2>"}
|replace{"</(strong|em)></(strong|em)>","</\1> </\2>"}
|sale
|replace{"<img.*>","", Uims}|strip_tags
|replace{#GET{reg_vides},""}
|replace{\\[caption.*\\],"",Uims}
|replace{\\[\/caption\\],""}
|propre
)]
[(#GET{mysql}|=={oui}|oui)
<?php
$id_article = sql_insertq("spip_articles",
array(
"titre" => "[(#VALEUR{0/title/0}|replace{'"','\"'})]",
"id_rubrique" => #GET{id_rubrique},
"texte" => "[(#VALEUR{0/contentencoded/0}
|replace{"<span .*>", "", Uims}
|replace{"</span>", "", Uims}
|replace{"<(strong|em)><(strong|em)>","<\1> <\2>"}
|replace{"<(strong|em)><(strong|em)>","<\1> <\2>"}
|replace{"</(strong|em)></(strong|em)>","</\1> </\2>"}
|replace{"</(strong|em)></(strong|em)>","</\1> </\2>"}
|sale
|replace{"<img.*>","", Uims}|strip_tags
|replace{#GET{reg_vides},""}
|replace{\\[caption.*\\],"",Uims}
|replace{\\[\/caption\\],""}
|replace{'"','\"'}
)]",
"statut" => "publie",
"date" => "[(#VALEUR{0/wp_post_date/0})]"
)
);
copy("#GET{logo}", "IMG/arton$id_article.#GET{term}");
?>
]
</li>
</BOUCLE_cite>
</ul>
hop, xml est fait ▻http://zone.spip.org/trac/spip-zone/changeset/79860
« Cache-ton-cash.com », un site contre les sociétés écrans - Libération
▻http://ecrans.liberation.fr/ecrans/2013/11/13/cache-ton-cachecom-un-site-contre-les-societes-ecrans_946790?xtor=
« Armes, drogue, diamants, êtres humains - peu importe votre business, nous vous aidons à blanchir vos profits. Créez votre société en quelques clics », clame un site internet clinquant baptisé cache-ton-cash.com. « Promotion dictateurs » corrompus, oppresseurs et tyrans, bénéficiez de 25% de réduction avec le code promo « klepto25 », « offre spéciale trafiquants de drogue, 10% de réduction avec le code promo "10grammes" », parodie l’organisation non gouvernementale internationale One qui, lorsqu’on clique sur « j’en profite », propose plutôt de signer un « appel aux dirigeants européens pour lutter contre ces sociétés ».
#économie
#ONG
#Cache-ton-cache.com
#Royaume-Uni, #Stash-the-cash.com. « Créer une #société-écran est un jeu d’enfant, plus facile que de refaire son permis de conduire ou de créer un #compte-en-banque
#Frontex, cache-misère des échecs de la #politique_migratoire européenne ?
Lampedusa, élue plus belle plage du monde par les internautes, est devenue synonyme de honte européenne. Cette petite île italienne symbolise l’échec collectif européen tant sur le plan humanitaire que politique et éthique. Un échec trop facilement attribué à Frontex, l’agence européenne qui est censée coordonner les opérations des gardes-frontières des 28 Etats-membres, mais qui, faute de moyens et de compétences suffisantes est devenue le #cache-misère des échecs de la politique migratoire européenne.
▻http://www.lemonde.fr/idees/article/2013/10/22/frontex-cache-misere-des-echecs-de-la-politique-migratoire-europeenne_350080
Quelques ajouts de doc pour #SPIP pour la prochaine #gazette
En français :
– _INC_DISTANT_MAX_SIZE ici ▻http://www.spip.net/fr_article5633.html
– _DATA_SOURCE_MAX_SIZE ici ▻http://www.spip.net/fr_article5634.html
– _SPIP_SELECT_RUBRIQUES ici ▻http://www.spip.net/fr_article5659.html
En espagnol :
– #CACHE ici ▻http://www.spip.net/es_article4705.html
à compléter au fur et à mesure via commentaire
à rappeler que les notifications de publication passent par la liste spip-trad
on ajoute :
– _RECHERCHE_MIN_CAR : ▻http://www.spip.net/fr_article5660.html
L’appel « Touche pas à ma #pute » humilie les #femmes
▻http://lemonde.fr/idees/article/2013/10/29/l-appel-touche-pas-a-ma-pute-humilie-les-femmes_3504547_3232.html
« Touche pas à ma pute », tel est l’intitulé d’une pétition qui sera publiée dans Causeur de novembre. Elle est le porte-étendard du « Manifeste des 343 salauds ». Voilà un acte militant inédit : les hommes n’avouent pas aisément fréquenter les putes. Et se préoccupent plus d’utiliser ces dames que de les défendre.
Dans le manifeste « Touche pas à ma pute », les signataires eux, ont choisi le terme de « salaud » par référence aux « salopes » de 1971. C’est là que je m’interroge. Quelle filiation peut-il bien y avoir entre nous, les « salopes » qui réclamions la liberté interdite de disposer de notre corps, et ces « salauds » qui réclament aujourd’hui la liberté de disposer contre rémunération et sans pénalité du corps de certaines femmes ? Dans le premier cas, il s’agit de lever une oppression, dans le second, de la reconduire. Et ce au nom du même concept : la liberté. Où est la faille ?
@vanso, comme d’hab, tu vas sur google, tu tapes le titre de l’article, Google News te le propose, et quand tu viens de là, lemonde.fr te donne gentillement l’article en entier.
Révélé dans Libération hier soir :
▻http://www.liberation.fr/societe/2013/10/29/343-salauds-clament-leur-droit-a-leur-pute_943288
Point de vue de prostituée :
►http://www.lexpress.fr/actualite/manifeste-des-343-salauds-l-abjection-n-a-plus-de-limites_1295514.html
Point de vue d’hommes zéro macho :
►http://zeromacho.wordpress.com/2013/10/30/1881-hommes-contre-la-prostitution
Publication anticipée du « manifeste » dans Causeur :
▻http://www.causeur.fr/touche-pas-a-ma-pute,24765
Les 343 salauds ne sont finalement que 19…
Renewed clashes between India and Pakistan in disputed Kashmir - World Socialist Web Site
▻http://www.wsws.org/en/articles/2013/08/16/indpak-a16.html
Renewed clashes between India and Pakistan in disputed Kashmir
By Sampath Perera
16 August 2013
Relations between India and Pakistan have again been plunged into crisis, with intensifying tensions along the Line of Control (LoC), which divides disputed Kashmir between Indian and Pakistani-controlled sectors, following the killing of five Indian soldiers last week.
Filesystem #cache for #Drupal
▻http://zzz.rezo.net/Filesystem-cache-for-Drupal.html
This is a drop-in replacement for Drupal 6’s cache system. We avoid a lot of problems by using a filesystem-cache in lieu of the classic database-cache.
j’ai mis un peu de #mémoization #SPIP dans Drupal, ça dégage les bronches…
twitter/twemcache · GitHub
▻https://github.com/twitter/twemcache
Twemcache (pronounced "two-em-#cache") is the Twitter Memcached. Twemcache is based on a fork of Memcached v.1.4.4 that has been heavily modified to make to suitable for the large scale production environment at Twitter.
#Memcached est bugué depuis un moment et provoque des erreurs avec #memoization pour #SPIP (pas trop grave on peut basculer sur #xcache). Aujourd’hui j’apprends par @korben qu’il est troué ▻http://korben.info/faille-memcached-exploit.html mais on peut le remplacer par ce fork des gens de twitter.
#server #memcache
Arf @seenthis semble avoir des problèmes avec l’import de mon flux rss delicious...
Voilà le bug que j’avais sur ubuntu 64bits :
▻https://bugs.php.net/bug.php?id=59410
Depuis je n’ai jamais retesté, mais je n’ai pas l’impression que le bug ait été corrigé à ce que je lis dans le forum associé au ticket cité.
ps : merci pour le bug seenthis, ça à l’air d’être un endroit sympa ce paradis des #seethis_corrigé :p
Héberger des vidéos sur son propre serveur... sans le tuer
►http://sebsauvage.net/rhaa/index.php?2012/10/03/12/07/39-heberger-des-videos-sur-son-propre-serveur-sans-le-tuer
Héberger soi-même des vidéos pose des problèmes épineux :
– cela consomme votre bande passante vitesse grand V ;
– certains hébergeurs vous factureront chèrement les dépassements, d’autres couperont tout simplement votre site.
Si votre vidéo devient populaire, vous aurez des problèmes de débit (votre hébergeur peinant à servir la vidéo à tout le monde). Vous n’avez pas les CDN de YouTube pour répartir la vidéo sur différents serveurs dans le monde. Et vous n’avez probablement pas les moyens de vous payer des CDN Akamai.
Enfin il faut que vous gériez vous-même la compatibilité entre navigateurs : utilisation du tag video d’HTML5 ou non, codecs vidéo supportés... avouez, c’est chiant.
J’ai fini par trouver une solution très simple et qui ne tue pas votre serveur.
En revanche :
►http://wiki.coralcdn.org/wiki.php?n=Main.FAQ#install
Because of bandwidth overuse, we temporarily capped off Coral to disallow transfers of files greater than 50 MB.
Donc pas idéal pour de la vidéo, justement.
Et impossibilité d’utiliser le curseur de positionnement dans la vidéo.
Et ça c’est très très chiant !
Solution du dino intégriste : écrire des textes au lieu de filmer un sujet sans intérêt pendant dix minutes. Mort aux webinars et autres « cours en ligne ».
Bien d’accord avec Stéphane ! La vidéo c’est une perte de temps et c’est souvent sans intérêt...
Mais héberger ses vidéos ne concerne pas seulement les films pédagogiques ou geek mais les courts métrages, reportages, performances ou que-sais-je.
@Baroug OK, on ne garde que les vidéos vraiment intéressantes, où la vidéo apporte un plus. Ça divise déjà le problème par vingt :-)
Sinon y’a toujours la solution trouvée par Wikipedia, du torrent en temps réel via un plugin, SwarmPlayer. Mais je trouve peu de documentation sur le sujet…
cf. ►http://atelier.mediaslibres.lautre.net/article/wikipedia-revolutionne-le.html
à propos de webisation et de torrent, un bon débat a lieu
►https://gnuzer.legtux.org/reponse-a-sebsauvage
Les webseeds ont l’air d’être une bonne solution... mais vu que personne ne l’utilise c’est qu’il doit y avoir un hic quelque part
Bonjour
La solution coral/cache fonctionne t elle pour un direct live, pour lequel la limite de 50 mo n’aurait pas d’importance ?
Sinon je potasse les solutions P2P vidéo (pour envoyer du flux), s’il y a des amateurs pour partager les recherches et les trouvailles, je suis preneur.
Yves
A bientôt.
#FUKUSHIMA : qu’est ce qui se passe encore ?
►http://goo.gl/8YYe3
Quelque #chose de #cachée par les #médias, les #politiques et #Tepco (propriétaire du #nucléaire de Fukushima)
Les différences entre « cacher » et « Halal »
►http://www.jforum.fr/forum/france/article/cacher-halal-les-differences
Le débat sur le Halal, qui veut viser les musulmans en priorité est aussi une arme contre les Juifs. En visant l’interdiction entre autres de l’abatage rituel des musulmans, c’est aussi celui l’abatage rituel des juifs que l’on vise. A court terme la production de viande cacher pourrait être interdite.
800.000 Cachemiriens affectés par le stress post-traumatique
►http://ipsnouvelles.be/news.php?idnews=10969
En octobre 2011, une étude menée par le Sher-e-Kashmir Institute of Medical Sciences (SKIMS) a révélé que 55 % de la population du Cachemire souffrent de différents types de troubles mentaux.
En se basant sur une étude, le psychiatre Mushtaq Margoob affirme que 58 % des Cachemiriens ont été confrontés à des incidents traumatisants et que 800.000 habitants de la vallée souffrent aujourd’hui de TSPT.
Arshad Hussain, psychiatre local, a souligné que le fait d’assister continuellement à des événements traumatisants tels que des morts de cause non naturelle, des explosions, des tirs d’armes à feu et autres incidents violents, nuit gravement à la santé mentale de la population.
Le nombre de patients pour le seul hôpital psychiatrique du Cachemire est passé de 1.200 en 1989 à 100.000 en 2011. Le département de psychiatrie des patients en consultation externe de l’hôpital Shri Maharaja Hari Singh à Srinagar, qui a été créé en 2008, admet en moyenne 150 à 200 patients par jour, dont la plupart sont de jeunes enfants.
Caching and the #Google_AJAX_Libraries — statichtml.com
►http://statichtml.com/2011/google-ajax-libraries-caching.html
using #Google ’s #CDN to load #jQuery isn’t likely to benefit the majority of your first-time visitors. You’re almost certainly better off bundling jQuery up with the rest of your site’s JavaScript and making sure you’re serving long-lived #cache controlling headers with it.
Sur la plupart de mes sites sous #SPIP, je tourne avec l’excellent plugin #Job_queue :
►http://plugins.spip.net/queue.html
Ça permet entre autres choses de faire tourner l’autre excellent plugin #Cache_cool :
►http://www.spip-contrib.net/Cache-Cool,3251
Mais mais mais, régulièrement : j’ai les statistiques qui se déconnectent. Sur un site qui utilise des classements par popularité, c’est un peu chiant.
Ce que je constate alors, c’est qu’en passant par phpMyAdmin, je vois que la table « spip_jobs » affiche un taux énorme de « perte » (jamais trop su ce que c’était précisément). Du coup : je demande à « réparer cette table », et tout rentre dans l’ordre progressivement.
(Hé, je te donne une astuce qui tue : si tu décides à l’installation de remplacer le préfixe « spip_ » par « steve_ », tu obtiens une table mySQL « steve_jobs ». C’est pas la grande classe internationale ? - #merci_arno.)
MAJ : @fil dit qu’il suffit de mettre à jour le plugin qu’avait une couille.
Et pour les webmestres bénévoles au chômage c’est pas_de ? (ok je ->[ ] )
et pour le site de Zahia Dehar, ce sera « blow » ?
@allergie, attends-moi j’arrive !
The dead begin to speak up in India | Arundhati Roy | Comment is free | guardian.co.uk
►http://www.guardian.co.uk/commentisfree/libertycentral/2011/sep/30/kashmir-india-unmarked-graves
At about 3am, on 23 September, within hours of his arrival at the Delhi airport, the US radio-journalist David Barsamian was deported. This dangerous man, who produces independent, free-to-air programmes for public radio, has been visiting India for 40 years, doing such dangerous things as learning Urdu and playing the sitar.
Barsamian has published book-length interviews with public intellectuals such as Edward Said, Noam Chomsky, Howard Zinn, Ejaz Ahmed and Tariq Ali (he even makes an appearance as a young, bell-bottom-wearing interviewer in Peter Wintonick’s documentary film on Chomsky and Edward Herman’s book Manufacturing Consent).
La guerre rend-elle les femmes plus fortes ? (Countercurrents) par Mushtaq Ul Haq Ahmad Sikander
►http://www.legrandsoir.info/la-guerre-rend-elle-les-femmes-plus-fortes.html
C’est ainsi que le conflit a permis aux femmes d’endosser de nouveaux rôles assortis de leurs problèmes et responsabilités spécifiques et ce faisant les femmes se sont révélées êtres des océans de courage et de sacrifice qui font tout ce qui est exigé d’elles sans perdre le sourire. Mais par ailleurs le conflit a eu aussi des effets négatifs sur les femmes en les rendant plus vulnérables à diverses attaques où leurs droits sont violés en toute impunité.
On s’aperçoit surtout à lecture de ce texte que la situation des #femmes au #Cachemire est peu enviable !
Twitter / zeroload : @nhoizey Ah, alors sur un ...
►https://twitter.com/zeroload/statuses/94015641232748544
sur un F5, toutes tes ressources démarrent avec « Cache-Control : max-age=0 » c’est le comportement donc 304 partout
#webperf #test #méthodologie #f5 #reload #Firefox #max-age #Cache-Control #cache #navigateur
Depuis la semaine dernière, déménagement de Flip-Zone sur un nouveau serveur. La vitesse de consultation devient spectaculaire.
Cela s’est traduit immédiatement par un nombre de pages vues en très nette augmentation. Quasiment 50% sur Flip-Zone et près du double sur Lebanese-Fashion.
On m’a suggéré récemment un cron sur un nombre significatif de pages, depuis différents serveurs... C’est débile ou il y a de l’idée ?
@fil Oui, je fais ça et, oui, ça prend parfois des semaines pour obtenir une mise à jour. Là, l’idée c’est que je constate du jour au lendemain une très forte augmentation du nombre de pages vues par visites, donc il y a bien eu un impact quelque part.
@suske Il n’y a pas grand intérêt à mesurer la « vitesse » des pages d’un site dans l’absolu. Flip-Zone a des pages « lourdes », parce qu’elles contiennent beaucoup de choses (animation Flash tourne-pages) et que, d’après les stats, les utilisatrices passent beaucoup de temps à consulter une même page. Pour moi, la seule chose qui soit mesurable, c’est de mesurer un changement par rapport à « avant », et surtout du comportement des utilisatrices. Et là, dans tous les cas, il y a une forte dose de pifomètre (et, au final, les boîtes pour qui ça compte fortement ne mesure rien dans l’absolu : elles font des test A/B pour voir quelle solution est la plus efficace).
Pour faire des tests de perfs côté front, je recommande vivement ►http://webpagetest.org #webperf
Sinon, tu as déjà réussi à utiliser les fonctionnalités ESI ?
►http://www.varnish-cache.org/trac/wiki/ESIfeatures
Parce que je pensais : si on parvient à utiliser ESI, il sera très facile de faire placer des ordres d’insertion ESI directement par microcache. Et avec ton #purge, même récupérer ma fonctionnalité d’effacement du microcache.
Puis... tester pour voir si ça a le moindre intérêt en terme de performances.
la technique de posterous semble correspondre à ton cas
►http://technology.posterous.com/making-posterous-faster-with-varnish
Les différentes méthodes de #Cache pour #SPIP - Episode II - #Nursit le blog
►http://blog.nursit.net/Les-differentes-methodes-de-Cache.html
Voilà qui me rassure : tout correspond à ce qu’on pouvait attendre ; seule petite surprise, memcache qui se trouve être plus lent que filecache. Mais peut-être que ces tests ont été faits sur une machine pas trop chargée par ailleurs, avec des I/O libres de répondre vite.
WordPress › W3 Total Cache « WordPress Plugins
►http://wordpress.org/extend/plugins/w3-total-cache
#cache #compression #optimization #spip
Rrhaaaa, la description est affreusement commerciale !
« At least 10x improvement in overall site performance »
Ça veut dire quoi ?
"Improve conversion rates and « site performance » which affect your site’s rank on Google.com"
En quoi le « conversion rate » et le « site performance » affecte ton classement Google ?
« Reduced page load time : increased visitor time on site (visitors view more pages) »
Oui mais non. L’impact de la vitesse de chargement pour les visiteurs ne change pas le nombre de pages qu’il visitent.
« Up to 80% bandwidth savings via minify and HTTP compression »
Oui, mais comme le gros est dans les images, personne ne gagne évidemment jamais 80% de bande passante.
L’idée c’est que si ton site rame, les gens se lassent un peu plus vite et achètent encore moins ; quant à google il a laissé entendre que la rapidité du site serait prochainement l’un de ses 100 ou 500 critères de ranking. 10x plus vite, ça veut dire que sans cache c’est terrrrriblement lent.