Conversion mediawiki
De April MediaWiki
Aller à la navigationAller à la recherche
Bienvenue sur une page | ||
du groupe de travail Site Web |
Export du contenu du wiki en html
Lorsqu'un document est rédigé sur le wiki, il est souvent nécessaire, une fois la rédaction terminée, de le transférer sur le site principal géré par Drupal. Nous cherchons donc un convertisseur pour exporter une page de ce wiki vers un code html très classique, ne contenant que les balises les plus standards comme <p>, <h1>, <ul>, <ol>, <li>, <hr>, <table>, etc.
Tâche suivie sur Redmine : Tâche n°330
Méthode manuelle avec OpenOffice
- Copier le contenu (pas la table des matière ni les bandeaux : ça fait des tableaux inamovibles).
- Nettoyer les « [modifier] » ; pour cela :
- en sélectionner un (avec l'espace à droite),
- faire <ctrl> + f,
- vérifier que la case « remplacer par » est vide, cliquer sur « tout remplacer ».
- Enregistrer sous : document HTML (.html). Attention : ne pas faire « exporter » mais « enregistrer sous » (le filtre d'export n'est pas le même).
Problèmes : Les codes html sont en majuscules.
Méthodes scriptées
Voici quelques programmes permettant un export :
mediawiki vers LaTeX
mediawiki vers PDF
mediawiki vers HTML
- Module Mediawiki DumpHTML Permet de faire une dump du wiki avec images et fichiers...
- Mediawiki2HTML API java pour une conversion wikipedia -> HTML. Sous licence Eclipse.
- wikicloth. D'après ce que j'ai pu lire, il implémente des choses que l'on ne trouve pas ailleurs comme des tableaux [1]. C'est une bibliothèque en ruby, licence MIT.
- Script sed rudimentaire pour la conversion wiki->html : Conversion wiki vers html avec sed. Voir aussi comment intégrer un script dans Gedit.
Solution retenue
Autre
- Alternative parsers Longue liste de parsers...