« Outils de traduction - 2e partie » : différence entre les versions
Ligne 66 : | Ligne 66 : | ||
:''Il arrive qu'une même opération puisse être faite de différentes manières. Les méthodes qui utilisent des scripts sont les plus efficaces pour un travail de routine, même si leur mise en place semble un peu compliquée (branche Git supplémentaire, configuration).'' | :''Il arrive qu'une même opération puisse être faite de différentes manières. Les méthodes qui utilisent des scripts sont les plus efficaces pour un travail de routine, même si leur mise en place semble un peu compliquée (branche Git supplémentaire, configuration).'' | ||
==Mise en place des outils== | ==Mise en place des outils== | ||
Ligne 222 : | Ligne 224 : | ||
cp config.mk ~/GNU/www/server/gnun/ | cp config.mk ~/GNU/www/server/gnun/ | ||
</pre> | </pre> | ||
==Les cinq étapes d'une mise à jour== | ==Les cinq étapes d'une mise à jour== |
Version du 12 mars 2015 à 20:23
- Cette page sert de référence aux quelques personnes qui s'occupent de mettre à jour les traductions françaises sur www.gnu.org, mais n'est absolument pas indispensable pour contribuer aux traductions.
Cette page présente un contenu en cours de réalisation.
Si vous souhaitez participer, n'hésitez pas à laisser votre avis sur la page de discussion en suivant au mieux ces recommandations.
Introduction
Le site gnu.org contient des centaines de pages dont certaines sont traduites en 25 langues. Beaucoup d'entre elles sont fréquemment remaniées, les traductions doivent donc être mises à jour. Pour faciliter cette opération, les développeurs de gnu.org ont écrit un ensemble de scripts connu sous le nom de GNUnited Nations (GNUN), qui fait appel à plusieurs autres programmes. La maintenance des fichiers se fait à l'aide de systèmes de contrôle de version : CVS pour le site lui-même (dépôt www) et Git pour les traductions en français (dépôt www-fr).
Le circuit de mise à jour des traductions est résumé par le schéma suivant, adapté du manuel de GNUN :
+-------------+ +---------------+ | Dépôt | | Dépôt | | officiel | | officiel | | www (CVS) | | www-fr (Git) | +-------------+ +---------------+ | ^ | ^ M1 | | C2 M3 | | M5 V | V | +-------------+ +---------------+ | Dépôts | M2 | Dépôts | M4 | locaux |---->---->----| locaux |<------. | www (CVS) | | www-fr (Git) | | +-------------+ +---------------+ | ^ | | | | C1 | | | '---<----<---Coordinateur---' '---Membres---' M1 = cvs update C1 = make publish M2 = make sync C2 = cvs commit M3 = git pull M4 = git commit M5 = git push
Le travail se fait dans des copies locales de www et www-fr. Il comporte cinq étapes :
- synchroniser les copies locales de www et www-fr avec les dépôts officiels correspondants [voir schéma : M1 et M3] ;
- synchroniser www-fr avec www localement et déterminer quels fichiers PO ont besoin d'une mise à jour [M2] ;
- mettre à jour ces fichiers ;
- les valider ;
- les enregistrer dans le dépôt www-fr local [M4] et les envoyer dans le dépôt www-fr officiel [M5] (cette dernière étape demande d'avoir un compte sur Savannah - voir la Charte de trad-gnu).
Par la suite, les fichiers mis à jour seront envoyés dans le dépôt www de Savannah par le coordinateur du groupe [C1 et C2], et moins d'une heure plus tard GNUN régénèrera les pages traduites.
Le circuit des nouvelles traductions et des révisions est le même, à part que la synchronisation des dépôts n'est pas nécessaire puisque l'initiative appartient à l'équipe de traduction.
Sources d'information et de formation
- Le manuel de GNUN décrit le principe de la génération des pages traduites et détaille chaque fonction de GNUN. Ce que GNUN permet de faire, entre autres :
- valider les fichiers PO ;
- transformer les fichiers PO en pages HTML (avec le style par défaut), ce qui facilite grandement la relecture ;
- voir quelles traductions ont besoin d'une mise à jour.
- Git est ce qui risque le plus de dérouter les débutants, mais avec l'aide attentionnée et la supervision de notre coordinateur il suffit d'une semaine ou deux pour s'y mettre, foi de Mme Michu. L'essentiel de ce qu'il y a à savoir se trouve dans les trois premiers chapitres du Git Book. S'il y a un problème, quelques mots-clés dans un moteur de recherche ou un appel au secours sur la liste font merveille. Pas de panique, les erreurs sont la plupart du temps rattrapables.
Et devinez quoi... Git a des interfaces graphiques :
- Git GUI (multiplateforme) permet de faire une bonne partie des opérations. Il est couplé avec gitk.
- gitk visualise l'historique des branches, montre les différences entre fichiers et permet de faire des recherches dans l'arborescence.
- Il arrive qu'une même opération puisse être faite de différentes manières. Les méthodes qui utilisent des scripts sont les plus efficaces pour un travail de routine, même si leur mise en place semble un peu compliquée (branche Git supplémentaire, configuration).
Mise en place des outils
Clonage du dépôt Git www-fr et création d'une branche
Prérequis : git, avoir un compte sur Savannah et appartenir au groupe www-fr.
Le dépôt www-fr comprend 2 branches principales (+ éventuellement des branches perso) :
- master contient les fichiers .fr.po sur lesquels on travaille. Elle ne peut pas être supprimée.
- scripts contient quelques outils :
- transvalid-po convertit les POs en page HTML, et vérifie que leur format est correct et que le HTML est conforme aux standards du W3C. L'ensemble de ces opérations est désigné par un néologisme, « transvalidation ». Le HTML original est requis, ainsi qu'un autre fichier de la branche scripts, html5.dtd, qui provient du paquet GNUN.
- transvalid-batch fait la même chose sur une liste de POs, typiquement l'ensemble d'un commit. Une arborescence contenant les HTML originaux est requise.
- previewpo.pl (écrit par Donatas Klimašauskas) crée un HTML générique à partir d'un PO. Pas besoin de l'original.
- micro-www-checkout crée un répertoire www réduit, ne contenant que les fichiers nécessaires à la régénération de pages traduites en français par transvalid-po ou transvalid-batch.
- cvs-sync synchronise le répertoire www avec le dépôt CVS et le répertoire www-fr avec www, puis établit un rapport sur l'état des POs qui peut éventuellement être envoyé sur la liste de diffusion.
- po2pad et pad2po facilitent le passage du format PO au pad de traduction et inversement (po2pad utilise un autre fichier de la branche scripts, pad-header-gnu).
Ne pas hésiter à modifier ces scripts, à les critiquer ou à en créer de nouveaux. Ils sont là pour ça. ;-)
1. Clonage de www-fr
Créer le répertoire de travail (GNU/ par exemple) qui contiendra aussi www, et s'y placer :
mkdir -p ~/GNU && cd ~/GNU
Ensuite, on a le choix de cloner le dépôt complet ou seulement certaines branches.
- Méthode la plus simple : clonage du dépôt complet
git clone ID-SUR-SAVANNAH@git.sv.gnu.org:/srv/git/www-fr.git
- Méthode plus élaborée : clonage séparé des branches master et scripts (voir http://www.kernel.org/pub/software/scm/git/docs/git-remote.html).
Cela évite de traîner l'historique de www-fr avec les scripts, et inversement. Mais surtout, cela permet d'utiliser les scripts avec les fichiers PO sans avoir à les copier ailleurs. Il est en effet impossible d'accéder en même temps à deux branches d'un même dépôt local qui n'ont aucun fichier en commun. Les scripts peuvent être n'importe où ; en revanche, le répertoire www-fr doit avoir la même racine que www.
Pour la branche master (celle qui contient les fichiers PO) :
mkdir -p ~/www-fr && cd ~/www-fr git init git remote add -f -t master -m master origin ID-SUR-SAVANNAH@git.sv.gnu.org:/srv/git/www-fr.git git merge origin
Pour la branche scripts, c'est un peu plus compliqué car celle qu'on crée localement s'appelle master par défaut mais ne correspond pas à la branche master du dépôt distant. Si l'on veut pouvoir pousser les modifications locales, il faut la renommer ; autrement, on a une erreur assez énigmatique : « error: src refspec scripts does not match any. »
mkdir -p ~/www-fr-scripts && cd ~/www-fr-scripts git init git remote add -f -t scripts -m scripts origin ID-SUR-SAVANNAH@git.sv.gnu.org:/srv/git/www-fr.git git merge origin git branch -m master scripts
2. Configuration
Écrire dans ~/.gitconfig l'identité de celui/celle qui fait les commits. Sans l'option --global, l'information est écrite dans le fichier .git/config (l'adresse de courriel n'a pas besoin d'être valide, il faut seulement qu'elle contienne « @ ») :
~/GNU/www-fr git config --global user.name "Gribouille Tartempion" git config --global user.email gtartempion@serveur.mail
La commande ci-dessous va faciliter le travail à plusieurs :
git config branch.autosetuprebase remote
Remarque : on peut demander à Git d'ignorer certains fichiers en créant un fichier ~/.gitignore_global, ou en utilisant le fichier .git/info/exclude de chacun des dépôts locaux. L'exclusion des fichiers .html est nécessaire si l'on se sert de batch-transvalidate, qui sauvegarde les pages web traduites dans www-fr. Par exemple, le fichier exclude de www-fr pourrait contenir :
*~ *.html *.txt *.diff
3. Création d'une branche perso (optionnel)
Créer une branche « gt » synchronisée avec la branche master, et l'envoyer sur le serveur :
cd ~/GNU/www-fr git branch --set-upstream gt origin/master git config branch.autosetuprebase remote git push origin gt
Synchroniser la branche gt avec origin/master. Les modifs qui sont sur gt mais pas sur master s'ajouteront en tête de branche grâce à l'option « autosetuprebase » :
git checkout gt git pull
Installation d'une arborescence www locale
Le type d'arborescence à créer dépend de ce que l'on veut en faire.
- Installation minimum pour utiliser transvalid-batch : micro-www-checkout
Ce script télécharge les fichiers strictement nécessaires à transvalid-batch. C'est la méthode recommandée avec un SSD (disque à mémoire flash). Il est en effet très mauvais pour ce type de disque de modifier fréquemment des centaines de fichiers, ce qui arrive si l'on synchronise une arborescence www complète avec le dépôt CVS.
Les fichiers nécessaires à la mise à jour des nouvelles traductions doivent être ajoutés séparément. Le script cvs-sync s'en charge à l'étape de synchronisation (voir plus loin).
Prérequis : cvs, rsync.
cd ~/www-fr-scripts ./micro-www-checkout -l fr
- Installation complète
Pour avoir une image complète du site web (plus de 450 Mo), il faut passer par la méthode traditionnelle :
Prérequis : cvs.
mkdir -p ~/GNU && cd ~/GNU cvs -z3 -d:pserver:anonymous@cvs.savannah.gnu.org:/webcvs/www co www
Installation de GNUN (optionnelle)
Prérequis :
- une arborescence www complète (voir plus haut) ;
- make, gawk ;
- texinfo, gettext, po4a (pour la conversion HTML <--> PO) ;
- pour la validation des pages HTML : libxml2, libxml2-utils et la DTD XHTML 1.0 du W3C (paquet Debian w3c-dtd-xhtml).
Télécharger le paquet gnun-latest (ou gnun-0.9) par exemple dans $HOME, et l'extraire. On obtient le dossier gnun-0.9 :
wget ftp://ftp.gnu.org/gnu/gnun/gnun-latest.tar.gz tar xzvf gnun-latest.tar.gz
Se placer dans le dossier gnun-0.9 et préparer l'installation :
cd ~/gnun-0.9 ./configure make
Il faut éditer le fichier gnun.conf pour remplacer les adresses de courriel, afin que les tests ne soient pas envoyés aux webmasters GNU. ;-)
sed -i 's/bug-gnun@gnu.org/adresse@bidon.fr/' gnun.conf
Maintenant, on peut installer GNUnited Nations dans ~/GNU/www/server/gnun :
sudo make install
Enfin, il faut copier config.mk et GNUmakefile dans le répertoire www/server/gnun :
cp GNUmakefile ~/GNU/www/server/gnun/ cp config.mk ~/GNU/www/server/gnun/
Les cinq étapes d'une mise à jour
Synchronisation des dépôts locaux avec le dépôt www de Savannah
- À l'aide du script cvs-sync
Prérequis : cvs, git.
Ce script fait l'inventaire des PO à mettre à jour dans la foulée de la synchronisation et établit un rapport sur l'état des POs (nombre de chaînes à traduire ou « fuzzy »), qui peut éventuellement être envoyé sur la liste trad-gnu@april.org .
Si cvs-sync est dans le répertoire www-fr-scripts :
cd ~/www-fr-scripts ./cvs-sync
- Manuellement
Prérequis : cvs, git, GNUN, GNUmakefile des équipes de traduction à la racine de www-fr.
1. Synchroniser l'arborescence www locale avec le dépôt CVS de www :
cd ~/GNU/www cvs update
Remarque 1. La connexion au dépôt CVS de Savannah est quelquefois très lente et très irrégulière. Avec une arborescence www réduite (voir plus haut), il peut arriver que la synchronisation prenne 10 ou 20 minutes – ne parlons pas de l'arborescence complète. On peut alors utiliser une solution de repli plus rapide : s'abonner à la liste de diffusion www.commits@gnu.org pour être informé en temps réel des modifications des pages web et synchroniser uniquement les fichiers correspondants :
cd ~/GNU/www cvs update SECTION/po/DOCUMENT.fr.po SECTION/po/DOCUMENT.pot SECTION/DOCUMENT.html
Remarque 2. La synchronisation ne se fait bien (c'est-à-dire sans « conflit pendant la fusion ») que si les fichiers n'ont pas été modifiés localement. Si pour une raison quelconque ils l'ont été (à l'étape de validation par exemple), on peut supprimer les changements globalement :
cd ~/GNU/www cvs diff | patch -R -p0
Ou bien, si la connexion est mauvaise, on peut restreindre l'opération à un dossier particulier :
cd ~/GNU/www/DOSSIER cvs diff | patch -R -p0
2. Synchroniser localement www-fr avec www en utilisant GNUN (ne pas oublier de se placer sur la branche adéquate) :
cd ~/GNU/www-fr git checkout master make sync
Inventaire des PO à mettre à jour
- À l'aide du script cvs-sync
Prérequis : cvs, git.
L'inventaire se fait dans la foulée de la synchronisation (voir plus haut).
- À l'aide de GNUN (ne pas oublier de se placer sur la branche adéquate)
Prérequis : cvs, git, GNUN, GNUmakefile à la racine de www-fr.
cd ~/GNU/www-fr git checkout master make report
Mise à jour des PO
Il est préférable de mettre les fichiers à jour dans www-fr (voir plus loin pourquoi).
On peut utiliser un éditeur de PO ou un éditeur de texte ordinaire (voir Outils de traduction 1e partie).
Pour faciliter la relecture, on peut convertir le fichier PO en HTML générique avec previewpo.pl. Une page web plus conforme à l'original peut être régénérée avec batch-transvalidate ou en ligne (voir plus loin).
Transvalidation (génération des pages HTML et validation)
- À l'aide de transvalid-po ou transvalid-batch
Le script transvalid-po permet de régénérer une page traduite à partir du PO et de la page originale ; de plus, il vérifie que les POs sont formatés correctement et que la page traduite n'a pas d'erreur de validation XHTML. transvalid-batch fait la même chose sur une série de POs, par exemple l'ensemble des fichiers d'un commit. Une fois validés, les POs peuvent être commités dans le dépôt Git local. Les pages traduites sont enregistrées dans www-fr, mais on fait en sorte que Git les ignore (voir plus haut). L'arborescence www n'est pas modifiée.
Prérequis :
- po4a (qui dépend de gettext, perl, etc.),
- xmllint (paquet Debian libxml2-utils),
- DTD XHTML 1.0 du W3C (paquet Debian w3c-dtd-xhtml),
- html5.dtd de gnun (dans le même répertoire que batch-transvalidate).
Si batch-transvalidate est dans le répertoire www-fr-scripts :
cd ~/www-fr-scripts ./batch-transvalidate
- À l'aide d'une installation locale de GNUN
1. On met le fichier à valider DOCUMENT.fr.po dans le dossier ~/GNU/www/SECTION/po/. C'est faisable avec « make publish », mais alors tous les PO de www-fr seront reformatés et copiés dans www, même ceux qui ne sont pas encore prêts à être validés.
2. On se place dans le répertoire ~/GNU/www/server/gnun, et on demande à générer la page :
cd ~/GNU/www/server/gnun make VALIDATE=yes ../../SECTION/DOCUMENT.fr.html
Et voilà, make dit s'il y a une erreur. On peut modifier ../../SECTION/po/DOCUMENT.fr.po et régénérer la page HTML, qu'on récupère dans ~/GNU/www/SECTION/.
Remarque. Il arrive fréquemment que le fichier POT soit régénéré au cours de la validation (voir le manuel de GNUN). Cela modifie également le fichier PO (ainsi que des fichiers intermédiaires) et perturbe les synchronisations ultérieures. Il est possible de supprimer les changements comme expliqué plus haut, mais il faut évidemment que le PO mis à jour soit sauvegardé ailleurs. Il est donc recommandé de faire les mises à jour dans www-fr et de ne valider qu'une copie. De même, la page DOCUMENT.fr.html régénérée doit être sauvegardée si l'on veut s'en servir pour la relecture.
- En ligne
L'opération décrite ci-dessus peut être effectuée par GNUN, sur un serveur. Il suffit d'indiquer dans quel dossier se trouve le PO à transvalider, puis d'envoyer le fichier sur le serveur. Les erreurs éventuelles sont signalées et des liens sont disponibles pour voir la page régénérée, complètement ou sans les includes (parties qui sont les mêmes dans toutes les pages et ne font pas partie du PO).
Envoi dans le dépôt www-fr
1. Ajouter des modifications ou de nouveaux fichiers à la branche master (indexation) :
git checkout master git add fichier1 fichier2 ...
2. Enregistrer (commiter) les modifications dans le dépôt local (branche master) :
git commit -m "Message de commit" fichier1 fichier2 [...]
Les commits peuvent être regroupés logiquement, par exemple modifications d'un même type sur plusieurs fichiers.
3. Envoyer (pousser) les modifications sur le serveur :
git push
4. Éventuellement faire la liste des fichiers modifiés :
git diff --name-only master master^
5. Prévenir la liste trad-gnu en joignant la liste s'il y a beaucoup de fichiers.