Outils de traduction - 2e partie

De April MediaWiki
Révision datée du 25 avril 2014 à 21:50 par Tgodefroy (discussion | contributions) (→‎Installation de GNUN (optionnelle) : GNUN en est à la version 0.8 - ajouter extension .tar.gz manquante)
Aller à la navigationAller à la recherche
Cette page sert de référence aux quelques personnes qui s'occupent de mettre à jour les traductions françaises sur www.gnu.org, mais n'est absolument pas indispensable pour contribuer aux traductions.


Retour au menu de trad-gnu


Introduction

Le site gnu.org contient des centaines de pages dont certaines sont traduites en 25 langues. Beaucoup d'entre elles sont fréquemment remaniées, les traductions doivent donc être mises à jour. Pour faciliter cette opération, les développeurs de gnu.org ont écrit un ensemble de scripts connu sous le nom de GNUnited Nations (GNUN), qui fait appel à plusieurs autres programmes. La maintenance des fichiers se fait à l'aide de systèmes de contrôle de version : CVS pour le site lui-même (dépôt www) et Git pour les traductions en français (dépôt www-fr).

Le circuit de mise à jour des traductions est résumé par le schéma suivant, adapté du manuel de GNUN :

      +-------------+              +---------------+
      |    Dépôt    |              |     Dépôt     |
      |  officiel   |              |    officiel   |
      |  www (CVS)  |              |  www-fr (Git) |
      +-------------+              +---------------+
           |   ^                         |   ^
        M1 |   | C2                   M3 |   | M5
           V   |                         V   |
      +-------------+              +---------------+
      |   Dépôts    |      M2      |     Dépôts    |   M4
      |   locaux    |---->---->----|     locaux    |<------.
      |  www (CVS)  |              |  www-fr (Git) |       |
      +-------------+              +---------------+       |
             ^                           |   |             |
             |     C1                    |   |             |
             '---<----<---Coordinateur---'   '---Membres---'

       M1 = cvs update              C1 = make publish
       M2 = make sync               C2 = cvs commit
       M3 = git pull
       M4 = git commit
       M5 = git push

Le travail se fait dans des copies locales de www et www-fr. Il comporte cinq étapes :

  1. synchroniser les copies locales de www et www-fr avec les dépôts officiels correspondants [voir schéma : M1 et M3] ;
  2. synchroniser www-fr avec www localement et déterminer quels fichiers PO ont besoin d'une mise à jour [M2] ;
  3. mettre à jour ces fichiers ;
  4. les valider ;
  5. les enregistrer dans le dépôt www-fr local [M4] et les envoyer dans le dépôt www-fr officiel [M5] (cette dernière étape demande d'avoir un compte sur Savannah - voir la Charte de trad-gnu).

Par la suite, les fichiers mis à jour seront envoyés dans le dépôt www de Savannah par le coordinateur du groupe [C1 et C2], et moins d'une heure plus tard GNUN régénèrera les pages traduites.


Le circuit des nouvelles traductions et des révisions est le même, à part que la synchronisation des dépôts n'est pas nécessaire puisque l'initiative appartient à l'équipe de traduction.


Sources d'information et de formation

  • Le manuel de GNUN décrit le principe de la génération des pages traduites et détaille chaque fonction de GNUN. Ce que GNUN permet de faire, entre autres :
    • valider les fichiers PO ;
    • transformer les fichiers PO en pages HTML (avec le style par défaut), ce qui facilite grandement la relecture ;
    • voir quelles traductions ont besoin d'une mise à jour.
  • Git est ce qui risque le plus de dérouter les débutants, mais avec l'aide attentionnée et la supervision de notre coordinateur il suffit d'une semaine ou deux pour s'y mettre, foi de Mme Michu. L'essentiel de ce qu'il y a à savoir se trouve dans les trois premiers chapitres du Git Book. S'il y a un problème, quelques mots-clés dans un moteur de recherche ou un appel au secours sur la liste font merveille. Pas de panique, les erreurs sont la plupart du temps rattrapables.

Et devinez quoi... Git a des interfaces graphiques :

  • Git GUI (multiplateforme) permet de faire une bonne partie des opérations. Il est couplé avec gitk.
  • gitk visualise l'historique des branches, montre les différences entre fichiers et permet de faire des recherches dans l'arborescence.


Il arrive qu'une même opération puisse être faite de différentes manières. Les méthodes qui utilisent des scripts sont les plus efficaces pour un travail de routine, même si leur mise en place semble un peu compliquée (branche Git supplémentaire, configuration). Lorsqu'il y a le choix, elles sont indiquées en gras.


Mise en place des outils

Clonage du dépôt Git www-fr et création d'une branche

Prérequis : git, avoir un compte sur Savannah et appartenir au groupe www-fr.

Le dépôt www-fr comprend plusieurs branches :

  • master, que l'on ne peut pas supprimer ; elle contient les fichiers .fr.po et le GNUmakefile qui permet de synchroniser les arborescences www-fr et www dans les deux sens (make sync et make publish), et de voir l'état des traductions (make report) ; elle est en principe synchronisée avec www après envoi des mises à jour dans le dépôt CVS de www.
  • une ou plusieurs branches perso qui contiennent les dernières modifications faites par les traducteurs.
  • scripts, qui contient :
    • batch-transvalidate, pour convertir les POs en page HTML, et vérifier que leur format est correct et que le HTML est conforme aux standards du W3C. L'ensemble de ces opérations est désigné par un néologisme, « transvalidation » (batch-transvalidate utilise un autre fichier de la branche scripts, html5.dtd, qui provient du paquet GNUN).
    • mini-www-checkout et micro-www-checkout, pour créer un répertoire www réduit, ne contenant que les fichiers nécessaires à la régénération de pages traduites en français.
    • cvs-sync, pour synchroniser le répertoire www avec le dépôt CVS et le répertoire www-fr avec www, et éventuellement ajouter à www les fichiers nécessaires à la mise à jour des nouvelles traductions.
    • pot2pad et pad2po, pour faciliter le passage du format PO au pad de traduction et inversement (pot2pad utilise un autre fichier de la branche scripts, pad-header-fr).

Ne pas hésiter à modifier ces scripts, à les critiquer ou à en créer de nouveaux. Ils sont là pour ça. ;-)


1. Clonage de www-fr

Créer le répertoire de travail (GNU/ par exemple) qui contiendra aussi www, et s'y placer :

mkdir -p ~/GNU && cd ~/GNU

Ensuite, on a le choix de cloner le dépôt complet ou seulement certaines branches.


  • Clonage du dépôt complet
git clone ID-SUR-SAVANNAH@git.sv.gnu.org:/srv/git/www-fr.git


  • Clonage séparé des branches master et scripts (voir http://www.kernel.org/pub/software/scm/git/docs/git-remote.html). Cela évite de traîner l'historique de www-fr avec les scripts, et inversement. Mais surtout, cela permet d'utiliser les scripts avec les fichiers PO sans avoir à les copier ailleurs. Il est en effet impossible d'accéder en même temps à deux branches d'un même dépôt local qui n'ont aucun fichier en commun. Les scripts peuvent être n'importe où ; en revanche, le répertoire www-fr doit avoir la même racine que www.
mkdir -p ~/GNU/www-fr && cd ~/GNU/www-fr
git init
git remote add -f -t master -m master origin ID-SUR-SAVANNAH@git.sv.gnu.org:/srv/git/www-fr.git
git merge origin

La branche créée localement s'appelle master par défaut. Lorsqu'on clone uniquement la branche scripts, la branche master créée à cette occasion ne correspond pas à la branche master du dépôt distant. Il faut la renommer si l'on veut ensuite pousser les modifications locales. Autrement, on a une erreur assez énigmatique : « error: src refspec scripts does not match any. »

mkdir -p ~/www-fr-scripts && cd ~/www-fr-scripts
git init
git remote add -f -t scripts -m scripts origin ID-SUR-SAVANNAH@git.sv.gnu.org:/srv/git/www-fr.git
git merge origin
git branch -m master scripts


2. Création d'une branche personnelle

Écrire dans ~/.gitconfig l'identité de celui/celle qui fait les commits. Sans l'option --global, l'information est écrite dans le fichier .git/config (l'adresse de courriel n'a pas besoin d'être valide, il faut seulement qu'elle contienne « @ ») :

~/GNU/www-fr
git config --global user.name "Gribouille Tartempion"
git config --global user.email gtartempion@serveur.mail

La commande ci-dessous va faciliter le travail à plusieurs :

git config branch.autosetuprebase remote

Créer une branche « gt » synchronisée avec la branche master, et l'envoyer sur le serveur :

cd ~/GNU/www-fr
git branch --set-upstream gt origin/master
git push origin gt

Synchroniser la branche gt avec origin/master. Les modifs qui sont sur gt mais pas sur master s'ajouteront en tête de branche grâce à l'option « autosetuprebase » :

git checkout gt
git pull


Remarque : on peut demander à Git d'ignorer certains fichiers en créant un fichier ~/.gitignore_global, ou en utilisant le fichier .git/info/exclude de chacun des dépôts locaux. L'exclusion des fichiers .html est nécessaire si l'on se sert de batch-transvalidate, qui sauvegarde les pages web traduites dans www-fr. Par exemple, le fichier exclude de www-fr pourrait contenir :

*~
*.html
*.txt
*.diff


Installation d'une arborescence www locale

Le type d'arborescence à créer dépend de ce que l'on veut en faire.


  • Installation minimum pour utiliser batch-transvalidate : micro-www-checkout

Ce script télécharge les fichiers strictement nécessaires à batch-transvalidate. C'est la méthode recommandée avec un SSD (disque à mémoire flash). Il est en effet très mauvais pour ce type de disque de modifier fréquemment des centaines de fichiers, ce qui arrive si l'on synchronise une arborescence www complète avec le dépôt CVS.

Les fichiers nécessaires à la mise à jour des nouvelles traductions doivent être ajoutés séparément. Le script cvs-sync s'en charge à l'étape de synchronisation (voir plus loin).

Prérequis : cvs, rsync.

cd ~/www-fr-scripts
./micro-www-checkout -l fr


  • Installation minimum pour utiliser GNUN : mini-www-checkout

Ce script télécharge quelques fichiers supplémentaires qui sont nécessaires si l'on veut utiliser GNUN pour la transvalidation.


  • Installation complète

Pour avoir une image complète du site web (plus de 450 Mo), il faut passer par la méthode traditionnelle :

Prérequis : cvs.

 
mkdir -p ~/GNU && cd ~/GNU
cvs -z3 -d:pserver:anonymous@cvs.savannah.gnu.org:/webcvs/www co www


Installation de GNUN (optionnelle)

Prérequis :

  1. une arborescence www complète, ou bien créée par mini-www-checkout ;
  2. make, gawk ;
  3. texinfo, gettext, po4a (pour la conversion HTML <--> PO) ;
  4. pour la validation des pages HTML : libxml2, libxml2-utils et la DTD XHTML 1.0 du W3C (paquet Debian w3c-dtd-xhtml).

Télécharger le paquet gnun-latest (ou gnun-0.8) par exemple dans $HOME, et l'extraire. On obtient le dossier gnun-0.8 :

wget ftp://ftp.gnu.org/gnu/gnun/gnun-latest.tar.gz
tar xzvf gnun-latest.tar.gz

Se placer dans le dossier gnun-0.8 et préparer l'installation :

cd ~/gnun-0.8
./configure
make

Il faut éditer le fichier gnun.conf pour remplacer les adresses de courriel, afin que les tests ne soient pas envoyés aux webmasters GNU. ;-)

sed -i 's/bug-gnun@gnu.org/adresse@bidon.fr/' gnun.conf

Maintenant, on peut installer GNUnited Nations dans ~/GNU/www/server/gnun :

sudo make install

Enfin, il faut copier config.mk et GNUmakefile dans le répertoire www/server/gnun :

cp GNUmakefile ~/GNU/www/server/gnun/
cp config.mk ~/GNU/www/server/gnun/

Les cinq étapes d'une mise à jour

Synchronisation des dépôts locaux avec le dépôt www de Savannah

  • À l'aide du script cvs-sync

Prérequis : cvs, git, make et le GNUmakefile des équipes de traduction dans le répertoire www-fr.

Ce script fait l'inventaire des PO à mettre à jour dans la foulée de la synchronisation ; s'il y a une nouvelle traduction non encore sous contrôle de version, il fait un « cvs checkout » sur les 3 fichiers nécessaires à sa mise à jour : DOSSIER/po/DOCUMENT.fr.po, DOSSIER/po/DOCUMENT.pot et DOSSIER/DOCUMENT.html (lire les commentaires).

Si cvs-sync est dans le répertoire www-fr-scripts :

cd ~/www-fr-scripts
./cvs-sync
  • Manuellement

1. Synchroniser l'arborescence www locale avec le dépôt CVS de www :

cd ~/GNU/www
cvs update

Remarque 1. La connexion au dépôt CVS de Savannah est quelquefois très lente et très irrégulière. Avec une arborescence www réduite (voir plus haut), il peut arriver que la synchronisation prenne 10 ou 20 minutes – ne parlons pas de l'arborescence complète. On peut alors utiliser une solution de repli plus rapide : s'abonner à la liste de diffusion www.commits@gnu.org pour être informé en temps réel des modifications des pages web et synchroniser uniquement les fichiers correspondants :

cd ~/GNU/www
cvs update SECTION/po/DOCUMENT.fr.po SECTION/po/DOCUMENT.pot SECTION/DOCUMENT.html

Remarque 2. La synchronisation ne se fait bien (c'est-à-dire sans « conflit pendant la fusion ») que si les fichiers n'ont pas été modifiés localement. Si pour une raison quelconque ils l'ont été (à l'étape de validation par exemple), on peut supprimer les changements globalement :

cd ~/GNU/www
cvs diff | patch -R -p0

Ou bien, si la connexion est mauvaise, on peut restreindre l'opération à un dossier particulier :

cd ~/GNU/www/DOSSIER
cvs diff | patch -R -p0

2. Synchroniser localement www-fr avec www en utilisant GNUN (ne pas oublier de se placer sur la branche adéquate) :

cd ~/GNU/www-fr
git checkout gt
make sync


Inventaire des PO à mettre à jour

  • À l'aide du script cvs-sync (à la suite de la synchronisation)

Prérequis : cvs, git, make et le GNUmakefile des équipes de traduction dans le répertoire www-fr.

Lire les explications au début du script. Si cvs-sync est dans le répertoire www-fr-scripts :

cd ~/www-fr-scripts
./cvs-sync
  • À l'aide de Make et du GNUmakefile (ne pas oublier de se placer sur la branche adéquate)
cd ~/GNU/www-fr
git checkout gt
make report


Mise à jour des PO

Il est préférable de mettre les fichiers à jour dans www-fr (voir plus loin pourquoi).

On peut utiliser un éditeur de PO ou un éditeur de texte ordinaire (voir Outils de traduction 1e partie).

Pour faciliter la relecture, on peut reconstruire la page web soit directement avec batch-transvalidate, soit avec GNUN après avoir copié le fichier dans www.


Transvalidation (génération des pages HTML et validation)

  • À l'aide du script batch-transvalidate

C'est un script interactif – trop, disent certains ;-) – qui peut être utilisé avec un fichier de configuration ou des options en ligne de commande. Il permet de valider une liste de POs créée de diverses manières (entre autres par Git) et éditable. Une fois validés, les POs peuvent être commités dans le dépôt Git local. Les pages traduites sont enregistrées dans www-fr, mais on fait en sorte que Git les ignore (voir plus haut). L'arborescence www n'est pas modifiée.

La page HTML générée par batch-transvalidate diffère quelque peu de la page générée localement par GNUN :

- les paragraphes coupés par des balises « gnun-split » restent coupés pour faciliter la relecture (mais la coupure est signalée) ;

- les liens relatifs qui pointent vers des pages de www.gnu.org sont remplacés par des liens absolus pour qu'ils fonctionnent effectivement.

Prérequis :

  1. po4a (qui dépend de gettext, perl, etc.),
  2. xmllint (paquet Debian libxml2-utils),
  3. DTD XHTML 1.0 du W3C (paquet Debian w3c-dtd-xhtml),
  4. html5.dtd de gnun (dans le même répertoire que batch-transvalidate).

Si batch-transvalidate est dans le répertoire www-fr-scripts :

cd ~/www-fr-scripts
./batch-transvalidate


  • À l'aide de GNUN

1. On met le fichier à valider DOCUMENT.fr.po dans le dossier ~/GNU/www/SECTION/po/. C'est faisable avec « make publish », mais alors tous les PO de www-fr seront reformatés et copiés dans www, même ceux qui ne sont pas encore prêts à être validés.

2. On se place dans le répertoire ~/GNU/www/server/gnun, et on demande à générer la page :

cd ~/GNU/www/server/gnun
make VALIDATE=yes ../../SECTION/DOCUMENT.fr.html

Et voilà, make dit s'il y a une erreur. On peut modifier ../../SECTION/po/DOCUMENT.fr.po et régénérer la page HTML, qu'on récupère dans ~/GNU/www/SECTION/.

Remarque. Il arrive fréquemment que le fichier POT soit régénéré au cours de la validation (voir le manuel de GNUN). Cela modifie également le fichier PO (ainsi que des fichiers intermédiaires) et perturbe les synchronisations ultérieures. Il est possible de supprimer les changements comme expliqué plus haut, mais il faut évidemment que le PO mis à jour soit sauvegardé ailleurs. Il est donc recommandé de faire les mises à jour dans www-fr et de ne valider qu'une copie. De même, la page DOCUMENT.fr.html régénérée doit être sauvegardée si l'on veut s'en servir pour la relecture.

Envoi dans le dépôt www-fr

1. Ajouter des modifications ou de nouveaux fichiers à la branche gt (indexation) :

git checkout gt
git add fichier1 fichier2 ...

2. Enregistrer (commiter) les modifications dans le dépôt local (branche gt) :

git commit fichier1 fichier2 ...

Les commits peuvent être regroupés logiquement, par exemple modifications d'un même type sur plusieurs fichiers.

3. Envoyer (pousser) les modifications sur le serveur :

git push origin gt

4. Faire la liste des fichiers modifiés entre deux envois dans le dépôt www. Comme les modifs de gt ne sont ajoutées à master qu'une fois envoyées dans www, il suffit de faire la liste des fichiers qui diffèrent entre les deux branches :

git diff --name-only gt master

5. Prévenir sur la liste trad-gnu qu'il y a des fichiers à envoyer, en en donnant la liste et en les classant : mises à jour, relectures, nouvelles traductions, etc.