Accueil > Python > Un correcteur typographique pour la Library of Latin Texts

Un correcteur typographique pour la {Library of Latin Texts}

samedi 22 janvier 2011, par Maïeul

La Library of Latin Texts est un outils très utile pour les chercheurs en histoire latinophone antique et en histoire médievale occidentale. Elle met à disposition des éditions de texte sous forme informatique, avec possibilité de faire des recherches avec de nombreux jokers [1].

Surtout, elle permet d’éviter d’avoir à recopier les textes soit même sur son ordinateur, et évite ainsi les fautes de frappes.
Pourtant elle souffre d’un soucis : la typographie suit les conventions anglo-saxonnes, et non pas françaises.

Voici un script Python qui corrige cela [2].

Ce que fait le script

Le script ouvre un texte et le modifier de tel sorte que :
 Les espaces blancs soient supprimés en début et fin de ligne.
 Les majuscules soit restaurées après les !?.
 Les signes de ponctuations doubles !;;? aient un espace avant.

Ce que ne fais pas le script

Ni le café, ni la traduction ... ni surtout le remplacement des u par des v aux endroits nécessaires, pour la simple raison que je ne connais pas la règle générale.

Comment s’en servir

 Avoir Python installé sur son ordinateur.
 Mettre les fichiers à corriger à côté du script.
 Se rendre avec la console / le terminal dans le script.
 Faire python normalisetypoLLTA.py fichier1 fichier2 fichier... fichiern.

Attention : aucun fichier ne doit s’appeler test. En effet, faire python normalisetypoLLTA.py test sert pour faire les [?tests unitaires] lors du développement du script.

Le script indique si des fichiers posent problème.


[1C’est pourquoi il est à regretter que la Patrologie Latine de Migne ne soit pas dessus, mais c’est une autre question.

[2Il est sous la même licence que l’ensemble du site.

Un message, un commentaire ?

Qui êtes-vous ?
Votre message

Pour créer des paragraphes, laissez simplement des lignes vides.

Lien hypertexte

(Si votre message se réfère à un article publié sur le Web, ou à une page fournissant plus d’informations, vous pouvez indiquer ci-après le titre de la page et son adresse.)