Chemin principal : Accueil > Python > Un correcteur typographique pour la Library of Latin Texts

Un correcteur typographique pour la Library of Latin Texts

samedi 22 janvier 2011, mise à jour mercredi 8 août 2012, par Maïeul
Suivre la vie du site RSS 2.0 Forum

La Library of Latin Texts est un outils très utile pour les chercheurs en histoire latinophone antique et en histoire médievale occidentale. Elle met à disposition des éditions de texte sous forme informatique, avec possibilité de faire des recherches avec de nombreux jokers [1].

Surtout, elle permet d’éviter d’avoir à recopier les textes soit même sur son ordinateur, et évite ainsi les fautes de frappes. Pourtant elle souffre d’un soucis : la typographie suit les conventions anglo-saxonnes, et non pas françaises.

Voici un script Python qui corrige cela [2].

Ce que fait le script

Le script ouvre un texte et le modifier de tel sorte que :

  • Les espaces blancs soient supprimés en début et fin de ligne.
  • Les majuscules soit restaurées après les !?.
  • Les signes de ponctuations doubles !;;? aient un espace avant.

Ce que ne fais pas le script

Ni le café, ni la traduction ... ni surtout le remplacement des u par des v aux endroits nécessaires, pour la simple raison que je ne connais pas la règle générale.

Comment s’en servir

  • Avoir Python installé sur son ordinateur.
  • Mettre les fichiers à corriger à côté du script.
  • Se rendre avec la console / le terminal dans le script.
  • Faire python normalisetypoLLTA.py fichier1 fichier2 fichier... fichiern.

Attention : aucun fichier ne doit s’appeler test. En effet, faire python normalisetypoLLTA.py test sert pour faire les tests unitaires lors du développement du script.

Le script indique si des fichiers posent problème.

P.-S.

Le code est désormais sur Github.

Documents joints

Notes

[1C’est pourquoi il est à regretter que la Patrologie Latine de Migne ne soit pas dessus, mais c’est une autre question.

[2Il est sous la même licence que l’ensemble du site.

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici
  • Ce formulaire accepte les raccourcis SPIP [->url] {{gras}} {italique} <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

À propos

Titulaire d’un master en sciences religieuses de l’Université de Strasbourg, je suis depuis août 2012 assistant-diplômé en histoire du christianisme antique et littérature apocryphe chrétienne à l’Université de Lausanne, où je prépare une thèse sous la direction de Frédéric Amsler.

Dans le cadre de la rédaction de mon mémoire de master, j’ai été emmené à utiliser LaTeX, et j’ai donc décider de partager mes techniques. En effet, au cours de mes premiers apprentissages, j’ai découvert que les ressources indiquant les outils pour l’utilisation de LaTeX en sciences humaines étaient rares.

Par ailleurs, je suis membre actif de la communauté SPIP, au sein de laquelle j’administre le site Spip-Contrib. Je propose sur ce site quelques notes sur SPIP, en général à destination de webmestre.

Il m’arrive également de faire un petit peu de Python, de temps en temps.

Enfin, je tiens un blog de réflexions politiques et religieuses.

Maïeul