Du Thesaurus Linguae Graecae vers LaTeX

jeudi 11 avril 2013, par Maïeul
Suivre la vie du site RSS 2.0 Forum

Cet article est obsolète. Soit qu’il existe une manière plus « moderne » de procéder, soit que j’ai trouvé une autre méthode plus appropriée.
Voyez plutôt la nouvelle version : Du Thesaurus Linguae Graecae à LaTeX.

Le Thesaurus Linguae Graecae est un outils indispensable pour les hellénistes. L’un de ses avantages est de permettre de copier-coller facilement des textes grecs vers son travail, s’évitant ainsi la fastidieuse tâche de retranscription, avec toutes les erreurs que cela implique.

Cependant le texte tel qu’il est fourni n’est pas utilisable tel quel : il nécéessite quelques retouches. Voici un script permettant d’automatiser certaine d’entre elle, afin de pouvoir utiliser le texte avec LaTeX.

Exemple

J’ai extrait du site TLG le texte suivant [1] :

 Ἔκαμεν ὁ λόγος, τοῦτον τὸν θεσπέσιον καὶ τριπόθητον
Βαρνάβαν τὸν ἀπόστολον ἐπᾶραι τοῖς ἐγκωμίοις ποθῶν,
καὶ οὔπω ἥψατο τοῦ προοιμίου· τοῖς γὰρ ἐπαίνοις ἀπρό-
σιτος τυγχάνει ὁ θαυμάσιος. Διὸ ἀφέντες ὡς ἀνέφικτον (135)
τὸν περὶ τῶν ἐγκωμίων λόγον, ὀλίγα τῶν εἰς ἡμᾶς
ἰόντων περὶ τῆς τούτου βιώσεως καὶ τελειώσεως ἔκ τε
τοῦ Στρωματέως καὶ ἐξ ἑτέρων ἀρχαίων συγγραμμάτων
παραθήσομαι τῇ ὑμετέρᾳ ὁσιότητι, καὶ οὕτω τὸ πέρας
ἐπιθήσομεν τῷ διηγήματι, παραχωρήσαντες τῇ θεοπνεύστῳ (140)
Γραφῇ τοῦ ἀοιδίμου τὴν κεφαλὴν μεγαλοπρεπῶς στε-
φανῶσαι· φησὶ γάρ· “Ἦν δὲ Βαρνάβας ἀνὴρ ἀγαθὸς καὶ
πλήρης Πνεύματος ἁγίου καὶ πίστεως.” Οὗ τί ἂν γένοιτο
ἴσον ἢ παραπλήσιον πώποτε;

Je souhaiterais :

  • faire disparaître les numéros de ligne
  • transformer les guillemets en utilisant la commande \csquotes à la place.
  • supprimer les césures, puisque LaTeX se charge tout seul d’en mettre.

Voici le résultat souhaité :

Ἔκαμεν ὁ λόγος, τοῦτον τὸν θεσπέσιον καὶ τριπόθητον
Βαρνάβαν τὸν ἀπόστολον ἐπᾶραι τοῖς ἐγκωμίοις ποθῶν,
καὶ οὔπω ἥψατο τοῦ προοιμίου· τοῖς γὰρ ἐπαίνοις ἀπρό%
σιτος τυγχάνει ὁ θαυμάσιος. Διὸ ἀφέντες ὡς ἀνέφικτον 
τὸν περὶ τῶν ἐγκωμίων λόγον, ὀλίγα τῶν εἰς ἡμᾶς
ἰόντων περὶ τῆς τούτου βιώσεως καὶ τελειώσεως ἔκ τε
τοῦ Στρωματέως καὶ ἐξ ἑτέρων ἀρχαίων συγγραμμάτων
παραθήσομαι τῇ ὑμετέρᾳ ὁσιότητι, καὶ οὕτω τὸ πέρας
ἐπιθήσομεν τῷ διηγήματι, παραχωρήσαντες τῇ θεοπνεύστῳ 
Γραφῇ τοῦ ἀοιδίμου τὴν κεφαλὴν μεγαλοπρεπῶς στε%
φανῶσαι· φησὶ γάρ· \enquote{Ἦν δὲ Βαρνάβας ἀνὴρ ἀγαθὸς καὶ
πλήρης Πνεύματος ἁγίου καὶ πίστεως.} Οὗ τί ἂν γένοιτο
ἴσον ἢ παραπλήσιον πώποτε;

Je me sert pour cela du script Python joint.

Utilisation

  • Dans le TLG, afficher le texte sans les « Beta Escape » (dans la colonne de gauche, le menu déroulant « Beta Escape » mis à « None »).
  • Le copier dans un fichier nom.txt.
  • Avoir Python 3 ou plus installé sur sa machine.
  • Mettre le script joint à côté du fichier.
  • Avec son terminal, se rendre dans le dossier du fichier et frapper python3 tlg2latex.py nom.txt.
  • Un fichier normalise_nom.txt apparaît à côté : il contient le code utilisable dans LaTeX.

À faire

Tout les cas possibles ne sont sans doute pas encore pris en compte. J’attend vos avis, ou même vos améliorations directes.

P.-S.

Le code est disponible sur Github, sous Licence GPL3 : https://github.com/maieul/tlg2latex

Documents joints

Notes

[1Il s’agit d’un extrait d’une louange à l’apôtre Barnabé.

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Acheter XeLaTeX appliqué aux sciences humaines

À propos

Titulaire d’un doctorat en théologie et d’un doctorat en histoire, sous la direction conjointe de Frédéric Amsler et d’Élisabeth_Malamut, je commence à partir du 1er août 2017 un travail d’édition critique des Actes de Barnabé.

Dans le cadre de la rédaction de mon mémoire de master puis de ma thèse de doctorat, j’ai été emmené à utiliser LaTeX, et j’ai donc décider de partager mes techniques. En effet, au cours de mes premiers apprentissages, j’ai découvert que les ressources indiquant les outils pour l’utilisation de LaTeX en sciences humaines étaient rares. Ceci m’a conduit à maintenir ou créer plusieurs packages LaTeX et à donner plusieurs formations.

J’ai reçu en 2018 le prix DANTE e.V pour mon travail autour de LaTeX, en particulier autour de reledmac et reledpar.

Par ailleurs, je suis membre actif de la communauté SPIP, au sein de laquelle j’administre le site Spip-Contrib. Je propose sur ce site quelques notes sur SPIP, en général à destination de webmestre.

Il m’arrive également de faire un petit peu de Python, de temps en temps.

Enfin, je tiens un blog de réflexions politiques et religieuses.

Maïeul