Bienvenue à Persée sous Philologique

Textes du projet Persée Chargés sous la saison philologique finale pour Philologique 3, Été 2018

Bienvenue à Persée sous Philologique. Cela fait un moment que nous n’avons pas publié de mise à jour officielle, mais la voilà, grâce à d’infatigables querelles (de C, perl, apache et bien d’autres arcanes) cet été par Walt Shandruk. Les années intermédiaires ont vu des travaux importants en particulier du côté des textes grecs, et quelques améliorations de la fonctionnalité de philologique pour… philologue. Je tiens à remercier tous ceux qui nous ont écrit au fil des ans pour signaler des fautes de frappe et autres erreurs; ou simplement pour signaler une panne de serveur. Nous sommes heureux que vous reveniez pour en savoir plus.
Si le vaisseau mère Persée à Tufts représente un carrel de bibliothèque bien équipé, avec des textes, des commentaires, des dictionnaires et d’autres ressources à votre portée sur la même page, l’organisation de ce site peut surprendre. Plutôt que de lire avec un appareil, nous visons à offrir une exploration des textes à travers une panoplie de requêtes de corpus. Parce que beaucoup de textes ont été analysés à la main, et le reste avec l’ordinateur, vous pouvez rechercher d’une manière que vous ne voyez pas dans trop d’autres endroits: Par exemple, rechercher des impératifs présents chez Platon, ou la particule μέν uniquement dans les lignes parlées par Ismène. Vous cherchez des formes de βροτός à la fin de la phrase? Nous sommes là pour les servir. Pour les lecteurs expérimentés et post-débutants, nous recommandons également des outils qui seront désormais familiers, je l’espère: le mot-clé en vue contextuelle, et l’outil de collocation.
Nous sommes reconnaissants pour tous les rapports de problèmes et les suggestions des utilisateurs; gardez-les (et vos dons :-)) à venir. Pour vous tenir au courant des développements, pensez à nous suivre sur Twitter: @LogeionGkLat. Le travail qui nous attend: nous voulons vraiment incorporer plus de textes, qui deviennent régulièrement disponibles à partir de la Bibliothèque numérique Persée. Plus important encore, nous devons adapter la nouvelle génération de PhiloLogie, philologique4, aux besoins des classicistes (pensez: navigation qui n’est pas par numéro de page dans une édition; recherches de lemmes; …), afin que nous ne dépendions plus d’une technologie vieille de quinze ans. Restez à l’écoute.

Contexte : d’où viennent ces textes ?

Les textes que nous mettons à disposition sur ce site sont pratiquement tous utilisés avec l’autorisation du Projet Perseus de l’Université Tufts, la bibliothèque numérique la plus importante pour le monde classique, sinon pour les Humanités en général. Dans sa collection de documents grecs et romains, les lecteurs trouveront de nombreux textes canoniques lus aujourd’hui. La collection grecque approche les 8 millions de mots et la collection latine en compte actuellement 5,5 millions. De plus, de nombreux dictionnaires de langue anglaise, d’autres ouvrages de référence, des traductions et des commentaires sont inclus, de sorte que toute personne disposant d’une connexion Internet a accès à l’équivalent d’une bibliothèque universitaire respectable. Les textes grecs et latins sont richement encodés pour le contenu plutôt que pour la forme (par exemple, non pas des sauts de page, des initiales et des retraits, mais des informations sur le locuteur, des informations métriques et des jalons). Le site Persée est encore enrichi par des mécanismes de liens complexes entre les textes (ce qui donne lieu à plus de 30 millions de liens). Pour des informations sur les licences, des détails sur les éditeurs et les traducteurs, etc., cliquez sur les liens d’en-tête XML qui apparaissent dans les détails bibliographiques des textes. Pour consulter les ouvrages de référence, nous vous recommandons maintenant d’aller directement sur Logeion sur le web ou dans une application; nous proposons toujours un LSJ consultable, Lewis & Court, et Slater; et nous avons mis un lien vers le dictionnaire anglais-grec de Woodhouse.

Qu’avez-vous fait des textes ? ou : Où est le miroir?

Vous trouverez ici une sélection du texte sur le site Tufts, mais le mécanisme pour les parcourir et les rechercher est différent. C’est philologique, un système qui a été spécialement développé pour les grandes bases de données textuelles par le projet ARTFL de l’Université de Chicago. Alors que le site Perseus d’origine est un excellent outil de lecture linéaire, en mettant toutes sortes de ressources sur la même page pendant qu’un utilisateur lit un passage, nous avons voulu exploiter le riche encodage pour la recherche des textes, et pour d’autres tâches qui relèvent moins de la lecture que de la recherche: la linguistique de corpus, avant tout. Nous sommes reconnaissants que le projet Perseus mette ses textes à la disposition de tiers, et continuons de vivre dans l’espoir que d’autres institutions à but non lucratif consacrées à la conservation de textes (grecs) amélioreront leurs offres de recherche et d’analyse, ou suivront l’exemple de Perseus, et décideront de mettre leurs données à disposition pour une analyse avancée avec d’autres systèmes que le leur. Veuillez nous contacter ou télécharger votre propre copie de PhiloLogic, qui est open-source.

Pourquoi votre site ne me donne-t-il pas Cicéron à lire lorsque je tape Cicéron dans la zone de recherche?

Il est important de comprendre qu’un formulaire de recherche philologique n’est pas comme une boîte de recherche Google. La boîte de recherche principale est pour les mots qui se produisent dans le texte, de sorte qu’en tapant « Gallia est », vous trouverez la phrase d’ouverture des guerres gauloises, mais entrer « Jules César » vous mènera dans un premier temps aux textes de Catulle et Cicéron. À partir de notre page d’accueil, cliquez sur le lien vers le formulaire de recherche complet, où vous pouvez utiliser les champs Auteur et Titre ou saisir une citation standard en haut (basée sur le Oxford Classical Dictionary). Si votre citation n’est pas ce que le serveur attend, vous obtiendrez une liste complète de tous les textes, qui vous montrera l’abréviation que nous utilisons.

Pourquoi n’êtes-vous pas plus comme Google?

PhiloLogic est conçu pour exploiter le riche encodage structurel qu’offrent les textes de Persée, et donc pour connaître la différence entre les types de contenu: mots dans les textes, par rapport aux métadonnées dites: auteurs, titres, et bien plus encore. Il est également conçu pour permettre des réponses précises à des questions spécifiques, plutôt que des estimations approximatives du type « vous sentez-vous chanceux ». Si vous recherchez le mot « amicitia » dans les textes, ou le nom « Pseudolus », nous ne voulons pas que vous trouviez des instances à partir de titres, ou d’indications de locuteurs unless sauf si vous spécifiez que c’est le genre d’information: des titres qui incluent des amicitia, des mots prononcés par Pseudolus, que vous voulez. Nous pensons que les deux approches ont leurs avantages, mais que la recherche plus précise est quelque chose que les classicistes ont tendance à vouloir. En somme, avant de saisir quoi que ce soit dans un champ de recherche, demandez-vous de quel type de recherche il s’agit: une recherche par mot ou une recherche de métadonnées. Si vous recherchez des métadonnées, recherchez le champ d’ajustement ailleurs dans le formulaire de recherche. Conseil: En cliquant sur les boutons à côté des champs de recherche, vous obtiendrez toujours une liste de vos options.

Pourquoi mes résultats sont-ils différents lorsque je recherche cet autre corpus grec?

Plusieurs distinctions importantes : Surtout, ce corpus est probablement beaucoup plus important que la sélection proposée ici, et les textes sont souvent d’époque plus récente. D’autre part, les textes peuvent ne pas avoir été dénaturés, de sorte que les suppositions sur la fréquence peuvent toujours être à la limite supérieure et inclure des lemmates qui ne se produisent pas dans les textes ou qui ne se produisent pas avec la fréquence affirmée. Nous aimerions voir la fonctionnalité de recherche par partie du discours, ou par attribut spécifié (tel que le locuteur), et une meilleure exploitation de l’analyse dans le corpus de chacun, mais nous ne sommes pas en mesure de savoir ce qui se passe derrière des portes closes. Plus de questions? Heureux de discuter, bien sûr.

Comment utiliser ce site ? Où sont passés tous les formulaires de recherche?

Un type de réaction que nous avons beaucoup entendu sur le site philologique original de Persée était que les formulaires de recherche étaient plutôt intimidants pour le novice. Maintenant que nous existons depuis plus d’une décennie, et avec de bonnes alternatives pour lire des textes, telles que la magnifique nouvelle visionneuse Scaife, nous retournons à nos racines, pourrait-on dire. Si vous recherchez les textes principaux et les traductions, cliquez sur Grec ou latin en haut de cette page. Les ouvrages de référence peuvent être trouvés dans Logeion; grammaires parmi les monographies.
Les textes et leurs traductions vivent dans les mêmes bases de données. Vous pouvez passer de la traduction à l’original, ou les lire côte à côte, en cliquant sur des liens (‘Anglais’, ‘Grec’, ‘Latin’). S’il y a plusieurs traductions, vous verrez ‘English’ et ‘English2’. Pour une démonstration d’une visite typique, consultez les étapes de la première partie de cette présentation.
Commentaires et monographies vivent dans deux bases de données distinctes. Entrez l’auteur ou le titre ancien dans le champ titre du formulaire de recherche pour savoir si un commentaire est disponible pour un texte ancien particulier. Les monographies comprennent diverses grammaires. Sur la page de recherche des monographies, il y a une boîte de recherche rapide pour les sections de grammaire, conformément à la façon dont ces travaux sont généralement cités dans les commentaires et dans les salles de classe.
Pour rechercher un mot et son analyse, cliquez dessus dans les textes grecs et latins. Une fenêtre apparaîtra qui fournira également un lien vers Logeion, qui vous montrera le mot tel qu’il apparaît dans l’ensemble complet des dictionnaires et des ouvrages de référence dont nous disposons. La recherche en texte intégral reste disponible à partir des formulaires de recherche de certains dictionnaires individuels, accessibles en haut de cette page.

Quel navigateur dois-je utiliser ? Je ne trouve plus la fenêtre d’analyse! Pourquoi mon mot parfaitement normal avec un accent aigu n’est-il pas trouvé?

Nous connaissons les utilisateurs ayant de bonnes expériences sur Linux, Ubuntu, Windows XP, Mac OS en tant que systèmes d’exploitation; nous savons qu’Opera, Firefox et Safari ont été utilisés avec succès en tant que navigateurs. Malheureusement, Internet Explorer n’est pas compatible avec notre mécanisme de clic pour analyser. Dans tous les autres navigateurs que nous avons testés, un clic sur un mot grec ou latin devrait entraîner une nouvelle fenêtre avec des informations d’analyse et des liens vers des dictionnaires. Les clics suivants entraîneront l’actualisation de cette même fenêtre d’analyse ; si vous ne voyez rien, il se peut que cette fenêtre soit cachée derrière votre ou vos autres fenêtres de navigateur. Si le grec ne s’affiche pas comme grec, assurez-vous que votre navigateur peut gérer l’encodage UTF-8 et téléchargez une police Unicode contenant du grec. Il existe de nombreuses polices grecques gratuites. Couper et coller dans des traitements de texte devrait être facile. Dans la plupart des cas, vous devriez pouvoir saisir les mots que vous recherchez sans diacritiques (cela signifie également: pas de respirations et pas de sous-écritures iota), ou en translittération (voir ‘Info& Help’ pour obtenir des conseils); assurez-vous simplement de sélectionner également le bouton radio correspondant (‘pas de diacritiques’, ‘translittération’) lorsque vous faites cela.
Détail Unicode qui est probablement trop d’informations: nous essayons d’être cohérents en utilisant Unicode pré-combiné et en évitant les caractères désormais obsolètes qui utilisent ‘oxia’ plutôt que les combinaisons canoniques de ‘tonos’). Si vous utilisez une méthode de saisie grecque qui produit la variante « oxia », envisagez d’entrer votre recherche sans diacritiques lorsqu’il y a des accents aigus en jeu ou d’installer une méthode de saisie conforme à la pratique canonique. Le système Mac OS X dispose d’une entrée grecque polytonique intégrée qui est également conforme à ces normes.

Quelle est cette affaire de morphologie ? Et que signifient les couleurs?

Au printemps 2008, nous avons reçu une subvention de l’ATI pour développer l’analyse morphologique du corpus grec et le rendre consultable. Vous pouvez en apprendre davantage sur ce projet en lisant des résumés de nos présentations sur ce sujet ou en regardant cette grande affiche sur la façon dont tout a été mis en place. Dans une présentation plus récente, nous présentons une présentation d’un ensemble de recherches. Pour plus de détails sur les codes partiels de la parole, consultez les sections ‘Info&Help’ des formulaires de recherche. Il est important de souligner que les textes n’ont pas été analysés à la main, de sorte qu’il y aura de nombreuses analyses erronées. Nous espérons que vous nous aiderez à les corriger!
Dans une fenêtre d’analyse typique, vous verrez une analyse surlignée en bleu clair. Cela indique que notre tagueur automatique de partie de discours a sélectionné cette analyse comme la plus probable dans le contexte. Vous verrez un nombre (disons 0,45678) associé à l’analyse. Cela exprime la probabilité que le système (un ordinateur stupide qui ne connaît pas le grec aussi bien que vous!) s’associe à cette analyse particulière. Certaines parties des textes ont été étiquetées à la main. Si vous rencontrez un formulaire étiqueté à la main, il sera de couleur verte. Même là, des problèmes de saisie de données peuvent survenir, alors soyez critique et signalez (soumettez un formulaire de rapport de problème via le lien dans la fenêtre d’analyse si l’analyse correcte n’est pas répertoriée) toutes les erreurs que vous trouvez.

Comment rechercher des attributs morphologiques ou des lemmes ?

Si vous souhaitez rechercher des occurrences d’un lemme ou d’un code de partie de discours, vous utilisez le même champ de recherche que pour les mots normaux (ou « chaînes »), mais vous les préfixez par ‘lemma:’ ou ‘pos:’. Par exemple, ‘lemme:nostos’ ou ‘lemme:sum’.
Nouveau: en utilisant ‘formulaire: »vous pouvez ignorer les instructions plus complexes pour les codes de partie de discours qui suivent. Écrivez simplement ce que vous pensez décrire suffisamment la forme que vous recherchez, dans n’importe quel ordre, mais utilisez des tirets entre les termes. Par exemple, ‘form: optative-act-singular’ pour un optatif actif au singulier, où ‘form:sg-opt-act’ ferait la même chose.
Les codes de partie de discours sont moins simples à résumer. La section d’aide Info& a une introduction rapide. Il est important de savoir que bien qu’une analyse complète constitue dix créneaux horaires, beaucoup d’entre eux seront vides (-), et encore plus ne vous intéresseront pas à un moment donné. Tout cela, vous pouvez laisser non spécifié avec *, mais votre formulation doit être suffisamment spécifique pour qu’un « a » définisse l’accusatif et non l’aoriste. Pour cela, il est utile de connaître l’ordre des différents emplacements. Ils sont:
1) partie majeure du discours: Verbe, Nom, Adjectif, Pronom, particule (g), Adverbe, chIffre, pRéposition, Conjonction, Interjection;
2) partie mineure du discours: a: Article ou déterminatif (latin est, idem, ipse), Personnel, Démonstratif, x: indéfini, Interrogatif, Relatif, Possessif, k: réflexif, réCiproque, propRe;
3) personne: 1, 2, 3;
4) nombre: singulier, pluriel, dual;
5) temps: Présent, Imparfait, Aoriste, paRfait, Plus parfait, Futur, Futur parfait;
6) humeur: Indicatif, Subjonctif, Optatif, Impératif, Infinitif, Participe, Gérondif , Gérondif, Décubitus dOrsal;
7) voix: Active, Moyenne, Passive, Moyenne-passive;
8) sexe: Masculin, Féminin, Neutre, Commun;
9) cas: Nominatif, Génitif, Datif, Accusatif, Ablatif, Vocatif;
10) degré: Comparatif, Superlatif.
Les expressions régulières fonctionneront dans une certaine mesure. Par exemple, on pourrait simplement spécifier ‘pos: *a-‘ pour capturer les accusatifs. (Tous les emplacements de 1 à 8 sont ici laissés non spécifiés. Nous le savons car le champ de recherche nécessite toujours un mot complet, et nous avons terminé notre mot par ‘-‘ et non par un caractère générique). Cette formulation initiale, cependant, manquerait d’accusatifs qui sont aussi des comparatifs ou des superlatifs. Pour les inclure, essayez plutôt ‘pos:*a’. signifie « choisissez l’un des éléments xyz entre les crochets ». Inversement, si l’on cherche des pronoms personnels, il peut être logique d’utiliser pos: pp * sans autre spécification sur les emplacements 3-8.
Les recherches de partie de discours et de lemme peuvent être combinées, au moyen d’un point-virgule, ou utilisées séparément, avec un espace, si l’on spécifie des mots différents: La recherche ‘lemme:dokew; pos:v-3s. * pos:.*d-‘ recherche les formes de δοκέω au 3ème singulier (point-virgule), et séparément, quelque chose au datif.
C’est probablement aussi bon moment que tout autre pour souligner que notre analyseur et notre moteur de recherche ne connaissent pas la syntaxe grecque ou même latine! Vous devrez décider vous-même, dans des recherches de ce genre, si les datifs que vous trouvez sont en fait des datifs régis par le verbe.
Tout cela est-il assez écrasant? Nous nous rendons compte que les formules semblent plutôt prohibitives ! Si nous pouvons trouver le temps et le financement, nous travaillerons sur des requêtes en langage naturel (pourrais-je avoir des optatifs actifs parfaits?) pour remplacer » pos: v*roa* « .

Et alors ?

Nous pensons que ce corpus est très prometteur tant pour la recherche que pour l’enseignement. Les philologues doivent faire des études de corpus au-delà du seul mot; plus particulièrement, les linguistes classiques devraient travailler à faire plus d’affirmations fondées sur des preuves et quantitatives que ce que l’on trouve dans une grande partie de la littérature actuelle. Les enseignants qui souhaitent sélectionner le vocabulaire ou les constructions à souligner devraient avoir une notion de fréquence d’utilisation, et plutôt que de créer des exemples, ils pourraient lancer une recherche rapide d’exemples réels de constructions. Pour donner un exemple simple, trois articles définis dans l’ordre n’est pas inhabituel. Vous pouvez maintenant trouver des exemples réels dans Lysias, un auteur approprié pour les classes d’introduction et intermédiaires, pour le démontrer. Sur une note pratique pour les enseignants, si vous envoyez à votre classe un lien de ce type, le phénomène que vous souhaitez mettre en évidence est mis en évidence sur la page. Si vous souhaitez attirer l’attention de vos élèves sur une partie particulière d’une page, recherchez-la et envoyez-leur l’URL copiée du résultat de la recherche. Ils verront la même mise en évidence.

Super! De quelle manière puis-je aider?

Comme vous pouvez probablement l’imaginer, il y a beaucoup de roues dans les roues pour que ce site fasse ce qu’il fait, et parfois les choses se perdent dans le mélange. Si vous voyez quelque chose de mal, veuillez nous le faire savoir. Voici comment vous pouvez nous aider à améliorer ce site: Si vous rencontrez un problème, veuillez utiliser le lien « Signaler un problème » que vous trouverez sur les pages de résultats.
Les corrections utilisateur pour un mot ou un passage particulier auront à la fois un impact local dans leur contexte, mais peuvent pointer vers des problèmes plus répandus, de sorte qu’elles peuvent avoir un impact global sur la précision future de la base de données dans son ensemble.
La fenêtre d’analyse a un formulaire de rapport de problème séparé (au cas où aucune des analyses n’est satisfaisante, ou la définition courte tombe, eh bien, courte).

Et si je veux en faire plus ?

Ce projet n’aurait pas été possible sans un logiciel open-source et des données partagées sous licence creative-commons. Si vous êtes membre du corps professoral, membre du personnel, étudiant ou administrateur d’un établissement d’enseignement supérieur, informez-vous sur le Libre Accès, le Contenu ouvert et les Creative Commons. Soutenez les principes qu’ils représentent et œuvrez au changement là où vous le pouvez dans votre propre institution et dans vos organisations professionnelles. Indépendamment de leur affiliation, les passionnés de classique peuvent soutenir des organisations qui travaillent avec ces principes. Vous pouvez prendre en charge des projets en libre accès et orientés creative commons que vous aimez. Pour les classicistes, certains sites à visiter en tant que bonnes chambres de compensation pour ce genre d’informations sont Ancient World Online de Chuck Jones, le blog de design Vitruvien de Neel Smith et stoa.org .

Crédits

Une grande partie de la programmation de la version 2009 a été effectuée par un seul Classics BA poursuivant une maîtrise en informatique (une bonne quantité de travail supplémentaire non financé par des classicistes déterminés aide, ainsi que des logiciels open-source et l’assistance de ses développeurs). Nous souhaitons exprimer notre gratitude au bureau du prévôt de l’Université de Chicago pour sa subvention ATI pour 2008-09. Et bien sûr, κδδος à Richard Whaling pour l’avoir enlevé! Au cours de la décennie qui a suivi, l’amélioration progressive de Perseus et de Logeion n’aurait pas été possible sans le soutien du Collège de l’Université de Chicago, des politiques du doyen John Boyer pour soutenir les projets du corps professoral à ses brillants étudiants de premier cycle. (Si vous êtes un étudiant de premier cycle, venez me trouver!)

Est-ce tout?

Une dernière liste de personnes à remercier pour leur aide au cours de l’année écoulée. Toute la programmation de la version 2009 a été réalisée par Richard Whaling. Nous, Richard et Helma, tenons à remercier nos disambiguateurs: Kristin Dean, Charlotte Krontiris et Ursula Poole; Walt Shandruk, pour avoir fouillé dans une pile de données latines à court terme; le Projet Perseus, pour le partage de données et d’expertise; Martin Mueller, pour la consultation et la mise à disposition de ses données homériques; et Hugh Cayless, pour nous avoir facilité la vie avec son Transcodeur. Nous remercions l’ensemble du personnel d’ARTFL d’accueillir les classicistes parmi eux et de partager généreusement leur expertise, leur caféine et leur joie.

La version 2018 a grandement bénéficié du travail de Walter Shandruk. Alors que nous envisageons de mettre en œuvre des outils plus modernes, nous demandons votre patience avec ce site à l’ancienne; nous pensons qu’il a encore du kilométrage!

Septembre 2018,
Helma Dik

Bienvenue à Persée sous Philologique, édition 2018