Testi del progetto Perseus caricati sotto philologicstagione finale per PhiloLogic 3, Estate 2018
Benvenuti a Perseus under PhiloLogic. È passato un po ‘ di tempo da quando abbiamo rilasciato un aggiornamento ufficiale, ma eccolo qui, grazie all’infaticabile wrangling (di C, perl, apache e molti altri arcani) di questa estate di Walt Shandruk. Gli anni successivi hanno visto un lavoro significativo soprattutto sul lato dei testi greci, e alcuni miglioramenti alla funzionalità di filologica per … filologo. Vorrei ringraziare tutti coloro che ci hanno scritto nel corso degli anni per segnalare errori di battitura e altri errori; o semplicemente per segnalare un’interruzione del server. Siamo lieti di continuare a tornare per più.
Se la nave madre Perseo a Tufts rappresenta un carrel biblioteca ben attrezzata, con testi, commenti, dizionari e altre risorse tutti a portata di mano sulla stessa pagina, allora l’organizzazione di questo sito può essere una sorpresa. Piuttosto che leggere-con-apparato, miriamo a offrire l’esplorazione dei testi attraverso una panoplia di interrogazioni corpus. Poiché molti testi sono stati analizzati a mano, e il resto con il computer, è possibile cercare in modi che non si vedono in troppi altri luoghi: Per esempio, cercare gli imperativi presenti in Platone, o la particella μέν solo nelle righe pronunciate da Ismene. Alla ricerca di forme di βροτός alla fine della frase? Siamo qui per servirli. Per i lettori esperti e post-principianti, raccomandiamo anche strumenti che saranno ormai familiari, spero: la parola chiave in Context view e lo strumento di collocazione.
Siamo grati per tutte le segnalazioni di problemi e suggerimenti degli utenti; tienili (e le tue donazioni:-)) in arrivo. Per essere sempre al passo con gli sviluppi, considera di seguirci su Twitter: @ LogeionGkLat. Lavoro che attende: vogliamo davvero incorporare più testi, che stanno diventando costantemente disponibili dalla Biblioteca Digitale di Perseo. Ancora più importante, abbiamo bisogno di adattare la nuova generazione di filologico, filologic4, alle esigenze dei classicisti (pensare: navigazione che non è per numero di pagina in un’edizione; ricerche lemma;…), in modo che non dipendiamo più dalla tecnologia di quindici anni. Restate sintonizzati.
Background: da dove provengono questi testi?
I testi che mettiamo a disposizione su questo sito sono praticamente tutti utilizzati su autorizzazione del Perseus Project della Tufts University, la più importante Biblioteca digitale per il mondo classico, se non per l’Umanità in generale. Nella sua collezione di materiali greci e romani,i lettori troveranno molti dei testi canonici letti oggi. La raccolta greca si avvicina a 8 milioni di parole e la raccolta latina ne ha attualmente 5,5 milioni. Inoltre, sono inclusi molti dizionari di lingua inglese, altre opere di riferimento, traduzioni e commenti, in modo che chiunque abbia una connessione Internet abbia accesso all’equivalente di una rispettabile biblioteca di classici universitari. I testi greci e latini sono riccamente codificati per il contenuto piuttosto che per la forma (ad esempio, non interruzioni di pagina, iniziali e rientri, ma informazioni sugli altoparlanti, informazioni metriche e pietre miliari). Il sito di Perseo è ulteriormente arricchito da intricati meccanismi di collegamento tra testi (con oltre 30 milioni di collegamenti). Per informazioni sulle licenze, dettagli su editori e traduttori, ecc., fare clic sui collegamenti di intestazione XML che appaiono nei dettagli bibliografici dei testi. Per consultare i lavori di riferimento, ora consigliamo di andare direttamente a Logeion sul web o in un’app; offriamo ancora un LSJ ricercabile, Lewis & Breve e Slater; e abbiamo inserito un link al Dizionario inglese-greco di Woodhouse.
Cosa hai fatto ai testi? oppure: Dov’è lo specchio?
Qui troverai una selezione del testo nel sito di Tufts, ma il meccanismo per la raccolta e la ricerca è diverso. È filologico, asystem che è stato sviluppato appositamente per grandi database testuali dal progetto ARTFL presso l’Università di Chicago. Mentre il sito originale Perseus è un ottimo strumento per la lettura lineare, mettendo tutti i tipi di risorse sulla stessa pagina mentre un utente legge un passaggio, eravamo interessati a sfruttare la ricca codifica per la ricerca dei testi, e per altri compiti che sono meno sulla lettura e più sulla ricerca: linguistica dei corpus, soprattutto. Siamo grati che il Progetto Perseus metta i suoi testi a disposizione di terzi e continuiamo a vivere nella speranza che altre istituzioni senza scopo di lucro dedicate alla cura del testo (greco) migliorino le loro offerte di ricerca e analisi, o seguano l’esempio di Perseus, e decidano di rendere i loro dati disponibili per analisi avanzate con sistemi diversi dai loro. Si prega di mettersi in contatto, o scaricare la propria copia di PhiloLogic, che è open-source.
Perché il tuo sito non mi dà Cicero da leggere quando digito Cicero nella casella di ricerca?
È importante capire che un modulo di ricerca filologica non è come una casella di ricerca di Google. La casella di ricerca principale è per le parole che si verificano nel testo, in modo che digitando ‘Gallia est’ troverete la frase di apertura delle guerre galliche, ma inserendo ‘Giulio Cesare’ in primo luogo vi porterà a testi di Catullo e Cicerone. Partendo dalla nostra homepage, clicca sul link al modulo di ricerca completo, dove puoi utilizzare i campi Autore e Titolo o digitare una citazione standard in alto (basata sull’Oxford Classical Dictionary). Se la tua citazione non è ciò che il server si aspetta, otterrai un elenco completo di tutti i testi, che ti mostrerà l’abbreviazione che usiamo.
Perché non sei più come Google?
PhiloLogic è progettato per sfruttare la ricca codifica strutturale che i testi di Perseo offrono, e quindi per conoscere la differenza tra i tipi di contenuto: parole nei testi, rispetto ai cosiddetti metadati: autori, titoli e molto altro. È inoltre progettato per consentire risposte precise a domande specifiche, piuttosto che stime ballpark del tipo ‘ti senti fortunato’. Se cerchi la parola ‘amicitia’ nei testi, o il nome ‘Pseudolus’, non vogliamo che tu trovi istanze dai titoli, o dalle indicazioni degli altoparlanti unless a meno che tu non specifichi che questo è il tipo di informazione: titoli che includono amicitia, parole pronunciate da Pseudolus, che vuoi. Crediamo che entrambi gli approcci abbiano i loro vantaggi, ma che una ricerca più precisa sia qualcosa che i classicisti tendono a desiderare. In sintesi, prima di inserire qualsiasi cosa in un campo di ricerca, chiediti che tipo di ricerca è: una ricerca di parole o una ricerca di metadati. Se la ricerca è per i metadati, trovare il campo di raccordo altrove nel modulo di ricerca. Suggerimento: Facendo clic sui pulsanti accanto ai campi di ricerca, si otterrà sempre un elenco delle opzioni.
Perché i miei risultati sono diversi quando cerco quell’altro corpus greco?
Diverse importanti distinzioni: Soprattutto, quel corpus è probabilmente molto più grande della selezione offerta qui, e i testi sono spesso di epoca più recente. D’altra parte, i testi potrebbero non essere stati disambiguati, in modo che le ipotesi sulla frequenza possano sempre essere di fascia alta e includere lemmata che in realtà non si verificano nei testi o non si verificano con la frequenza asserita. Vorremmo vedere la funzionalità della ricerca per parte del discorso, o per attributo specificato (come speaker), e sfruttare meglio l’analisi nel corpus di tutti, ma non siamo in grado di sapere cosa succede a porte chiuse. Altre domande? Felice di chiacchierare, naturalmente.
Come posso utilizzare questo sito? Dove sono finiti tutti i moduli di ricerca?
Un tipo di reazione che abbiamo sentito molto sul Perseo originale sotto il sito filologico era che le forme di ricerca erano piuttosto intimidatorie per il novizio. Ora che siamo stati in giro per oltre un decennio, e con buone alternative là fuori per la lettura di testi, come il bellissimo nuovo Scaife Viewer, stiamo tornando alle nostre radici, si potrebbe dire. Se stai cercando i testi e le traduzioni principali, fai clic su greco o latino nella parte superiore di questa pagina. Opere di riferimento si possono trovare in Logeion; grammatiche tra le monografie.
I testi e le loro traduzioni vivono negli stessi database. Puoi passare dalla traduzione all’originale, o leggerli fianco a fianco, cliccando sui link (‘Inglese’, ‘greco’, ‘Latino’). Se ci sono più traduzioni, vedrai ‘Inglese’ e ‘Inglese2’. Per una dimostrazione di una visita tipica, controlla i passaggi nella parte precedente di questa presentazione.
Commenti e monografie vivono in due database separati. Inserisci autore antico o titolo nel campo titolo del modulo di ricerca per scoprire se un commento è disponibile per un particolare testo antico. Le monografie includono varie grammatiche. Nella pagina di ricerca delle monografie, c’è una casella di ricerca rapida per le sezioni grammaticali, in accordo con il modo in cui queste opere vengono solitamente citate nei commenti e nelle aule.
Per cercare una parola e la sua analisi, fare clic su di essa nei testi greco e latino. Apparirà una finestra che fornirà anche un link a Logeion, che ti mostrerà la parola così come appare nel set completo di dizionari e opere di riferimento che abbiamo a disposizione. La ricerca full text rimane disponibile nei moduli di ricerca per alcuni singoli dizionari, accessibili dall’alto di questa pagina.
Quale browser dovrei usare? Non riesco più a trovare la finestra di analisi! Perché la mia parola perfettamente normale con un accento acuto non è stata trovata?
Conosciamo utenti con buone esperienze su Linux, Ubuntu, Windows XP, Mac OS come sistemi operativi; sappiamo che Opera, Firefox e Safari sono stati utilizzati con successo come browser. Purtroppo Internet Explorer non è compatibile con il nostro meccanismo click-to-parse. In tutti gli altri browser che abbiamo testato, un clic su una parola greca o latina dovrebbe risultare in una nuova finestra con informazioni di analisi e collegamenti ai dizionari. I clic successivi faranno sì che questa stessa finestra di analisi venga “aggiornata”; se non vedi nulla, potrebbe essere che questa finestra sia nascosta dietro le altre finestre del browser. Se il greco non viene visualizzato come greco, assicurati che il tuo browser possa gestire la codifica UTF-8 e scarica un font Unicode che contiene greco. Ci sono un sacco di caratteri greci gratuiti. Tagliare e incollare in word processor dovrebbe essere facile. Nella maggior parte dei casi, dovresti essere in grado di digitare le parole che cerchi senza segni diacritici (questo significa anche: nessun respiro e nessun subcritto iota), o in traslitterazione (vedi ‘Info & Help ‘ per guida); assicurati di selezionare anche il pulsante di opzione corrispondente (‘nessun segno diacritico’, ‘traslitterazione’) quando lo fai.
Dettaglio Unicode che probabilmente è troppa informazione: cerchiamo di essere coerenti nell’usare Unicode pre-combinato ed evitare i caratteri ormai deprecati che usano ‘oxia’ piuttosto che le canoniche combinazioni ‘tonos’). Se si utilizza un metodo di input greco che produce la variante ‘oxia’, considerare l’inserimento della ricerca senza segni diacritici quando ci sono accenti acuti in gioco o l’installazione di un metodo di input che aderisce alla pratica canonica. Il sistema Mac OS X è dotato di ingresso greco politonico integrato che è conforme anche a questi standard.
Cos’è questo business sulla morfologia? E cosa significano i colori?
Nella primavera del 2008 abbiamo ricevuto una sovvenzione ATI per sviluppare analisi morfologiche per il corpus greco, e per renderlo ricercabile. Puoi saperne di più su questo progetto leggendo gli abstract delle nostre presentazioni su questo argomento o dando un’occhiata a questo grande poster su come è stato messo insieme. In una presentazione più recente, presentiamo un walk-through di una serie di ricerche. Per maggiori dettagli sui codici part-of-speech, consultare le sezioni ‘Info & Help ‘ nei moduli di ricerca. È importante sottolineare che i testi non sono stati analizzati a mano, in modo che ci saranno molte analisi errate. Ci auguriamo che ci aiuterà a correggere quelli!
In una tipica finestra di analisi, vedrai un’analisi evidenziata in blu chiaro. Indica che il nostro tagger automatico part-of-speech ha selezionato questa analisi come quella più probabile nel contesto. Vedrai un numero (ad esempio, 0.45678) associato all’analisi. Questo esprime la probabilità del sistema (un computer stupido che non conosce greco così come si fa!) associa a quella particolare analisi. Parti dei testi sono stati etichettati a mano. Se si verifica un modulo etichettato a mano, sarà di colore verde. Anche lì, potrebbero verificarsi problemi di immissione dei dati, quindi per favore sii critico e segnala (invia un modulo di segnalazione dei problemi tramite il link nella finestra di analisi se l’analisi corretta non è elencata) eventuali errori che trovi.
Come faccio a cercare attributi morfologici o lemmi?
Se si desidera cercare le occorrenze di un lemma o di un codice part-of-speech, si utilizza lo stesso campo di ricerca delle parole normali (o ‘stringhe’), ma le si prefigge con ‘lemma:’ o ‘pos:’. Ad esempio,’ lemma:nostos ‘o’lemma:sum’.
Nuovo: usando ‘ form:’è possibile ignorare le istruzioni più complesse per i codici part-of-speech che seguono. Basta scrivere ciò che pensi descriverà sufficientemente il modulo che stai cercando, in qualsiasi ordine, ma usa i trattini tra i termini. Ad esempio,’ form:optative-act-singular ‘per un optativo attivo al singolare, dove’ form:sg-opt-act ‘ farebbe la stessa cosa.
I codici part-of-speech sono meno semplici da riassumere. La sezione Info & ha una rapida introduzione. E ‘ importante sapere che, mentre un’analisi completa costituisce dieci slot, molti di questi saranno vuoti ( – ), e ancora di più non sarà di interesse per voi in un dato momento. Tutti questi puoi lasciare non specificati con*, ma la tua formulazione deve essere abbastanza specifica che una ‘a’ definisca accusativo e non aoristo. Per questo è utile conoscere l’ordinamento dei diversi slot. Sono:
1) parte principale del discorso: Verbo, Sostantivo, aggettivo, pronome, particella (g), avverbio, numero, preposizione, Congiunzione, interiezione;
2) parte minore del discorso: a: Articolo o determinante (il latino è, idem, ipse), Personali, Dimostrativi, x: indefinito, Interrogativo, Relativo, possessivo, k: riflessivo, di reciprocità e corretto;
3) persona: 1, 2, 3;
4) numero: singolare, plurale, duale;
5) tesi: Presente, Imperfetto, Aoristo, perfetto, pLuperfect, Futuro, futuro anteriore;
6) umore: Indicativo, Congiuntivo, Optative, imperativo, infinito, Participio, Gerundive, gerundio, supino;
7) voce: Attivo, Medio e Passivo, medio-passivo;
8) sesso: Maschile, Femminile, Neutro, Comune;
9) i casi: Nominativo, Genitivo, Dativo, Accusativo, ablativo, Vocativo;
10) grado: Comparativo, Superlativo.
Le espressioni regolari funzioneranno in una certa misura. Ad esempio, si potrebbe semplicemente specificare “pos:*a -” per catturare gli accusativi. (Tutti gli slot da 1 a 8 sono qui lasciati non specificati. Lo sappiamo perché il campo di ricerca richiede sempre una parola completa, e abbiamo finito la nostra parola con ‘-‘ e non con una wild card). Questa formulazione iniziale, tuttavia, mancherebbe accusativi che sono anche comparativi o superlativi. Per includerli, prova invece ‘pos: * a’. significa ‘scegliere uno qualsiasi degli elementi xyz tra le parentesi’. Al contrario, se si è alla ricerca di pronomi personali, può avere senso usare pos: pp * senza ulteriori specifiche sugli slot 3-8.
Le ricerche part-of-speech e lemma possono essere combinate, per mezzo di un punto e virgola, o utilizzate separatamente, con uno spazio, se si specificano parole diverse:La ricerca ‘lemma:dokew;pos: v-3s.* pos:.* d – ‘ cerca forme di δοκέω nel terzo singolare (punto e virgola), e separatamente, qualcosa nel dativo.
Questo è probabilmente un momento buono come un altro per sottolineare che il nostro parser e il nostro motore di ricerca non conoscono la sintassi greca o latina! Dovrai decidere da solo, in ricerche di questo tipo, se i dativi che trovi sono in realtà dativi governati dal verbo.
È tutto questo piuttosto opprimente? Ci rendiamo conto che le formule sembrano piuttosto proibitive! Se riusciamo a trovare il tempo e il finanziamento, lavoreremo su più interrogazioni in linguaggio naturale (potrei avere alcuni optativi attivi perfetti?) al posto di ” pos: v * roa*”.
E allora?
Pensiamo che questo corpus abbia grandi promesse sia per la ricerca che per l’insegnamento. I filologi devono fare lo studio del corpus oltre la singola parola; più in particolare, i linguisti classici dovrebbero lavorare per rendere più affermazioni basate sull’evidenza e quantitative di quelle che si trovano in gran parte della letteratura attuale. Gli insegnanti che desiderano selezionare quale vocabolario o costruzioni enfatizzare dovrebbero avere una nozione di frequenza di utilizzo e, piuttosto che creare esempi, potrebbero eseguire una rapida ricerca di esempi reali di costruzioni. Per fare un semplice esempio, tre articoli definiti in sequenza non è insolito. Ora puoi trovare esempi reali in Lysias, un autore adatto per classi introduttive e intermedie, per dimostrarlo. In una nota pratica per gli insegnanti, se invii alla tua classe un link di questo tipo, il fenomeno che volevi evidenziare è evidenziato nella pagina. Se desideri attirare l’attenzione dei tuoi studenti su una particolare parte di una pagina, cerca e invia loro l’URL copiato del risultato della ricerca. Vedranno la stessa evidenziazione.
Grande! Come posso aiutare?
Come probabilmente puoi immaginare, ci sono molte molte ruote all’interno delle ruote per far sì che questo sito faccia quello che fa, e talvolta le cose si perdono nella confusione. Se vedete qualcosa di sbagliato, fatecelo sapere. Ecco come potete aiutarci a migliorare questo sito: Se si verifica un problema, si prega di utilizzare il link “Segnala un problema” che troverete nelle pagine dei risultati.
Le correzioni degli utenti per una particolare parola o passaggio avranno sia un impatto locale nel loro contesto, ma possono indicare problemi più diffusi, in modo che possano avere un impatto globale sulla futura accuratezza del database nel suo complesso.
La finestra di analisi ha un modulo di segnalazione dei problemi separato (nel caso in cui nessuna delle analisi sia soddisfacente, o la definizione breve cada, beh, breve).
Cosa succede se voglio fare di più?
Questo progetto non sarebbe stato possibile senza software open source e dati condivisi sotto licenze creative-commons. Se sei un membro della facoltà, personale, studente o amministratore di un istituto di istruzione superiore, informati su Open Access, Open Content e Creative Commons. Sostieni i principi che rappresentano e lavora per il cambiamento dove puoi nella tua istituzione e nelle organizzazioni professionali. Indipendentemente dall’affiliazione, gli appassionati classici possono supportare le organizzazioni che lavorano con questi principi. È possibile supportare open-access e creative-commons progetti orientati che ti piace. Per i classicisti, alcuni siti da visitare, come buona compensazione per questo tipo di informazioni sono di Chuck Jones Mondo Antico Online, Neel Smith Vitruviano blog di Design, e stoa.org.
Crediti
Molto di programmazione per il 2009 il rilascio è stato fatto da un singolo Classici BA perseguire un Master in Computer Science (un buon numero di piani non finanziati lavoro da determinato classicisti aiuta, così come il software open-source e di assistenza da parte dei suoi sviluppatori). Desideriamo registrare la nostra gratitudine all’ufficio del Prevosto dell’Università di Chicago per la sua borsa di studio ATI per 2008-09. E, naturalmente, κδδος a Richard Whaling per tirarlo fuori! Nel decennio successivo, il miglioramento incrementale di Perseus e Logeion non sarebbe stato possibile senza il sostegno del College dell’Università di Chicago, dalle politiche di dean John Boyer per sostenere i progetti di facoltà ai suoi brillanti studenti universitari. (Se sei un undergrad corrente, vieni a trovarmi!)
È tutto?
Una line-up finale, quindi, di persone da ringraziare per il loro aiuto nell’ultimo anno. Tutta la programmazione per la versione 2009 è stata fatta da Richard Whaling. Noi, Richard e Helma, desideriamo ringraziare i nostri disambiguatori: Kristin Dean, Charlotte Krontiris e Ursula Poole; Walt Shandruk, per aver sfogliato una pila di dati latini con breve preavviso; il Progetto Perseus, per aver condiviso dati e competenze; Martin Mueller, per aver consultato e reso disponibili i suoi dati omerici; e Hugh Cayless, per aver reso la nostra vita più facile con il Ringraziamo l’intero staff di ARTFL per accogliere i classicisti in mezzo a loro e condividere generosamente esperienza, caffeina e allegria.
La versione 2018 ha beneficiato notevolmente del lavoro di Walter Shandruk. Mentre guardiamo verso l’implementazione di strumenti più moderni, chiediamo la vostra pazienza con questo sito vecchio stile; pensiamo che abbia ancora qualche chilometraggio in esso!
Settembre 2018,
Helma Dik