Bine ați venit la Perseus sub filologic, ediția 2018

    textele proiectului Perseus încărcate sub filologic sezonul final pentru filologic 3, vara 2018

    Bine ați venit la Perseu sub filologic. A trecut ceva timp de când am lansat o actualizare oficială, dar aici este, datorită wrangling neobosit (de C, perl, apache și multe alte arcana) în această vară de Walt Shandruk. Anii care au urmat au văzut lucrări semnificative în special pe partea textelor grecești și unele îmbunătățiri ale funcționalității filologic pentru … filologi. Aș dori să mulțumesc tuturor celor care ne-au scris de-a lungul anilor pentru a raporta greșeli și alte erori; sau pur și simplu pentru a raporta o întrerupere a serverului. Ne bucurăm că te întorci pentru mai mult.
    dacă nava mamă Perseus de la Tufts reprezintă o bibliotecă bine echipată, cu texte, comentarii, dicționare și alte resurse, toate la îndemâna dvs. pe aceeași pagină, atunci organizarea acestui site poate fi o surpriză. În loc să citim-cu-aparate, ne propunem să oferim explorarea textelor printr-o panoplie de interogări corpus. Deoarece multe texte au fost analizate manual, iar restul cu computerul, puteți căuta în moduri pe care nu le vedeți în prea multe alte locuri: de exemplu, căutați imperative prezente în Platon sau particula doar în linii rostite de Ismene. Privind pentru forme de la sfârșitul sentinței? Suntem aici pentru a le servi. Pentru cititorii cu experiență și post-începători, recomandăm, de asemenea, instrumente care vor fi cunoscute până acum, sper: cuvântul cheie în vizualizarea contextuală și instrumentul de colocare.
    suntem recunoscători pentru toate rapoartele de probleme și sugestiile utilizatorilor; păstrați-le (și donațiile dvs.: -)) venind. Pentru a fi la curent cu evoluțiile, luați în considerare urmărirea noastră pe Twitter: @LogeionGkLat. Lucru care așteaptă: dorim cu adevărat să încorporăm mai multe texte, care devin disponibile în mod constant din biblioteca digitală Perseus. Mai important, trebuie să adaptăm noua generație filologică, Filologică4, la nevoile clasicilor (gândiți-vă: navigare care nu este după numărul paginii într-o ediție; căutări lema; …), astfel încât să nu mai depindem de tehnologia veche de cincisprezece ani. Stay tuned.

    Context: de unde provin aceste texte?

    textele pe care le punem la dispoziție pe acest site sunt practic utilizate cu permisiunea proiectului Perseus de la Universitatea Tufts, cea mai importantă bibliotecă digitală pentru lumea clasică, dacă nu pentru umanitate în general. În colecția sa de materiale grecești și romane,cititorii vor găsi multe dintre textele canonice citite astăzi. Colecția Greekcollection se apropie de 8 milioane de cuvinte, iar colecția Latină are în prezent 5,5 milioane. În plus, sunt incluse multe dicționare în limba engleză, alte lucrări de referință, traduceri și comentarii, astfel încât oricine are o conexiune la internet să aibă acces la echivalentul unei biblioteci clasice de colegiu respectabile. Textele grecești și latine sunt bogat codificate mai degrabă pentru conținut decât pentru formă (de exemplu, nu pauze de pagină, inițiale și liniuțe, ci informații despre vorbitor, informații metrice și repere). Site-ul Perseus este îmbogățit în continuare de mecanisme complexe de legătură între texte (rezultând peste 30 de milioane de legături). Pentru informații de licențiere, detalii despre editori și traducători etc., faceți clic pe linkurile de antet XML care apar în detaliile bibliografice ale textelor. Pentru consultarea lucrărilor de referință, vă recomandăm acum să mergeți direct la Logeion pe web sau într-o aplicație; oferim în continuare un LSJ căutabil, Lewis & scurt și Slater; și am pus un link către dicționarul englez-grec Woodhouse.

    ce ai făcut cu textele? sau: unde este oglinda?

    veți găsi aici o selecție a textului pe site-ul Tufts, dar mecanismul pentrucrowing și căutarea lor este unul diferit. Este filologic, asystem care a fost dezvoltat special pentru baze de date textuale mari de către proiectul ARTFL de la Universitatea din Chicago. În timp ce site-ul original Perseus este un instrument excelent pentru citirea liniară, punând tot felul de resurse pe aceeași pagină în timp ce un utilizator citește un pasaj, am fost interesați să folosim codificarea bogată pentru căutarea textelor și pentru alte sarcini care sunt mai puțin despre citire și mai mult despre cercetare: lingvistica corpusului, mai presus de toate. Suntem recunoscători că proiectul Perseus pune textele sale la dispoziția terților și continuă să trăiască în speranța că alte instituții non-profit dedicate curării textului (grecesc) își vor îmbunătăți ofertele de căutare și analiză sau vor urma exemplul lui Perseus și vor decide să-și pună datele la dispoziție pentru analize avansate cu alte sisteme decât ale lor. Vă rugăm să luați legătura, sau descărca propria copie a PhiloLogic, care este open-source.

    De ce site-ul dvs. nu-mi dă Cicero să citesc când tastez Cicero în caseta de căutare?

    este important să înțelegem că un formular de căutare filologică nu este ca o casetă de căutare Google. Caseta principală de căutare este pentru cuvintele care apar în text, astfel încât tastând ‘Gallia est’ veți găsi propoziția de deschidere a războaielor Galice, dar introducerea ‘Iulius Cezar’ vă va conduce în primă instanță la textele lui Catullus și Cicero. Pornind de la pagina noastră de pornire, faceți clic pe linkul către formularul complet de căutare, unde puteți utiliza câmpurile autor și titlu sau introduceți o citație standard în partea de sus (pe baza dicționarului clasic Oxford). Dacă citația dvs. nu este ceea ce așteaptă serverul, veți obține o listă completă a tuturor textelor, care vă va arăta abrevierea pe care o folosim.

    De ce nu semeni mai mult cu Google?

    filologic este conceput pentru a valorifica codificarea structurală bogată pe care o oferă textele Perseus și, prin urmare, pentru a cunoaște diferența dintre tipurile de conținut: cuvintele din texte, față de așa-numitele metadate: autori, titluri și multe altele. De asemenea, este conceput pentru a permite răspunsuri precise la întrebări specifice, mai degrabă decât estimările stadionului de tipul ‘te simți norocos’. Dacă căutați cuvântul ‘Amicitia’ în texte sau numele ‘Pseudolus’, nu vrem să găsiți instanțe din titluri sau indicații ale vorbitorilor-cu excepția cazului în care specificați că acesta este tipul de informații: titluri care includ amicitia, cuvinte rostite de Pseudolus, pe care le doriți. Credem că ambele abordări au avantajele lor, dar că căutarea mai precisă este ceva pe care clasicii tind să-l dorească. În concluzie, înainte de a introduce ceva într-un câmp de căutare, întrebați-vă ce fel de căutare este aceasta: o căutare de cuvinte sau o căutare de metadate. Dacă căutarea dvs. este pentru metadate, găsiți câmpul de potrivire în altă parte în formularul de căutare. Sfat: făcând clic pe butoanele de lângă câmpurile de căutare, veți obține întotdeauna o listă a opțiunilor dvs.

    De ce sunt rezultatele mele diferite atunci când caut acel alt corpus grecesc?

    câteva distincții importante: cel mai important, acest corpus este probabil mult mai mare decât selecția oferită aici, iar textele sunt adesea de epocă mai recentă. Pe de altă parte, este posibil ca textele să nu fi fost dezambiguate, astfel încât presupunerile despre frecvență pot fi întotdeauna la capătul înalt și includ lemmate care nu apar de fapt în texte sau nu apar cu frecvența afirmată. Am dori să vedem funcționalitatea căutării după o parte a vorbirii sau după un atribut specificat (cum ar fi vorbitorul) și o mai bună pârghie de parsare în corpusul tuturor, dar nu suntem în poziția de a ști ce se întâmplă în spatele ușilor închise. Mai multe întrebări? Fericit pentru a discuta, desigur.

    cum folosesc acest site? Unde s-au dus toate formularele de căutare?

    un tip de reacție am auzit multe despre Perseus original sub site-ul filologic a fost că formularele de căutare au fost destul de intimidante pentru novice. Acum, că am fost în jur de peste un deceniu și cu alternative bune acolo pentru citirea textelor, cum ar fi frumosul nou spectator Scaife, ne întoarcem la rădăcinile noastre, s-ar putea spune. Dacă sunteți în căutarea textelor și traducerilor primare, faceți clic pe greacă sau latină în partea de sus a acestei pagini. Lucrări de referință pot fi găsite în Logeion; gramatici printre monografii.
    textele și traducerile lor trăiesc în aceleași baze de date. Puteți trece de la traducere la original sau le puteți citi una lângă alta, făcând clic pe link-uri (‘engleză’, ‘greacă’, ‘latină’). Dacă există mai multe traduceri, veți vedea ‘English’ și ‘English2’. Pentru o demonstrație a unei vizite tipice, verificați pașii din partea anterioară a acestei prezentări.comentarii și monografii trăiesc în două baze de date separate. Introduceți autorul sau titlul antic în câmpul titlu din formularul de căutare pentru a afla dacă un comentariu este disponibil pentru un anumit text antic. Monografiile includ diverse gramatici. Pe pagina de căutare a monografiilor, există o casetă de căutare rapidă pentru secțiunile gramaticale, în conformitate cu modul în care aceste lucrări sunt citate de obicei în comentarii și în sălile de clasă.
    pentru a căuta un cuvânt și analiza acestuia, faceți clic pe el în textele grecești și latine. Va apărea o fereastră care va oferi, de asemenea, un link către Logeion, care vă va arăta cuvântul așa cum apare în setul complet de dicționare și lucrări de referință pe care le avem disponibile. Căutarea textului integral rămâne disponibilă din formularele de căutare pentru unele dicționare individuale, accesibile din partea de sus a acestei pagini.

    ce browser ar trebui să folosesc? Nu mai găsesc fereastra de analiză! De ce nu este găsit cuvântul meu perfect normal cu accent acut?

    știm despre utilizatorii cu experiențe bune pe Linux, Ubuntu, Windows XP, Mac OS ca sisteme de operare; știm că Opera, Firefox și Safari au fost utilizate cu succes ca browsere. Din păcate, Internet Explorer nu este compatibil cu mecanismul nostru click-to-parse. În toate celelalte browsere pe care le-am testat, un clic pe un cuvânt grecesc sau Latin ar trebui să ducă la o fereastră nouă cu informații de analiză și linkuri către dicționare. Clicurile ulterioare vor duce la reîmprospătarea aceleiași ferestre de analiză; dacă nu vedeți nimic, este posibil ca această fereastră să fie ascunsă în spatele celorlalte ferestre ale browserului. Dacă greaca nu apare ca greacă, asigurați-vă că browserul dvs. se poate ocupa de codificarea UTF-8 și descărcați un font Unicode care are greacă în el. Există o mulțime de fonturi grecești gratuite. Tăierea și lipirea în procesoarele de text ar trebui să fie ușoare. În cele mai multe cazuri, ar trebui să puteți introduce cuvintele pe care le căutați fără diacritice (aceasta înseamnă și: fără respirații și fără transcrieri IOTA) sau în transliterare (consultați”Info & ajutor ” pentru îndrumare); asigurați-vă că selectați și butonul radio corespunzător („fără diacritice”, „transliterare”) atunci când faceți acest lucru.
    detaliu Unicode care este probabil prea multă informație: încercăm să fim consecvenți în utilizarea Unicode pre-combinate și evitarea caracterelor acum depreciate care folosesc ‘oxia’ mai degrabă decât combinațiile canonice ‘tonos’). Dacă utilizați o metodă de introducere greacă care produce varianta ‘oxia’, luați în considerare introducerea căutării fără diacritice atunci când există accente acute în joc sau instalarea unei metode de introducere care respectă practica canonică. Sistemul Mac OS X are intrare greacă politonică încorporată care respectă și aceste standarde.

    ce este această afacere despre morfologie? Și ce înseamnă culorile?

    în primăvara anului 2008 am primit un grant ATI pentru a dezvolta analiza morfologică pentru corpusul grecesc și pentru a-l face căutabil. Puteți afla mai multe despre acest proiect citind rezumate ale prezentărilor noastre pe această temă sau aruncând o privire la acest poster mare despre cum a fost pus împreună. Într-o prezentare mai recentă, prezentăm o prezentare a unui set de căutări. Pentru mai multe detalii despre codurile part-of-speech, consultați secțiunile ‘Info & Help’ din formularele de căutare. Este important să subliniem că textele nu au fost analizate manual, astfel încât vor exista multe analize eronate. Sperăm că ne veți ajuta să le corectăm!
    într-o fereastră de analiză tipică, veți vedea o analiză evidențiată în albastru deschis. Aceasta indică faptul că taggerul nostru automat pentru partea de vorbire a selectat această analiză ca fiind cea mai probabilă în context. Veți vedea un număr (să zicem, 0.45678) asociat cu analiza. Aceasta exprimă probabilitatea sistemului (un computer prost care nu știe limba greacă la fel de bine ca tine!) se asociază cu acea analiză specială. Părți din texte au fost etichetate manual. Dacă întâlniți un formular etichetat manual, acesta va fi de culoare verde. Chiar și acolo, pot apărea probleme de introducere a datelor, așa că vă rugăm să fiți critici și să raportați (trimiteți un formular de raport de problemă prin linkul din fereastra de analiză dacă analiza corectă nu este listată) orice erori pe care le găsiți.

    cum caut atribute morfologice sau Lemme?

    dacă doriți să căutați apariții ale unui cod de lemă sau parte de vorbire, utilizați același câmp de căutare ca și pentru cuvintele normale (sau „șiruri”), dar le prefixați cu „lema:” sau ” pos:”. De exemplu,’ lema:nostos ‘sau’lema:sum’.
    nou: folosind ‘ formular: puteți ignora instrucțiunile mai complexe pentru codurile part-of-speech care urmează. Pur și simplu scrieți ceea ce credeți că va descrie suficient forma pe care o căutați, în orice ordine, dar folosiți cratime între termeni. De exemplu, ‘form:optative-act-singular’ pentru un optativ activ la singular, unde ‘form: SG-opt-act’ ar face același lucru.
    codurile part-of-speech sunt mai puțin simple pentru a rezuma. Info & secțiunea de ajutor are o introducere rapidă. Este important de știut că, în timp ce o analiză completă constituie zece sloturi, multe dintre acestea vor fi goale ( – ), și chiar mai mult nu va fi de interes pentru tine la un moment dat. Toate acestea le puteți lăsa nespecificate cu*, dar formularea dvs. trebuie să fie suficient de specifică încât un ‘a’ să definească acuzativ și nu aorist. Pentru aceasta, este util să se cunoască ordinea diferitelor sloturi. Ele sunt:
    1) cea mai mare parte a vorbirii: Verb, substantiv, adjectiv, pronume, particulă (g), aDverb, nuMeral, prepoziție, conjuncție, Interjecție;
    2) partea minoră a vorbirii: a: Articol sau determinant (Latin este, idem, ipse), Personal, demonstrativ, x: nedefinit, interogativ, relativ, posesiv, k: reflexiv, reciproc, propriu;
    3) persoană: 1, 2, 3;
    4) Număr: singular, plural, dual;
    5) Timp: prezent, Imperfect, aorist, peRfect, pLuperfect, Viitor, Viitor perfect;
    6) dispoziție: indicativ, subjunctiv, optativ, imperativ, infinitiv, participiu, Gerundiv, gerunD, în decubit dorsal;
    7) voce: activ, mijloc, pasiv, mijloc-pasiv;
    8) gen: masculin, feminin, neutru, comun;
    9) caz: nominativ, genitiv, dativ, acuzativ, ablativ, vocativ;
    10) grad: comparativ, superlativ.
    expresiile regulate vor funcționa într-o anumită măsură. De exemplu, s-ar putea specifica doar ‘pos:*a -‘ pentru a captura acuzative. (Toate sloturile de la 1 la 8 sunt aici lăsate nespecificate. Știm acest lucru deoarece câmpul de căutare necesită întotdeauna un cuvânt complet și ne-am încheiat cuvântul cu ‘ – ‘ și nu cu un wild card). Cu toate acestea, această formulare inițială ar lipsi acuzativele care sunt, de asemenea, comparative sau superlative. Pentru a le include, încercați ‘pos: * a’ în schimb. înseamnă ‘alege oricare dintre elementele xyz între paranteze’. În schimb, dacă cineva caută pronume personale, poate avea sens să folosească pos:pp* fără alte specificații despre sloturile 3-8.
    căutările Part-of-speech și lema pot fi combinate, prin intermediul unui semi-colon, sau utilizate separat, cu un spațiu, dacă se specifică cuvinte diferite:căutarea ‘lema:dokew;pos: v-3s.* pos:.* d – ‘ caută forme de XV în al 3-lea singular (punct și virgulă), și separat, ceva în dativ.
    acesta este probabil un moment la fel de bun ca oricare altul pentru a sublinia că parserul nostru și motorul nostru de căutare nu cunosc sintaxa greacă sau chiar Latină! Va trebui să decideți singur, în căutările de acest fel, dacă daivele pe care le găsiți sunt de fapt daive care sunt guvernate de verb.
    este toate acestea destul de copleșitoare? Ne dăm seama că formulele arată mai degrabă interzise! Dacă putem găsi timpul și finanțarea, vom lucra la mai multe interogări ale limbajului natural (aș putea, vă rog, să am câteva optative active perfecte?) pentru a lua locul ‘pos: v * roa*’.

    și ce dacă?

    credem că acest corpus are o mare promisiune atât pentru cercetare, cât și pentru predare. Filologii trebuie să facă studiul corpusului dincolo de un singur cuvânt; mai ales, lingviștii clasici ar trebui să lucreze la a face mai multe afirmații bazate pe dovezi și cantitative decât se găsesc în mare parte din literatura actuală. Profesorii care doresc să selecteze ce vocabular sau construcții să sublinieze ar trebui să aibă o noțiune de frecvență de utilizare și, mai degrabă decât să alcătuiască exemple, ar putea efectua o căutare rapidă a exemplelor reale de construcții. Pentru a da un exemplu simplu, trei articole definite în ordine nu este neobișnuit. Acum Puteți găsi exemple reale în Lysias, un autor potrivit pentru clasele introductive și intermediare, pentru a demonstra acest lucru. Într-o notă practică pentru profesori, dacă trimiteți clasei dvs. un link de acest fel, fenomenul pe care ați dorit să îl evidențiați este evidențiat pe pagină. Dacă doriți să atrageți atenția elevilor dvs. asupra unei anumite părți a unei pagini – căutați-o și trimiteți-le adresa URL copiată a rezultatului căutării. Ei vor vedea aceeași evidențiere.

    grozav! Cu ce vă pot ajuta?

    după cum probabil vă puteți imagina, există multe multe roți în roți pentru a face acest site să facă ceea ce face și, uneori, lucrurile se pierd în shuffle. Dacă vedeți ceva greșit, vă rugăm să ne anunțați. Iată cum ne puteți ajuta să îmbunătățim acest site: dacă întâmpinați o problemă, vă rugăm să folosiți linkul „Raportați o problemă” pe care îl veți găsi în paginile cu rezultate.
    corecțiile utilizatorilor pentru un anumit cuvânt sau pasaj vor avea atât un impact local în contextul lor, dar pot indica probleme mai răspândite, astfel încât acestea pot avea un impact global asupra acurateței viitoare a bazei de date în ansamblu.
    fereastra de analiză are un formular separat de raport de problemă (în cazul în care niciuna dintre analize nu este satisfăcătoare sau definiția scurtă cade, bine, scurtă).

    ce se întâmplă dacă vreau să fac mai mult?

    acest proiect nu ar fi fost posibil fără software open-source și date partajate sub licențe creative-commons. Dacă sunteți membru al Facultății, personal, student sau administrator la o instituție de învățământ superior, informați-vă despre accesul deschis, conținutul deschis și Creative Commons. Susțineți principiile pe care le reprezintă și lucrați pentru schimbare acolo unde puteți în propria instituție și organizații profesionale. Indiferent de afiliere, entuziaștii clasici pot sprijini organizațiile care lucrează cu aceste principii. Puteți sprijini proiecte orientate spre Acces deschis și Creative-commons care vă plac. Pentru clasiciști, unele site-uri de vizitat ca case de compensare bune pentru acest tip de informații sunt Chuck Jones ‘s Ancient World Online, Neel Smith’ s Vitruvian design blog și stoa.org.

    credite

    o mare parte din programarea lansării din 2009 a fost realizată de un singur Classics BA care a urmat un Master în Informatică (o cantitate bună de muncă suplimentară nefinanțată de clasiciști determinați ajută, precum și software open-source și asistență de către dezvoltatorii săi). Dorim să ne înregistrăm recunoștința față de Biroul Provost al Universității din Chicago pentru subvenția ATI pentru 2008-09. Și, desigur, în cinstea lui Richard whaling pentru că l-a scos! În deceniul de atunci, îmbunătățirea incrementală a Perseus și Logeion nu ar fi fost posibilă fără sprijinul Colegiului Universității din Chicago, de la politicile decanului John Boyer pentru sprijinirea proiectelor Facultății până la studenții săi strălucitori. (Dacă sunteți un student curent, Vino să mă găsești!)

    asta e tot?

    o linie finală, apoi, de oameni să-i mulțumesc pentru ajutorul lor în ultimul an. Toată programarea pentru lansarea din 2009 a fost făcută de Richard Whaling. Noi, Richard și Helma, dorim să mulțumim dezambiguizatorilor noștri: Kristin Dean, Charlotte Krontiris și Ursula Poole; Walt Shandruk, pentru că a parcurs o grămadă de date latine în scurt timp; proiectul Perseus, pentru schimbul de date și expertiză; Martin Mueller, pentru consultare și punerea la dispoziție a datelor sale homerice; și Hugh Cayless, pentru că ne-a făcut viața mai ușoară cu Transcoderul său. Mulțumim întregului personal de la ARTFL pentru primirea clasicilor în mijlocul lor și împărtășirea generoasă a expertizei, cofeinei și veseliei.

    lansarea din 2018 a beneficiat foarte mult de munca lui Walter Shandruk. Pe măsură ce ne uităm spre implementarea unor instrumente mai moderne, vă cerem răbdarea cu acest site în stil vechi; credem că are încă un kilometraj în el!

    septembrie 2018,
    Helma Dik

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *