Perseus Projekttexter laddade under PhiloLogicFinal säsong för PhiloLogic 3, Sommar 2018
Välkommen till Perseus under PhiloLogic. Det har varit ett tag sedan vi släppte en officiell uppdatering, men här är det tack vare outtröttlig wrangling (av C, perl, apache och många andra arcana) i sommar av Walt Shandruk. De mellanliggande åren har sett betydande arbete särskilt på sidan av de grekiska texterna, och vissa förbättringar av funktionaliteten hos PhiloLogic för … filologer. Jag vill tacka alla som har skrivit till oss genom åren för att rapportera stavfel och andra fel; eller helt enkelt att rapportera ett serveravbrott. Vi är glada att du kommer tillbaka för mer.
om Perseus moderskepp på Tufts representerar ett välutrustat bibliotek carrel, med texter, kommentarer, ordböcker och andra resurser inom räckhåll på samma sida, då organisationen av denna webbplats kan komma som en överraskning. Snarare än att läsa-med-apparat, vi strävar efter att erbjuda utforskning av texterna genom en panoply av corpus frågor. Eftersom många texter har analyserats för hand, och resten av dem med datorn, kan du söka på ett sätt som du inte ser på alltför många andra platser: till exempel, söka efter nuvarande imperativ i Platon, eller partikeln bara i rader som talas av Ismene. Letar du efter former av bisexuell i slutet av meningen? Vi är här för att servera dem. För erfarna och nybörjare läsare rekommenderar vi också verktyg som nu kommer att vara bekanta, hoppas jag: nyckelordet i Kontextvyn och Samlokaliseringsverktyget.
vi är tacksamma för alla Problemrapporter och användarförslag; håll dem (och dina donationer:-)) kommer. För att hålla dig ajour med utvecklingen, överväga att följa oss på Twitter: @LogeionGkLat. Arbete som väntar: vi vill verkligen införliva fler texter, som stadigt blir tillgängliga från Perseus digitala bibliotek. Ännu viktigare är att vi måste anpassa den nya generationen filologiska, Filologiska4, till klassikernas behov (tänk: navigering som inte är efter sidnummer i en utgåva; lemma-sökningar; …), så att vi inte längre är beroende av femtonårig teknik. Håll ögonen öppna.
bakgrund: var kommer dessa texter ifrån?
de texter vi gör tillgängliga på denna webbplats används praktiskt taget alla med tillstånd från Perseus-projektet vid Tufts University, det mestdigitala biblioteket för den klassiska världen, om inte förmänskligheter i allmänhet. I sin samling av grekiska och Romerska material hittar läsarna många av de kanoniska texterna som läses idag. Greekcollection närmar sig 8 miljoner ord och den latinska samlingen har för närvarande 5,5 miljoner. Dessutom ingår många engelska ordböcker, andra referensverk, översättningar och kommentarer, så att alla med en Internetanslutning har tillgång till motsvarande ett respektabelt College Classics-bibliotek. De grekiska och latinska texterna är rikt kodade för innehåll snarare än form (t.ex. inte sidbrytningar, initialer och strecksatser, men högtalarinformation, metrisk information och milstolpar). Perseus webbplats berikas ytterligare av invecklade länkningsmekanismer bland texter (vilket resulterar i mer än 30 miljoner länkar). För licensinformation, information om redaktörer och översättare etc., klicka på XML-rubriklänkarna som visas i textens bibliografiska detaljer. För att konsultera referensarbetena rekommenderar vi nu att du går direkt till Logeion på webben eller i en app; vi erbjuder fortfarande en sökbar LSJ, Lewis & kort och Slater; och vi har lagt in en länk till Woodhouses engelsk-Grekiska ordbok.
Vad gjorde du med texterna? eller: Var är spegeln?
du hittar här ett urval av texten på Tufts-webbplatsen, men mekanismen för att bläddra och söka dem är en annan. Det är filologiskt, asystem som speciellt utvecklades för stora textdatabaser av ARTFL-projektet vid University of Chicago. Medan den ursprungliga Perseus-webbplatsen är ett utmärkt verktyg för linjär läsning, genom att lägga alla typer av resurser på samma sida medan en användare läser en passage, var vi intresserade av att utnyttja den rika kodningen för att söka i texterna och för andra uppgifter som är mindre om läsning och mer om forskning: corpus lingvistik, framför allt. Vi är tacksamma för att Perseus-projektet gör sina texter tillgängliga för tredje part och fortsätter att leva i hopp om att andra icke-vinstdrivande institutioner som ägnar sig åt (grekisk) texthantering kommer att förbättra sina Sök-och analyserbjudanden eller följa Perseus exempel och besluta att göra sina data tillgängliga för avancerad analys med andra system än sina egna. Vänligen kontakta, eller ladda ner din egen kopia av PhiloLogic, som är öppen källkod.
varför ger inte din webbplats mig Cicero att läsa när jag skriver in Cicero i sökrutan?
det är viktigt att förstå att ett filologiskt sökformulär inte är som en Google-sökruta. Den huvudsakliga sökrutan är för ord som förekommer i texten, så att genom att skriva ’Gallia est’ hittar du öppningsmeningen för galliska krig, men att ange ’Julius Caesar’ kommer i första hand att leda dig till texter av Catullus och Cicero. Från vår hemsida klickar du på länken till hela sökformuläret, där du kan använda författar-och titelfälten eller skriva in en standardcitering högst upp (baserat på Oxford Classical Dictionary). Om din Citat inte är vad servern förväntar sig får du en fullständig lista över alla texter, som visar förkortningen vi använder.
Varför är du inte mer som Google?
PhiloLogic är utformad för att utnyttja den rika strukturella kodningen som Perseus-texter erbjuder, och därför veta skillnaden mellan innehållstyper: ord i texterna, kontra de så kallade metadata: författare, titlar och mycket mer. Den är också utformad för att möjliggöra exakta svar på specifika frågor, snarare än ballpark uppskattningar av ’Känner du dig lycklig’ typ. Om du söker efter ordet ’ amicitia ’i texter, eller efter namnet’ Pseudolus’, vill vi inte att du hittar instanser från titlar eller talarindikationer-om du inte anger att det är den typen av information: titlar som innehåller amicitia, ord som talas av Pseudolus, som du vill ha. Vi tror att båda metoderna har sina fördelar men att mer exakt sökning är något som klassikererna tenderar att vilja ha. Sammanfattningsvis, innan du anger något i ett sökfält, fråga dig själv vilken typ av sökning det här är: en ordsökning eller en sökning efter metadata. Om din sökning är för metadata, hitta passande fält någon annanstans på sökformuläret. Tips: genom att klicka på knapparna bredvid sökfälten får du alltid en lista över dina alternativ.
Varför är mina resultat annorlunda när jag söker efter det andra grekiska korpuset?
flera viktiga skillnader: viktigast av allt är att corpus förmodligen är mycket mycket större än urvalet som erbjuds här, och texterna är ofta av nyare årgång. Å andra sidan kanske texterna inte har blivit disambiguerade, så att gissningar om frekvens alltid kan vara i high end och inkludera lemmata som faktiskt inte förekommer i texterna eller inte förekommer med den frekvens som hävdas. Vi skulle vilja se funktionaliteten att söka efter del av tal eller av specificerat attribut (som högtalare) och bättre utnyttja parsing i allas corpus, men vi är inte i stånd att veta vad som händer bakom stängda dörrar. Fler frågor? Glad att chatta, förstås.
Hur använder jag den här webbplatsen? Vart tog alla sökformulär vägen?
en typ av reaktion vi hörde mycket om den ursprungliga Perseus under filologiska platsen var att sökformulären var ganska skrämmande för nybörjaren. Nu när vi har funnits i över ett decennium, och med bra alternativ där ute för att läsa texter, som den vackra nya Scaife Viewer, går vi tillbaka till våra rötter, kanske du säger. Om du letar efter de primära texterna och översättningarna klickar du på grekiska eller latinska högst upp på denna sida. Referensverk finns i Logeion; grammatiker bland monografierna.
texter och deras översättningar lever i samma databaser. Du kan gå från översättning till original, eller läsa dem sida vid sida, genom att klicka på länkar (’engelska’, ’grekiska’, ’Latin’). Om det finns flera översättningar ser du’ engelska ’och’Engelska2’. För en demonstration av ett typiskt besök, kontrollera stegen i den tidigare delen av denna presentation.
kommentarer och monografier finns i två separata databaser. Ange forntida författare eller titel i fältet titel på sökformuläret för att ta reda på om en kommentar är tillgänglig för en viss gammal text. Monografier inkluderar olika grammatiker. På söksidan för monografierna finns en snabb sökruta för grammatiksektioner, i enlighet med hur dessa verk vanligtvis citeras i kommentarer och i klassrum.
för att slå upp ett ord och dess tolkning, klicka på det i de grekiska och latinska texterna. Ett fönster visas som också ger en länk till Logeion, som visar ordet som det visas i hela uppsättningen ordböcker och referensverk vi har tillgängliga. Fulltextsökning förblir tillgänglig från sökformulären för vissa enskilda ordböcker, tillgängliga från toppen av denna sida.
vilken webbläsare ska jag använda? Jag hittar inte tolkningsfönstret längre! Varför hittas inte mitt helt normala ord med en akut accent?
vi vet om användare med goda erfarenheter på Linux, Ubuntu, Windows XP, Mac OS som operativsystem; vi vet att Opera, Firefox och Safari har framgångsrikt använts som webbläsare. Tyvärr är Internet Explorer inte kompatibel med vår click-to-parse-mekanism. I alla andra webbläsare som vi har testat bör ett klick på ett grekiskt eller latinskt ord resultera i ett nytt fönster med analysinformation och länkar till ordböcker. Efterföljande klick kommer att resultera i samma parse fönster är ’uppdateras’; om du inte ser något, kan det vara så att det här fönstret är dolt bakom andra webbläsarfönster. Om Grekiska inte visas som grekiska, se till att din webbläsare kan hantera UTF-8-kodning och ladda ner några Unicode-teckensnitt som har grekiska i den. Det finns gott om gratis grekiska teckensnitt. Att klippa och klistra in i ordbehandlare ska vara enkelt. I de flesta fall borde du kunna skriva in ord du söker efter utan diakritik (det betyder också: inga andetag och inga iota-underskrifter), eller i transliteration (se”Info & hjälp ” för vägledning); var noga med att också välja motsvarande alternativknapp (”ingen diakritik”, ”transliteration”) när du gör detta.
Unicode-detalj som förmodligen är för mycket information: vi försöker vara konsekventa när vi använder förkombinerad Unicode och undviker de nu föråldrade tecknen som använder ’oxia’ snarare än de kanoniska ’tonos’ kombinationerna). Om du använder en grekisk inmatningsmetod som producerar ’oxia’ – varianten, överväg att ange din sökning utan diakritik när det finns akuta accenter i spel eller installera en inmatningsmetod som följer kanonisk praxis. Mac OS X-systemet har inbyggd polytonisk grekisk ingång som också uppfyller dessa standarder.
Vad handlar det här om morfologi? Och vad betyder färgerna?
våren 2008 fick vi ett ATI-bidrag för att utveckla morfologisk analys för det grekiska korpuset och göra det sökbart. Du kan lära dig mer om detta projekt genom att läsa sammanfattningar av våra presentationer om detta ämne eller ta en titt på den här stora affischen om hur det hela sattes ihop. I en nyare presentation presenterar vi en genomgång av en uppsättning sökningar. För mer information om del-av-tal-koder, se avsnittet”Info & hjälp ” i sökformulären. Det är viktigt att påpeka att texterna inte analyserades för hand, så att det kommer att finnas många felaktiga analyser. Vi hoppas att du hjälper oss att rätta till dem!
i ett typiskt parse-fönster ser du en parse markerad i ljusblått. Det indikerar att vår automatiska del-av-tal tagger har valt denna tolkning som den mest troliga i sammanhanget. Du kommer att se ett nummer (säg 0.45678) associerat med analysen. Detta uttrycker sannolikheten systemet (en dum dator som inte vet grekiska så bra som du gör!) associerar med just den analysen. Delar av texterna är handmärkta. Om du stöter på en hand taggad form kommer den att vara grön i färg. Även där kan datainmatningsproblem komma upp, så var kritisk och rapportera (skicka in ett problemrapportformulär via länken i parse-fönstret om rätt parse inte listas) eventuella fel du hittar.
Hur söker jag efter morfologiska attribut eller lemmas?
om du vill söka efter förekomster av en lemma-eller talkod använder du samma sökfält som för vanliga ord (eller ”strängar”), men du prefixar dem med ”lemma:” eller ” pos:”. Till exempel’ lemma:nostos ’eller’lemma:sum’.
nytt: genom att använda ’ form:’du kan ignorera de mer komplexa instruktionerna för del-av-tal-koder som följer. Skriv bara ut vad du tror kommer att beskriva formuläret du letar efter, i vilken ordning som helst, men använd bindestreck mellan termer. Till exempel,’ form:optativ-act-singular ’för en aktiv optativ i singularen, där’ form:sg-opt-act ’ skulle göra samma sak.
del-av-tal-koderna är mindre enkla att sammanfatta. Info & hjälpavsnittet har en snabb introduktion. Det är viktigt att veta att medan en fullständig analys utgör tio spelautomater, många av dessa kommer att vara tom (-), och ännu mer kommer inte att vara av intresse för dig vid en given tidpunkt. Alla dessa kan du lämna ospecificerade med*, men din formulering måste vara specifik nog att en ’ a ’ definierar ackusativ och inte aorist. För detta är det bra att veta beställning av de olika spelautomater. De är:
1) större del av tal: Verb, substantiv, adjektiv, pronomen, partikel (g), aDverb, siffra, pReposition, konjunktion, interjektion;
2) mindre del av tal: a: Artikel eller determinativ (Latin är, idem, ipse), personlig, demonstrativ, x: obestämd, frågande, relativ, possessiv, k: reflexiv, ömsesidig, korrekt;
3) person: 1, 2, 3;
4) nummer: singular, plural, dubbel;
5) spänd: nuvarande, ofullkomlig, Aorist, perfekt, pluperfekt, framtida, framtida perfekt;
6) humör: vägledande, subjunktiv, optativ, imperativ, infinitiv, Participle, Gerundive, gerunD, liggande;
7) röst: aktiv, mitten, passiv, Medelpassiv;
8) Kön: maskulin, feminin, neutral, vanlig;
9) fall: nominativ, genitiv, dativ, ackusativ, ablativ, vokativ;
10) grad: jämförande, superlativ.
reguljära uttryck kommer att fungera i viss utsträckning. Till exempel kan man bara ange ’pos:*a-’ för att fånga ackusativ. (Allt spelautomater från 1 till 8 är här kvar ospecificerade. Vi vet detta eftersom sökfältet alltid kräver ett komplett ord, och vi har avslutat vårt ord med ’-’ och inte med ett jokertecken). Denna initiala formulering skulle emellertid sakna ackusativ som också är komparativ eller superlativ. För att inkludera dem, prova ’pos:*a’ istället. betyder ’välj något av objekten xyz mellan parenteserna’. Omvänt, om man letar efter personliga pronomen, kan det vara vettigt att använda pos:pp* utan ytterligare specifikation om slots 3-8.
del-av-tal och lemma sökningar kan kombineras, med hjälp av en semi-kolon, eller användas separat, med ett mellanslag, om man anger olika ord:sökningen ’lemma:dokew;pos: v-3s.* pos:.* d – ’ söker efter former av Kubi i 3: e singularen (semikolon), och separat, något i dativet.
Detta är förmodligen lika bra ett ögonblick som någon för att påpeka att vår parser och vår sökmotor inte känner till grekisk eller till och med latinsk syntax! Du måste själv bestämma, i sökningar av detta slag, om de datives du hittar är faktiskt datives som styrs av verbet.
är allt detta ganska överväldigande? Vi inser att formlerna ser ganska förbjudna ut! Om vi kan hitta tid och finansiering kommer vi att arbeta med mer naturligt språkfrågor (kan jag snälla ha några perfekta aktiva optativ?) att ersätta ’pos: v * roa*’.
så vad?
vi tror att detta korpus håller stort löfte både för forskning och för undervisning. Filologer måste göra corpus studie bortom det enda ordet; mer specifikt, klassiska lingvister bör arbeta med att göra mer evidensbaserade och kvantitativa påståenden än vad som finns i mycket av den nuvarande litteraturen. Lärare som vill välja vilket ordförråd eller konstruktioner som ska betonas bör ha en uppfattning om användningsfrekvens, och snarare än att göra upp exempel kan de göra en snabb sökning efter faktiska exempel på konstruktioner. För att ge ett enkelt exempel är tre bestämda artiklar i följd inte ovanliga. Nu kan du hitta faktiska exempel i Lysias, en lämplig författare för inledande och mellanliggande klasser, för att visa detta. På en praktisk anteckning för lärare, om du skickar din klass en länk av detta slag, det fenomen du ville markera markeras på sidan. Om du vill uppmärksamma dina elever på en viss del av en sida – Sök efter den och skicka dem den kopierade webbadressen till sökresultatet. De kommer att se samma markering.
bra! Hur kan jag hjälpa till?
som du säkert kan föreställa dig finns det många många hjul inom hjul för att få den här webbplatsen att göra vad den gör, och ibland går saker vilse i shuffle. Om du ser något fel, vänligen meddela oss. Så här kan du hjälpa oss att förbättra denna webbplats: om du stöter på ett problem, använd länken ”Rapportera ett Problem” som du hittar på resultatsidorna.
användarkorrigeringar för ett visst ord eller en passage kommer att ha både en lokal inverkan i sitt sammanhang, men kan peka på mer utbredda problem, så att de kan få en global inverkan på databasens framtida noggrannhet som helhet.
parse-fönstret har ett separat problemrapportformulär (om ingen av analyserna är tillfredsställande eller den korta definitionen faller, ja, kort).
vad händer om jag vill göra mer?
detta projekt skulle inte ha varit möjligt utan programvara med öppen källkod och data som delas under creative-commons-licenser. Om du är fakultetsmedlem, personal, student eller administratör vid en institution för högre utbildning, bli informerad om Open Access, Open Content och Creative Commons. Stödja de principer de representerar och arbeta för förändring där du kan i din egen institution och yrkesorganisationer. Oavsett anslutning kan klassiska entusiaster stödja organisationer som arbetar med dessa principer. Du kan stödja Open-access och creative-commons orienterade projekt som du gillar. För klassicister är vissa webbplatser att besöka som bra clearinghus för denna typ av information Chuck Jones antika värld Online, Neel Smiths Vitruvian Designblogg och stoa.org.
Credits
mycket av programmeringen på 2009-utgåvan gjordes av en enda klassiker BA som bedriver en Master i datavetenskap (en bra mängd ytterligare ofinansierat arbete av bestämda klassicister hjälper, liksom programvara med öppen källkod och hjälp av dess utvecklare). Vi vill registrera vår tacksamhet till Provosts kontor vid University of Chicago för dess ati-bidrag för 2008-09. Och naturligtvis, Bisexuell till Richard Whaling för att dra bort det! Under årtiondet sedan, inkrementell förbättring av Perseus och Logeion skulle inte ha varit möjligt utan stöd av College of University of Chicago, från dean John Boyers politik för att stödja fakultetsprojekt till sina lysande studenter. (Om du är en nuvarande undergrad, kom och hitta mig!)
är det allt?
en sista uppställning av människor att tacka för deras hjälp under det senaste året. All programmering för 2009-utgåvan gjordes av Richard Whaling. Vi, Richard och Helma, vill tacka våra disambiguatorer: Kristin Dean, Charlotte Krontiris och Ursula Poole; Walt Shandruk, för att mumsa genom en hög med latinska data med kort varsel; Perseus-projektet, för att dela data och expertis; Martin Mueller, för samråd och tillgängliggörande av hans homeriska data; och Hugh Cayless, för att göra vårt liv enklare med sin Transcoder. Vi tackar hela personalen på ARTFL för att välkomna klassicister i deras mitt och generöst dela expertis, koffein, och glädje.
2018 års utgåva har haft stor nytta av arbete av Walter Shandruk. När vi ser mot att implementera mer moderna verktyg ber vi om ditt tålamod med den här gammaldags webbplatsen; vi tror att den fortfarande har lite körsträcka i den!
September 2018,
Helma Dik