Perseus Prosjekt Tekster Lastet Under PhiloLogicFinal season For PhiloLogic 3, Summer 2018
Velkommen Til Perseus Under PhiloLogic. Det har vært en stund siden vi ga ut en offisiell oppdatering, men her er det, takket være ufattelig wrangling (av C, perl, apache og Mange andre arcana) I sommer Av Walt Shandruk. De mellomliggende årene har sett betydelig arbeid spesielt på siden av de greske tekster, og noen forbedringer i funksjonaliteten PhiloLogic for … filologer. Jeg vil gjerne takke alle de som har skrevet til oss gjennom årene for å rapportere skrivefeil og andre feil; eller bare å rapportere en serverbrudd. Vi er glade for at du stadig kommer tilbake for mer. Hvis Perseus moderskipet På Tufts representerer et velutstyrt bibliotek carrel, med tekster, kommentarer, ordbøker og andre ressurser innen rekkevidde på samme side, så organiseringen av dette nettstedet kan komme som en overraskelse. Snarere enn å lese-med-apparat, vi tar sikte på å tilby utforskning av tekstene gjennom en panoply av corpus spørringer. Fordi mange tekster har blitt analysert for hånd, og resten av dem med datamaskinen, kan du søke på måter som du ikke ser på for mange andre steder: for eksempel, søk etter nåværende imperativer I Platon, eller partikkel μέν bare i linjer talt av ismene. Leter du etter former for βροτός på slutten av setningen? Vi er her for å tjene dem. For erfarne og etterbegynnere anbefaler vi også verktøy som nå vil være kjent, håper jeg: Søkeordet i Kontekstvisning og Samlokaliseringsverktøyet.
Vi er takknemlige for alle problemrapporter og brukerforslag; hold dem (og dine donasjoner:-)) kommer. For å holde deg oppdatert på utviklingen, bør du vurdere å følge Oss På Twitter: @LogeionGkLat. Arbeid som venter: vi ønsker virkelig å innlemme flere tekster, som stadig blir tilgjengelige fra Perseus Digitale Bibliotek. Enda viktigere, vi må tilpasse den nye generasjonen Filologiske, Filologiske 4, til klassikernes behov (tenk: navigasjon som ikke er etter sidetall i en utgave; lemma-søk;…), slik at vi ikke lenger er avhengige av femten år gammel teknologi. Følg med.
Bakgrunn: hvor kommer disse tekstene fra?
tekstene vi gjør tilgjengelig på dette nettstedet er praktisk talt alle brukt med tillatelse Fra Perseus-Prosjektet Ved Tufts University, foremostDigital-Biblioteket for den klassiske verden, om ikke forhumaniteter generelt. I sin samling av greske og Romerske materialer finner leserne mange av de kanoniske tekstene som leses i dag. Greekcollection nærmer seg 8 millioner ord og den latinske samlingen har for tiden 5,5 millioner. I tillegg er mange engelskspråklige ordbøker, andre oppslagsverk, oversettelser, og kommentarer inkludert, slik at alle med en internett-tilkobling har tilgang til tilsvarende en respektabel College Classics bibliotek. De greske og latinske tekstene er rikt kodet for innhold i stedet for form (f.eks. ikke sideskift, initialer og innrykk, men talerinformasjon, metrisk informasjon og milepæler). Perseus-nettstedet er ytterligere beriket av intrikate koblingsmekanismer mellom tekster (noe som resulterer i mer enn 30 millioner lenker). For lisensiering informasjon, detaljer om redaktører og oversettere, etc., klikk PÅ XML-Header-koblingene som vises i de bibliografiske detaljene i teksten. For å konsultere oppslagsverkene anbefaler vi nå å gå rett til Logeion på nettet eller i en app; vi tilbyr fortsatt en søkbar LSJ, Lewis & Short og Slater; og vi har lagt inn en lenke Til Woodhouses engelsk-greske Ordbok.
Hva gjorde du med tekstene? eller: Hvor er speilet?
du vil her finne et utvalg av teksten På Tufts nettstedet, men mekanismen forbrowsing og søke dem er en annen. Det Er Filologisk, asystem som ble spesielt utviklet for store tekstdatabaser AV ARTFL-prosjektet Ved University Of Chicago. Mens det opprinnelige Perseus-nettstedet er et utmerket verktøy for lineær lesing, ved å sette alle slags ressurser på samme side mens en bruker leser et passasje, var vi interessert i å utnytte den rike kodingen for å søke på teksten, og for andre oppgaver som er mindre om lesing og mer om forskning: corpus lingvistikk, fremfor alt. Vi er takknemlige For At Perseus-Prosjektet gjør sine tekster tilgjengelig for tredjeparter, og fortsetter å leve i håp om at andre ikke-for-profit institusjoner viet til (gresk) tekst curation vil forbedre sine søk og analyse tilbud, eller følge eksempelet Til Perseus, og bestemmer seg for å gjøre sine data tilgjengelig for avansert analyse med andre systemer enn sine egne. Vennligst ta kontakt, eller laste ned din egen kopi Av PhiloLogic, som er åpen kildekode.
hvorfor gir ikke nettstedet meg Cicero å lese når Jeg skriver Inn Cicero i søkeboksen?
det er viktig å forstå at Et Filologisk søkeskjema ikke er Som En Google – søkeboks. Hovedsøkeboksen er for ord som forekommer i teksten, slik at Ved å skrive ‘Gallia est’ finner du åpningssetningen Til De Galliske Krigene, men å skrive Inn ‘Julius Caesar’ vil i første omgang føre deg til tekster Av Catullus og Cicero. Fra vår hjemmeside, klikk på linken til hele søkeskjemaet, der du kan bruke Forfatter-og Tittelfeltene eller skrive inn en standard sitat øverst(basert På Oxford Classical Dictionary). Hvis ditt sitat ikke er hva serveren forventer, får du en fullstendig liste over alle teksten, som vil vise deg forkortelsen vi bruker.
Hvorfor Er Du Ikke Mer Som Google?
PhiloLogic er designet for å utnytte den rike strukturelle kodingen Som Perseus tekster tilbyr, og derfor å vite forskjellen mellom innholdstyper: ord i teksten, versus de såkalte metadataene: forfattere, titler og mye mer. Det er også designet for å tillate presise svar på bestemte spørsmål, snarere enn omtrentlig anslag av ‘føler du deg heldig’ type. Hvis du søker etter ordet ‘amicitia’ i tekster, eller for navnet ‘Pseudolus’, vil vi ikke at du skal finne forekomster fra titler, eller høyttaler indikasjoner-med mindre du angir at det er den type informasjon: titler som inkluderer amicitia, ord talt Av Pseudolus, som du vil. Vi tror at begge tilnærmingene har sine fordeler, men at mer presis søking er noe som klassikerne har en tendens til å ønske. I sum, før du skriver noe i et søkefelt, spør deg selv hva slags søk dette er: et ordsøk eller et søk etter metadata. Hvis søket ditt er etter metadata, finner du tilpasningsfeltet et annet sted i søkeskjemaet. Tips: ved å klikke på knappene ved siden av søkefeltene, vil du alltid få en liste over alternativene dine.
Hvorfor er mine resultater annerledes når jeg søker som andre greske corpus?
Flere viktige forskjeller: Viktigst, at corpus er trolig mye mye større enn utvalget som tilbys her, og tekstene er ofte av nyere årgang. På den annen side kan teksten ikke ha blitt disambiguert, slik at gjetninger om frekvens alltid kan være i høy enden og inkludere lemmata som ikke faktisk forekommer i teksten eller ikke forekommer med frekvensen hevdet. Vi vil gjerne se funksjonaliteten til å søke etter del-av-tale, eller ved spesifisert attributt( for eksempel høyttaler), og bedre utnytte av parsing i alles corpus, men vi er ikke i stand til å vite hva som foregår bak lukkede dører. Flere spørsmål? Glad for å chatte, selvfølgelig.
hvordan bruker jeg dette nettstedet? Hvor gikk alle søkeskjemaene?
en type reaksjon vi hørte mye om den opprinnelige Perseus Under Filologiske nettstedet var at søkeskjemaene var ganske skremmende for nybegynnere. Nå som vi har eksistert i godt over et tiår, og med gode alternativer der ute for å lese tekster, som den vakre Nye Scaife Viewer, går vi tilbake til våre røtter, kan du si. Hvis du er ute etter de primære tekster og oversettelser, klikk gresk eller Latin øverst på denne siden. Oppslagsverk kan bli funnet I Logeion; grammatikker blant monografier.
Tekster og deres oversettelser lever i de samme databasene. Du kan gå fra oversettelse til original, eller lese dem ved siden av hverandre, ved å klikke på lenker (‘engelsk’, ‘gresk’,’Latin’). Hvis det er flere oversettelser, vil du se ‘engelsk’ Og ‘Engelsk2’. For en demonstrasjon av et typisk besøk, se trinnene i den tidligere delen av denne presentasjonen.Kommentarer og Monografier lever i to separate databaser. Skriv inn gammel forfatter eller tittel i tittelfeltet i søkeskjemaet for å finne ut om en kommentar er tilgjengelig for en bestemt gammel tekst. Monografier inkluderer ulike grammatikker. På søkesiden for monografiene er det en rask oppslagsboks for grammatikkseksjoner, i samsvar med hvordan disse arbeidene vanligvis blir sitert i kommentarer og i klasserom. for å slå opp et ord og dets analyse, klikk på det i greske og latinske tekster. Et vindu vil dukke opp som også vil gi en link Til Logeion, som vil vise deg ordet som det vises i hele settet av ordbøker og oppslagsverk vi har tilgjengelig. Fulltekstsøk er fortsatt tilgjengelig fra søkeskjemaene for enkelte individuelle ordbøker, tilgjengelig fra toppen av denne siden.
hvilken nettleser skal jeg bruke? Jeg kan ikke finne parsing vinduet lenger! Hvorfor er mitt helt normale ord med en akutt aksent ikke funnet?
vi vet om brukere med gode erfaringer På Linux, Ubuntu, Windows XP, Mac OS som operativsystemer; Vi vet At Opera, Firefox og Safari har blitt brukt som nettlesere. Dessverre Internet Explorer er ikke kompatibel med vår klikk-til-parse mekanisme. I alle andre nettlesere vi har testet, bør et klikk på et gresk eller latinsk ord resultere i et nytt vindu med analyseinformasjon og lenker til ordbøker. Påfølgende klikk vil resultere i samme parse vinduet blir ‘uthvilt’ ; hvis du ikke ser noe, kan det være at dette vinduet er skjult bak andre nettleservindu (er). Hvis gresk ikke vises som gresk, må du kontrollere at nettleseren din kan håndtere utf-8-koding, og laste ned Noen Unicode-skrift som har gresk i den. Det er mange gratis greske skrifter. Klippe og lime inn tekstbehandlere bør være enkelt. I de fleste tilfeller bør du kunne skrive inn ord du søker etter uten diakritiske tegn (dette betyr også: (se ‘Info & Hjelp ‘ for veiledning); bare sørg for å også velge den tilsvarende radioknappen (‘ingen diakritiske tegn’,’ translitterasjon’) når du gjør dette. Unicode-detaljer som sannsynligvis er for mye informasjon: vi prøver å være konsistente med å bruke pre-combined Unicode og unngå de nå utdaterte tegnene som bruker ‘oxia’ i stedet for de kanoniske tonos-kombinasjonene). Hvis du bruker en gresk inndatametode som produserer ‘oxia’ – varianten, bør du vurdere å skrive inn søket ditt uten diakritiske tegn når det er akutte aksenter i spill eller installere en inndatametode som overholder kanonisk praksis. Mac OS X-systemet har innebygd polytonisk gresk inngang som også overholder disse standardene.
Hva er denne virksomheten om morfologi? Hva betyr fargene?
Våren 2008 mottok VI et ati-stipend for å utvikle morfologisk analyse for det greske korpuset, og for å gjøre det søkbart. Du kan lære mer om dette prosjektet ved å lese sammendrag av våre presentasjoner om dette emnet eller ta en titt på denne store plakaten om hvordan det hele ble satt sammen. I en nyere presentasjon presenterer vi en gjennomgang av et sett med søk. For mer informasjon om del-av-tale koder, se’ Info & Hjelp ‘ seksjoner på søkeskjemaer. Det er viktig å påpeke at teksten ikke ble analysert for hånd, slik at det blir mange feilaktige analyser. Vi håper du vil hjelpe oss med å rette opp dem!
i et typisk analysevindu ser du en analyse uthevet i lyseblå. Det indikerer at vår automatiske del-of-speech-tagger har valgt denne analysen som den mest sannsynlige i konteksten. Du vil se et tall (si 0,45678) knyttet til analysen. Dette uttrykker sannsynligheten for systemet (en dum datamaskin som ikke vet gresk så vel som du gjør!) assosierer med den aktuelle analysen. Deler av teksten er håndskrevet. Hvis du støter på en hånd-merket form, vil det være grønn i fargen. Selv der kan dataregistreringsproblemer komme opp, så vær kritisk og rapporter (send inn et problemrapportskjema via lenken i analysevinduet hvis riktig analyse ikke er oppført) eventuelle feil du finner.
hvordan søker jeg etter morfologiske attributter eller lemmaer?
hvis du ønsker å søke etter forekomster av en lemma eller del-of-speech-kode, bruker du samme søkefelt som for vanlige ord (eller «strenger»), men du prefikser dem med’ lemma: ‘eller’ pos:’. For eksempel ‘lemma: nostos ‘eller’ lemma: sum’.
Nytt: ved å bruke ‘form:’du kan ignorere de mer komplekse instruksjonene for del-av-tale koder som følger. Bare skriv ut hva du tror vil tilstrekkelig beskrive skjemaet du leter etter, i hvilken som helst rekkefølge, men bruk bindestreker mellom vilkår. For eksempel, ‘form: optativ-act-singular’ for en aktiv optativ i entallet, hvor ‘form: sg-opt-act’ ville gjøre det samme.
del-of-tale koder er mindre enkle å oppsummere. Info& Hjelp-delen har en rask introduksjon. Det er viktig a vite at mens en full analyse utgjor ti slots, vil mange av disse v re tomme (-), og enda flere vil ikke v re av interesse for deg pa et gitt tidspunkt. Alle disse kan du forlate uspesifisert med*, men formuleringen din må være spesifikk nok til at en ‘ a ‘ definerer akkusativ og ikke aorist. For dette er det nyttig a vite bestilling av de forskjellige sporene. De er:
1) major del av tale: Verb, Substantiv, Adjektiv, Pronomen, partikkel (g), aDverb, tall, preposisjon, Konjunksjon, Interjection;
2) mindre del av tale: a: Artikkel eller determinativ (Latin er, idem, ipse), Personlig, Demonstrerende, x: ubestemt, Spørrende, Relativ, possessiv, k: refleksiv, gjensidig, riktig;
3) person: 1, 2, 3;
4) antall: singular, flertall, dual;
5) tid: Nåtid, Ufullkommen, Aorist, perfekt, pLuperfect, Fremtid, fremtidig perfekt;
6) humør: Indikativ, Subjunktiv, Optativ, imperativ, infinitiv, Participle, Gerundive, gerundive, liggende;
7) stemme: aktiv, mellom, Passiv, mellom-passiv;
8) Kjønn: maskulin, feminin, neuter, vanlig;
9) sak: nominativ, genitiv, dativ, akkusativ, ablativ, vokativ;
10) Grad: Komparativ, Superlativ.
Regulære uttrykk vil fungere til en viss grad. For eksempel kan man bare spesifisere ‘pos:*a -‘ for å fange akkusativer. (Alle spor fra 1 til 8 er her igjen uspesifisert. Vi vet dette fordi søkefeltet alltid krever et komplett ord, og vi har avsluttet vårt ord med ‘-‘ og ikke med et vilt kort). Denne første formuleringen vil imidlertid savne akkusativer som også er komparativer eller superlativer. For å inkludere dem, prøv ‘pos: * a’ i stedet. betyr ‘velg et av elementene xyz mellom parentesene’. Omvendt, hvis man ser etter personlige pronomen, kan det være fornuftig a bruke pos: pp * uten ytterligere spesifikasjon om slots 3-8.
Part-of-tale og lemma søk kan kombineres, ved hjelp av en semikolon, eller brukes separat, med et mellomrom, hvis man angir forskjellige ord :søket ‘ lemma: dokew; pos: v-3s.* pos:.* d – ‘ søker etter former for δοκέω i 3. entall (semikolon), og separat, noe i dativ.
dette er trolig like godt et øyeblikk som noen å påpeke at vår parser og vår søkemotor ikke vet gresk eller Latin syntaks! Du må selv bestemme, i søk av denne typen, om de dativene du finner, faktisk er dativer som styres av verbet.
Er alt dette ganske overveldende? Vi innser at formlene ser ganske avskrekkende ut! Hvis vi kan finne tid og finansiering, vil vi jobbe med mer naturlig språk spørring (kan jeg ha noen perfekte aktive optativer?) for å ta plassen til ‘pos: v * roa*’.
Så hva?
vi tror at dette corpus har store løftet både for forskning og for undervisning. Filologer trenger å gjøre corpus studie utover enkelt ord; mer spesielt, klassiske lingvister bør arbeide med å gjøre mer evidensbaserte og kvantitative krav enn det som finnes i mye av dagens litteratur. Lærere som ønsker å velge hvilket ordforråd eller konstruksjoner som skal vektlegges, bør ha en oppfatning av bruksfrekvens, og i stedet for å lage eksempler, kan de kjøre et raskt søk etter faktiske eksempler på konstruksjoner. For å gi et enkelt eksempel, tre bestemte artikler i rekkefølge er ikke uvanlig. Nå kan du finne faktiske eksempler I Lysias, en egnet forfatter for innledende og mellomliggende klasser, for å demonstrere dette. På et praktisk notat for lærere, hvis du sender klassen en lenke av denne typen, er fenomenet du ønsket å markere uthevet på siden. Hvis du ønsker å trekke elevenes oppmerksomhet til en bestemt del av en side – søk etter den, og send DEM den kopierte NETTADRESSEN til søkeresultatet. De vil se den samme uthevingen.
Flott! Hvordan kan jeg hjelpe?
som du sikkert kan forestille deg, er det mange mange hjul i hjulene for å få dette nettstedet til å gjøre hva det gjør, og noen ganger går det seg vill i shuffle. Hvis du ser noe galt, vennligst gi oss beskjed. Her er hvordan du kan hjelpe oss med å forbedre dette nettstedet: hvis du støter på et problem, vennligst bruk» Rapporter Et Problem » linken som du finner på Resultatsidene. Brukerrettelser for et bestemt ord eller avsnitt vil ha både en lokal innvirkning i deres sammenheng, men kan peke på mer utbredte problemer, slik at de kan ha en global innvirkning på fremtidig nøyaktighet av databasen som helhet. analysevinduet har et eget problemrapportskjema (hvis ingen av analysene er tilfredsstillende, eller den korte definisjonen faller, vel, kort).
Hva om jeg vil gjøre mer?
dette prosjektet ville ikke vært mulig uten åpen programvare og data delt under creative commons-lisenser. Hvis du er en ansatt, ansatte, student, eller administrator ved en institusjon for høyere utdanning, bli informert Om Open Access, Åpent Innhold og Creative Commons. Støtt prinsippene de representerer, og arbeid for endring der du kan i din egen institusjon og profesjonelle organisasjoner. Uavhengig av tilknytning, kan klassiske entusiaster støtte organisasjoner som arbeider med disse prinsippene. Du kan støtte åpen tilgang og creative-commons orienterte prosjekter som du liker. For klassisister, noen steder å besøke som gode clearing hus for denne typen informasjon Er Chuck Jones Ancient World Online, Neel Smiths Vitruvian Design blogg, og stoa.org.
Credits
Mye av programmeringen på 2009-utgivelsen ble gjort av en Enkelt Classics BA som forfulgte En Mastergrad I Datavitenskap(en god mengde ekstra unfunded arbeid av bestemte klassikere hjelper, samt åpen kildekode programvare og assistanse fra utviklerne). Vi ønsker å registrere vår takknemlighet Til Provost kontor Ved University Of Chicago for SIN ati stipend for 2008-09. Og selvfølgelig, κῦδος til richard whaling for Å Trekke Den av! I tiåret siden, inkrementell forbedring Av Perseus og Logeion ville ikke vært mulig uten støtte Fra College Of University Of Chicago, fra dean John Boyer politikk for å støtte fakultetet prosjekter til sine strålende studenter. (Hvis du er en nåværende undergrad, kom og finn meg !)
Er det alt?
en siste line-up, da, av folk å takke for deres hjelp i det siste året. All programmering for 2009-utgivelsen ble gjort Av Richard Whaling. Vi, Richard Og Helma, ønsker å takke våre disambiguatorer: Kristin Dean, Charlotte Krontiris, Og Ursula Poole; Walt Shandruk, for munging gjennom en haug med latinske data på kort varsel; Perseus-Prosjektet, for å dele data og kompetanse; Martin Mueller, for konsultasjon og tilgjengeliggjøring Av Hans Homeriske data; Og Hugh Cayless, for å gjøre livet enklere med Sin Transcoder. Vi takker hele personalet PÅ ARTFL for innbydende classicists i sin midte og sjenerøst dele kompetanse, koffein, og munterhet.
2018-utgivelsen har hatt stor nytte av Arbeid Av Walter Shandruk. Når vi ser mot å implementere mer moderne verktøy, ber vi om tålmodigheten din med dette gamle nettstedet; vi tror det fortsatt har litt kjørelengde i det!
September 2018,
Helma Dik