Perseus Projekttekster indlæst under PhiloLogicFinal sæson for PhiloLogic 3, sommer 2018
velkommen til Perseus under PhiloLogic. Det er et stykke tid siden vi udgav en officiel opdatering, men her er det takket være utrættelig krangel (af C, perl, apache og mange andre arcana) i sommer af valt Shandruk. I de mellemliggende år har der været et betydeligt arbejde, især på siden af de græske tekster, og nogle forbedringer af funktionaliteten af filologisk til … filologer. Jeg vil gerne takke alle dem, der har skrevet til os gennem årene for at rapportere skrivefejl og andre fejl; eller blot for at rapportere et serverafbrydelse. Vi er glade for, at du bliver ved med at komme tilbage efter mere.
Hvis Perseus moderskib på Tufts repræsenterer et veludstyret bibliotek carrel, med tekster, kommentarer, ordbøger og andre ressourcer alle inden for din rækkevidde på den samme side, så organiseringen af dette site kan komme som en overraskelse. I stedet for at læse med apparater, vi sigter mod at tilbyde udforskning af teksterne gennem en række corpus-forespørgsler. Fordi mange tekster er blevet analyseret i hånden, og resten af dem med computeren, Du kan søge på måder, som du ikke ser for mange andre steder: for eksempel, Søg efter nuværende imperativer i Platon, eller kun partiklen, der kun er i linjer, der tales af Ismene. Leder du efter former for Kristus i slutningen af sætningen? Vi er her for at tjene dem op. For erfarne og post-nybegynder læsere anbefaler vi også værktøjer, der nu vil være velkendte, håber jeg: nøgleordet i Kontekstvisning og Samhusningsværktøjet.
vi er taknemmelige for alle Problemrapporter og brugerforslag; hold dem (og dine donationer:-)) kommer. For at holde sig ajour med udviklingen, overveje at følge os på kvidre: @LogeionGkLat. Arbejde, der venter: vi ønsker virkelig at inkorporere flere tekster, som støt bliver tilgængelige fra Perseus Digital Library. Endnu vigtigere er vi nødt til at tilpasse den nye generation af filologiske, Filologic4, til klassikernes behov (tænk: navigation, der ikke er efter sidetal i en udgave; lemma-søgninger; …), så vi ikke længere er afhængige af femten år gammel teknologi. Stay tuned.
baggrund: hvor kommer disse tekster fra?
de tekster, vi stiller til rådighed på denne side, bruges praktisk talt alle med tilladelse fra Perseus-projektet ved Tufts University, foremostDigital-biblioteket for den klassiske verden, hvis ikke for theHumanities generelt. I sin samling af græske og Romerske materialer finder læserne mange af de kanoniske tekster,der læses i dag. Den græske samling nærmer sig 8 millioner ord, og den latinske samling har i øjeblikket 5,5 millioner. Derudover er mange engelsksprogede ordbøger, andre opslagsværker, oversættelser og kommentarer inkluderet, så alle med en internetforbindelse har adgang til svarende til et respektabelt College Classics-bibliotek. De græske og latinske tekster er rigt kodet for indhold snarere end form (f.eks. ikke sideskift, initialer og led, men højttalerinformation, metrisk information og milepæle). Perseus-stedet er yderligere beriget af indviklede sammenkædningsmekanismer mellem tekster (hvilket resulterer i mere end 30 millioner links). For licensoplysninger, detaljer om redaktører og oversættere mv. klik på Header-linkene, der vises i de bibliografiske detaljer i teksterne. For at konsultere referenceværker, anbefaler vi nu at gå direkte til Logeion på nettet eller i en app; vi stadig tilbyde en søgbar LSJ, LSJ & kort, og Slater; og vi har sat i et link til træhus Engelsk-Græsk Ordbog.
Hvad gjorde du med teksterne? eller: hvor er spejlet?
du finder her et udvalg af teksten på Tufts-stedet, men mekanismen tilbrysning og søgning er en anden. Det er filologisk, asystem, der blev specielt udviklet til store tekstdatabaser af ARTFL-projektet ved University of Chicago. Mens det originale Perseus-sted er et fremragende værktøj til lineær læsning, ved at placere alle slags ressourcer på den samme side, mens en bruger læser en passage, var vi interesserede i at udnytte den rige kodning til at søge i teksterne og til andre opgaver, der handler mindre om læsning og mere om forskning: corpus lingvistik, frem for alt. Vi er taknemmelige for, at Perseus-projektet stiller sine tekster til rådighed for tredjeparter og fortsætter med at leve i håb om, at andre non-profit institutioner, der er afsat til (græsk) tekstkurering, vil forbedre deres søge-og analysetilbud eller følge Perseus ‘ eksempel og beslutte at gøre deres data tilgængelige til avanceret analyse med andre systemer end deres egne. Kontakt os Venligst, eller hent din egen kopi af PhiloLogic, som er open source.
hvorfor giver din side mig ikke Cicero at læse, når jeg skriver Cicero i søgefeltet?
det er vigtigt at forstå, at en filologisk søgeform ikke er som et Google-søgefelt. Det vigtigste søgefelt er efter ord, der forekommer i teksten, så ved at skrive ‘Gallia est’ finder du åbningssætningen for de galliske krige, men indtastning af ‘Julius Caesar’ vil i første omgang føre dig til tekster af Catullus og Cicero. Fra vores hjemmeside skal du klikke på linket til den fulde søgeformular, hvor du kan bruge forfatter-og Titelfelterne eller indtaste en standard citat øverst (baseret på den klassiske ordbog). Hvis dit citat ikke er, hvad serveren forventer, får du en komplet liste over alle teksterne, som viser dig den forkortelse, vi bruger.
Hvorfor er du ikke mere som Google?
PhiloLogic er designet til at udnytte den rige strukturelle kodning, som Perseus-tekster tilbyder, og derfor at kende forskellen mellem indholdstyper: ord i teksterne versus de såkaldte metadata: forfattere, titler og meget mere. Det er også designet til at give mulighed for præcise svar på specifikke spørgsmål, snarere end ballpark estimater af ‘føler du dig heldig’ type. Hvis du søger efter ordet ‘ amicitia ‘i tekster eller efter navnet’ Pseudolus’, vil vi ikke have dig til at finde forekomster fra titler eller højttalerindikationer-medmindre du angiver, at det er den slags information: titler, der indeholder amicitia, ord, der tales af Pseudolus, som du vil have. Vi mener, at begge tilgange har deres fordele, men at mere præcis søgning er noget, som klassikere har tendens til at ønske sig. I sum, før du indtaster noget i et søgefelt, spørg dig selv, hvilken slags søgning dette er: en ordsøgning eller en søgning efter metadata. Hvis din søgning er efter metadata, skal du finde tilpasningsfeltet et andet sted på søgeformularen. Tip: ved at klikke på knapperne ved siden af søgefelterne får du altid en liste over dine muligheder.
hvorfor er mine resultater Forskellige, når jeg søger det andet græske korpus?
flere vigtige forskelle: vigtigst er det, at corpus sandsynligvis er meget meget større end det udvalg, der tilbydes her, og teksterne er ofte af nyere årgang. På den anden side er teksterne muligvis ikke blevet disambigueret, så gæt om frekvens altid kan være i den høje ende og omfatte lemmata, der faktisk ikke forekommer i teksterne eller ikke forekommer med den hævdede frekvens. Vi vil gerne se funktionaliteten ved at søge efter del-af-tale eller ved specificeret attribut (såsom højttaler) og bedre udnyttelse af parsing i alles corpus, men vi er ikke i stand til at vide, hvad der foregår bag lukkede døre. Flere spørgsmål? Glad for at chatte, selvfølgelig.
Hvordan bruger jeg denne hjemmeside? Hvor blev alle søgeformularerne af?
en type reaktion, vi hørte meget om den oprindelige Perseus under filologisk sted, var, at søgeformularerne var ret skræmmende for nybegynderen. Nu hvor vi har eksisteret i godt over et årti, og med gode alternativer derude til læsning af tekster, såsom den smukke nye Scaife-seer, vi går tilbage til vores rødder, kan du sige. Hvis du leder efter de primære tekster og oversættelser, skal du klikke på græsk eller Latin øverst på denne side. Opslagsværker kan findes i Logeion; grammatikker blandt monografierne.
tekster og deres oversættelser lever i de samme databaser. Du kan gå fra oversættelse til original eller læse dem side om side ved at klikke på links (‘engelsk’, ‘græsk’, ‘Latin’). Hvis der er flere oversættelser, vil du se’ engelsk ‘og’Engelsk2’. For en demonstration af et typisk besøg, tjek trinene i den tidligere del af denne præsentation.kommentarer og monografier findes i to separate databaser . Indtast gammel forfatter eller titel i titelfeltet på søgeformularen for at finde ud af, om en kommentar er tilgængelig for en bestemt gammel tekst. Monografier inkluderer forskellige grammatikker. På søgesiden efter monografier, der er en hurtig opslagsboks til grammatikafsnit, i overensstemmelse med hvordan disse værker normalt citeres i kommentarer og i klasseværelser.
for at slå et ord op og dets parse skal du klikke på det i de græske og latinske tekster. Der vises et vindue, der også giver et link til Logeion, som viser dig Ordet, som det vises i det fulde sæt ordbøger og opslagsværker, vi har til rådighed. Fuldtekstsøgning forbliver tilgængelig fra søgeformularerne for nogle individuelle ordbøger, der er tilgængelige fra toppen af denne side.
hvad skal jeg bruge? Jeg kan ikke finde parsing vinduet længere! Hvorfor er mit helt normale ord med en akut accent ikke fundet?
vi ved om brugere med gode oplevelser på Ubuntu. Desværre er Internetudforsker ikke kompatibel med vores klik-til-parse-mekanisme. Et klik på et græsk eller latinsk ord skal resultere i et nyt vindue med parse information og links til ordbøger. Efterfølgende klik vil resultere i, at det samme parse-vindue bliver ‘opdateret’; hvis du ikke kan se noget, kan det være, at dette vindue er skjult bag dine andre bro.ser-vinduer. Hvis græsk ikke vises som græsk, skal du sørge for, at din bro.ser kan håndtere UTF-8-kodning og hente nogle Unicode-skrifttyper, der har græsk i sig. Der er masser af gratis græske skrifttyper. Det skal være let at skære og indsætte i tekstbehandlere. I de fleste tilfælde skal du være i stand til at indtaste ord, du søger efter uden diakritik (dette betyder også: eller i translitteration (se ‘Info & hjælp’ til vejledning); bare sørg for også at vælge den tilsvarende radioknap (‘ingen diakritikere’, ‘translitteration’), når du gør dette.
Unicode detalje, der sandsynligvis er for meget information: vi forsøger at være konsekvente i at bruge præ-kombineret Unicode og undgå de nu forældede tegn, der bruger ‘oksia’ snarere end de kanoniske ‘tonos’ kombinationer). Hvis du bruger en græsk inputmetode, der producerer varianten ‘oksia’, kan du overveje at indtaste din søgning uden diakritik, når der er akutte accenter i spil eller installere en inputmetode, der overholder kanonisk praksis. Mac OS – systemet har indbygget polytonisk græsk input, der også overholder disse standarder.
Hvad handler denne forretning om morfologi? Og hvad betyder farverne?
i foråret 2008 modtog vi et ATI-tilskud til at udvikle morfologisk analyse for det græske korpus og gøre det søgbart. Du kan lære mere om dette projekt ved at læse abstracts af vores præsentationer om dette emne eller tage et kig på denne store plakat om, hvordan det hele blev sat sammen. I en nyere præsentation præsenterer vi en gennemgang af et sæt søgninger. For flere detaljer om del-af-tale-koder, se afsnittet ‘Info & Hjælp’ i søgeformularerne. Det er vigtigt at påpege, at teksterne ikke blev analyseret for hånd, så der vil være mange fejlagtige parser. Vi håber du vil hjælpe os med at rette dem!
i en typisk parse vindue, vil du se en parse fremhævet i lyseblå. Det indikerer, at vores automatiske del-af-tale tagger har valgt denne parse som den mest sandsynlige i sammenhængen. Du vil se et tal (sige 0,45678), der er knyttet til analysen. Dette udtrykker sandsynligheden systemet (en dum computer, der ikke kender græsk så godt som du gør!) associerer med den pågældende parse. Dele af teksterne er håndmærket. Hvis du støder på en håndmærket formular, vil den være grøn i farve. Selv der kan dataindtastningsproblemer komme op, så vær kritisk og rapporter (Indsend en problemrapportformular via linket i parse-vinduet, hvis den korrekte parse ikke er angivet) eventuelle fejl, du finder.
Hvordan søger jeg efter morfologiske egenskaber eller lemmas?
hvis du ønsker at søge efter forekomster af en lemma eller del-af-tale-kode, bruger du det samme søgefelt som for normale ord (eller ‘strenge’), men du præfikser dem med ‘lemma:’ eller ‘pos:’. For eksempel’ lemma:nostos ‘eller’lemma:sum’.
Nyt: ved at bruge ‘formular:’du kan ignorere de mere komplekse instruktioner for del-af-tale-koder, der følger. Du skal blot skrive ud, hvad du mener vil tilstrækkeligt beskrive den formular, du leder efter, i vilkårlig rækkefølge, men brug bindestreger mellem udtryk. For eksempel’ form:optativ-handling-ental ‘for en aktiv optativ i ental, hvor’ form:sg-opt-act ‘ ville gøre det samme.
del-af-tale-koderne er mindre enkle at opsummere. Info & hjælp sektion har en hurtig introduktion. Det er vigtigt at vide, at mens en fuldstændig analyse udgør ti spillemaskiner, mange af disse vil være tom ( – ), og endnu mere vil ikke være af interesse for dig på et givet tidspunkt. Alle disse kan du forlade uspecificeret med *, men din formulering skal være specifik nok til, at et ‘a’ definerer akkusativ og ikke aorist. Til dette er det nyttigt at kende rækkefølgen af de forskellige slots. De er:
1) hoveddel af tale: Verb, substantiv, adjektiv, pronomen, partikel (g), aDverb, tal, præposition, sammenhæng, interjektion;
2) mindre del af tale: a: Artikel eller determinativ (Latin er, idem, ipse), personlig, demonstrativ, s: ubestemt, Forhør, relativ, besiddende, k: refleksiv, gensidig, korrekt;
3) person: 1, 2, 3;
4) nummer: ental, flertal, dobbelt;
5) anspændt: nuværende, ufuldkommen, Aorist, perfekt, pLuperfect, Future, fuTure perfect;
6) humør: vejledende, konjunktiv, optativ, imperativ, infinitiv, Participle, Gerundive, gerunD, liggende;
7) stemme: aktiv, mellem, passiv, mellem-passiv;
8) Køn: maskulin, feminin, neutral, almindelig;
9) sag: nominativ, genitiv, dativ, akkusativ, ablativ, vokativ;
10) grad: komparativ, superlativ.
regulære udtryk vil arbejde til en vis grad. For eksempel kunne man blot angive ‘pos:*a-‘ for at fange accusativer. (Alle slots fra 1 til 8 er her tilbage uspecificeret. Vi ved dette, fordi søgefeltet altid kræver et komplet ord, og vi har afsluttet vores ord med ‘-‘ og ikke med et vildt kort). Denne oprindelige formulering ville imidlertid savne accusativer, der også er komparativer eller superlativer. For at inkludere dem, prøv ‘pos:*a’ i stedet. betyder ‘Vælg et af punkterne mellem parenteserne’. Omvendt, hvis man leder efter personlige pronomen, kan det være fornuftigt at bruge pos:pp* uden yderligere specifikation om slots 3-8.
del-af-tale og lemma søgninger kan kombineres, ved hjælp af en semi-kolon, eller bruges separat, med et mellemrum, hvis man angiver forskellige ord: søgningen ‘lemma:dok;pos:v-3s.* pos:.* d – ‘ søger efter former for Krost i 3. ental (semikolon) og separat noget i dativet.
dette er nok så godt et øjeblik som noget at påpege, at vores parser og vores søgemaskine ikke kender græsk eller endda Latinsk syntaks! Du bliver nødt til selv at bestemme, i søgninger af denne art, om de datives, du finder, faktisk er datives, der styres af verbet.
er alt dette ret overvældende? Vi er klar over, at formlerne ser ret forbudte ud! Hvis vi kan finde tid og finansiering, vil vi arbejde på mere naturligt sprogforespørgsel (kan jeg venligst have nogle perfekte aktive optatives?) at træde i stedet for ‘pos: v * roa*’.
hvad så?
vi synes, at dette korpus har et stort løfte både til forskning og til undervisning. Filologer er nødt til at foretage corpus-undersøgelse ud over det enkelte ord; mere specifikt bør klassiske lingvister arbejde på at fremsætte flere evidensbaserede og kvantitative påstande, end der findes i meget af den aktuelle litteratur. Lærere, der ønsker at vælge, hvilket ordforråd eller konstruktioner der skal understreges, skal have en forestilling om brugsfrekvens, og i stedet for at lave eksempler, kunne de køre en Hurtig søgning efter faktiske eksempler på konstruktioner. For at give et simpelt eksempel er tre bestemte artikler i rækkefølge ikke usædvanlige. Nu Kan du finde faktiske eksempler i Lysias, en passende forfatter til indledende og mellemliggende klasser, for at demonstrere dette. På en praktisk note til lærere, hvis du sender din klasse et link af denne art, fremhæves det fænomen, du ønskede at fremhæve, på siden. Hvis du ønsker at henlede elevernes opmærksomhed på en bestemt del af en side – Søg efter den, og send dem den kopierede URL til søgeresultatet. De vil se den samme fremhævning.
fantastisk! Hvordan kan jeg hjælpe?
som du sandsynligvis kan forestille dig, er der mange mange hjul inden for hjul for at få dette sted til at gøre, hvad det gør, og nogle gange går ting tabt i blandingen. Hvis du ser noget galt, så lad os det vide. Sådan kan du hjælpe os med at forbedre denne side: hvis du støder på et problem, skal du bruge linket “Rapporter et Problem”, som du finder på resultatsiderne.
brugerkorrektioner for et bestemt ord eller en passage vil både have en lokal indflydelse i deres sammenhæng, men kan pege på mere udbredte problemer, så de kan have en global indflydelse på databasens fremtidige nøjagtighed som helhed.
parse-vinduet har en separat problemrapportformular (hvis ingen af parserne er tilfredsstillende, eller den korte definition falder, ja, kort).
hvad hvis jeg vil gøre mere?
dette projekt ville ikke have været muligt uden open source-programmer og data delt under creative-commons-licenser. Hvis du er fakultetsmedlem, personale, studerende eller administrator ved en højere læreanstalt, skal du blive informeret om åben adgang, åbent indhold og Creative Commons. Støtte de principper, de repræsenterer, og arbejde for forandring, hvor du kan i din egen institution og faglige organisationer. Uanset tilknytning kan klassiske entusiaster støtte organisationer, der arbejder med disse principper. Du kan støtte Open-access og creative-commons orienterede projekter, som du kan lide. For klassikere, nogle steder at besøge som gode clearinghuse for denne form for information er Chuck Jones antikke verden Online, Neel Smiths Vitruvian Design blog, og stoa.org.
Credits
meget af programmeringen på 2009-udgivelsen blev udført af en enkelt Classics BA, der forfølger en kandidatgrad i datalogi (en god mængde yderligere ufinansieret arbejde af bestemte klassikere hjælper såvel som open source-programmer og hjælp fra dets udviklere). Vi ønsker at registrere vores taknemmelighed til Provosts kontor ved University of Chicago for dets ATI-tilskud for 2008-09. Og selvfølgelig, Kurt til Richard hvalfangst for at trække det ud! I årtiet siden, trinvis forbedring af Perseus og Logeion ville ikke have været mulig uden støtte fra College of University of Chicago, fra dean John Boyers politikker til støtte for fakultetsprojekter til dets strålende studerende. (Hvis du er en nuværende undergrad, kom og find mig!)
er det alt?
en endelig line-up, derefter, af mennesker til at takke for deres hjælp i det forløbne år. Al programmering til udgivelsen i 2009 blev udført af Richard hvalfangst. Vi, Richard og Helma, ønsker at takke vores disambiguatorer: Kristin Dean, Charlotte Krontiris og Ursula Poole; valt Shandruk, for at have gnavet gennem en bunke latinske data med kort varsel; Perseus-projektet, for at dele data og ekspertise; Martin Mueller, for konsultation og tilgængeliggørelse af hans homeriske data; og Hugh Cayless, for at gøre vores liv lettere med sin Transcoder. Vi takker hele personalet på ARTFL for at byde klassikere velkommen i deres midte og generøst dele ekspertise, koffein, og glæde.
2018-udgivelsen har haft stor gavn af arbejde af Shandruk. Når vi ser mod implementering af mere moderne værktøjer, vi beder om din tålmodighed med dette gammeldags sted; vi tror, det stadig har en vis kilometertal i det!
September 2018,
Helma Dik