Perseus Projectteksten geladen onder PhiloLogicFinal season for PhiloLogic 3, zomer 2018
Welkom bij Perseus onder PhiloLogic. Het is alweer een tijdje geleden dat we een officiële update hebben uitgebracht, maar hier is het, dankzij indefatigable wrangling (van C, perl, apache en vele andere arcana) deze zomer door Walt Shandruk. De tussenliggende jaren hebben veel werk gezien, vooral aan de kant van de Griekse teksten, en enkele verbeteringen aan de functionaliteit van PhiloLogic voor … filoloog. Ik wil iedereen bedanken die ons door de jaren heen geschreven heeft om typefouten en andere fouten te melden; of gewoon om een server uitval te melden. We zijn blij dat je blijft terugkomen voor meer.
als het Perseus moederschip op Tufts een goed uitgeruste bibliotheek carrel vertegenwoordigt, met teksten, commentaren, woordenboeken en andere bronnen allemaal binnen uw bereik op dezelfde pagina, dan kan de organisatie van deze site als een verrassing komen. In plaats van het lezen-met-apparatuur, streven we ernaar om het verkennen van de teksten te bieden door middel van een panopie van Corpus queries. Omdat veel teksten met de hand zijn ontleed, en de rest met de computer, kun je zoeken op manieren die je op veel andere plaatsen niet ziet: bijvoorbeeld, zoeken naar huidige imperatieven in Plato, of het deeltje μέν alleen in lijnen gesproken door Ismene. Op zoek naar vormen van βροτός aan het einde van de zin? We zijn hier om ze te serveren. Voor ervaren en post-beginner lezers, raden we ook tools aan die nu vertrouwd zullen zijn, hoop ik: het trefwoord in Context view, en de Collocatietool.
We zijn dankbaar voor alle Probleemrapporten en suggesties van gebruikers; houd ze (en uw donaties:-)) komen. Volg ons op Twitter om op de hoogte te blijven van de ontwikkelingen: @LogeionGkLat. Werk dat ons te wachten staat: we willen echt meer teksten opnemen, die steeds meer beschikbaar komen uit de Perseus Digital Library. Belangrijker nog, we moeten de nieuwe generatie van de filologische, Filologic4, aan te passen aan de behoeften van classici (denk: navigatie die niet op paginanummer in een editie; lemma zoekt;…), zodat we niet langer afhankelijk zijn van vijftien jaar oude technologie. Blijf kijken.
achtergrond: waar komen die teksten vandaan?
de teksten die we beschikbaar stellen op deze site worden vrijwel allemaal gebruikt met toestemming van het Perseus Project van de Tufts Universiteit, de foremostdigitale bibliotheek voor de klassieke wereld, zo niet voor de mensheid in het algemeen. In de collectie van Grieks en Romeins materiaal vinden lezers veel van de canonieke teksten die vandaag de dag worden gelezen. De Greekcollectie benadert 8 miljoen woorden en de Latijnse collectie telt momenteel 5,5 miljoen. Daarnaast zijn veel Engelstalige woordenboeken, andere naslagwerken, vertalingen en commentaren opgenomen, zodat iedereen met een internetverbinding toegang heeft tot het equivalent van een respectabele College Classics bibliotheek. De Griekse en Latijnse teksten zijn rijkelijk gecodeerd voor inhoud in plaats van vorm (bijvoorbeeld, niet Pagina-einden, initialen, en inspringingen, maar spreker informatie, metrische informatie, en mijlpalen). De Perseus-site wordt verder verrijkt door ingewikkelde koppelingsmechanismen tussen teksten (wat resulteert in meer dan 30 miljoen links). Voor licentie-informatie, details over redacteuren en vertalers, enz., klik op de XML Header links die worden weergegeven in de bibliografische details van de teksten. Voor het raadplegen van de naslagwerken raden we nu aan om rechtstreeks naar Logeion te gaan op het web of in een app; We bieden nog steeds een doorzoekbare LSJ aan, Lewis & Short, en Slater; en we hebben een link naar Woodhouse ‘ s Engels-Grieks woordenboek geplaatst.
Wat hebt u met de teksten gedaan? of: Waar is de spiegel?
U vindt hier een selectie van de tekst op de Tufts site, maar het mechanisme voor het doorzoeken en doorzoeken is een andere. Het is filologisch, asystem dat speciaal is ontwikkeld voor grote tekstuele databases door het ARTFL project van de Universiteit van Chicago. Terwijl de oorspronkelijke Perseus site een uitstekend hulpmiddel is voor lineair lezen, door allerlei bronnen op dezelfde pagina te zetten terwijl een gebruiker een passage leest, waren we geïnteresseerd in het gebruik van de rijke codering voor het zoeken van de teksten, en voor andere taken die minder over lezen en meer over onderzoek gaan: corpus linguistics, vooral. We zijn dankbaar dat het Perseus Project zijn teksten beschikbaar stelt aan derden, en blijven hopen dat andere instellingen zonder winstoogmerk die zich bezighouden met (Griekse) tekstcuratie hun Zoek-en analyseaanbod zullen verbeteren, of het voorbeeld van Perseus zullen volgen, en zullen besluiten hun gegevens beschikbaar te stellen voor geavanceerde analyse met andere systemen dan hun eigen. Neem contact op of download je eigen exemplaar van PhiloLogic, dat open-source is.
Waarom geeft uw site Me geen Cicero om te lezen als ik Cicero in het zoekvak typ?
Het is belangrijk om te begrijpen dat een filologisch zoekformulier niet lijkt op een zoekvak van Google. Het belangrijkste zoekveld is naar woorden die in de tekst voorkomen, zodat je door het typen van ‘Gallia est’ de openingszin van de Gallische Oorlogen vindt, maar het invoeren van ‘Julius Caesar’ leidt in eerste instantie naar teksten van Catullus en Cicero. Vanaf onze homepage, klik op de link naar het volledige zoekformulier, waar u de auteur en titel velden kunt gebruiken of typ in een standaard citaat aan de bovenkant (gebaseerd op de Oxford Classical Dictionary). Als uw citaat niet is wat de server verwacht, krijgt u een volledige lijst van alle teksten, die u de afkorting laten zien die we gebruiken.
waarom lijk je niet meer op Google?
PhiloLogic is ontworpen om gebruik te maken van de rijke structurele codering die Perseus teksten bieden, en dus om het verschil te weten tussen soorten inhoud: woorden in de teksten, versus de zogenaamde metadata: auteurs, titels, en nog veel meer. Het is ook ontworpen om nauwkeurige antwoorden op specifieke vragen mogelijk te maken, in plaats van een schatting van het ‘voel je je gelukkig’ – type. Als je zoekt naar het woord ‘amicitia’ in teksten, of naar de naam ‘Pseudolus’, willen we niet dat je instanties vindt uit titels, of spreker indicaties-tenzij je specificeert dat dat het soort informatie is: titels die amicitia bevatten, woorden gesproken door Pseudolus, die je wilt. Wij geloven dat beide benaderingen hun voordelen hebben, maar dat nauwkeuriger zoeken iets is dat classici de neiging hebben te willen. Kortom, voordat je iets in een zoekveld invoert, vraag je jezelf af wat voor soort zoekopdracht dit is: een woordzoekopdracht of een zoekopdracht naar metadata. Als uw zoekopdracht naar metadata is, vindt u het passende veld elders op het zoekformulier. Tip: door op de knoppen naast de zoekvelden te klikken, krijgt u altijd een overzicht van uw opties.
Waarom zijn mijn resultaten anders als ik zoek in dat andere Griekse corpus?
verschillende belangrijke onderscheidingen: het belangrijkste is dat corpus waarschijnlijk veel groter is dan de hier aangeboden selectie, en de teksten zijn vaak van recentere vintage. Aan de andere kant zijn de teksten misschien niet gedesambigueerd, zodat gissingen over frequentie altijd aan de hoge kant kunnen zijn en lemmata kunnen bevatten die in feite niet voorkomen in de teksten of niet voorkomen met de gestelde frequentie. We zouden graag de functionaliteit van zoeken op deel-van-spraak, of door gespecificeerd attribuut (zoals luidspreker) zien, en beter gebruik maken van parsing in ieders corpus, maar we zijn niet in de positie om te weten wat er achter gesloten deuren gebeurt. Meer vragen? Blij om te praten, natuurlijk.
Hoe gebruik ik deze site? Waar zijn alle zoekformulieren gebleven?
een soort reactie die we veel hoorden over de oorspronkelijke Perseus onder PhiloLogic site was dat de zoekvormen nogal intimiderend waren voor de beginner. Nu we al meer dan tien jaar bestaan, en met goede alternatieven voor het lezen van teksten, zoals de prachtige nieuwe Scaife Viewer, gaan we terug naar onze roots, zou je kunnen zeggen. Als u op zoek bent naar de primaire teksten en vertalingen, klikt u op Grieks of Latijn bovenaan deze pagina. Naslagwerken zijn te vinden in Logeion; grammatica ‘ s Onder de monografieën. teksten en hun vertalingen bevinden zich in dezelfde databases. U kunt van Vertaling naar origineel gaan, of ze naast elkaar lezen door op links te klikken (‘Engels’, ‘Grieks’, ‘Latijn’). Als er meerdere vertalingen zijn, ziet u ‘English’ en ‘English2’. Voor een demonstratie van een typisch bezoek, check de stappen in het eerdere deel van deze presentatie.commentaren en monografieën bestaan in twee afzonderlijke databases. Voer ancient author of title in in het titelveld op het zoekformulier om uit te vinden of een commentaar beschikbaar is voor een bepaalde oude tekst. Monografieën bevatten verschillende grammatica ‘ s. Op de zoekpagina voor de monografieën, is er een snel zoekvak voor grammatica secties, in overeenstemming met hoe deze werken meestal worden aangehaald in commentaren en in klaslokalen.
Om een woord en zijn parse op te zoeken, klikt u erop in de Griekse en Latijnse teksten. Er verschijnt een venster dat ook een link naar Logeion biedt, die u het woord laat zien zoals het voorkomt in de volledige reeks woordenboeken en naslagwerken die we beschikbaar hebben. Volledige tekst zoeken blijft beschikbaar via de zoekformulieren voor sommige individuele woordenboeken, toegankelijk vanaf de bovenkant van deze pagina.
welke browser moet ik gebruiken? Ik kan het parseervenster niet meer vinden! Waarom is mijn normale woord met een accent niet gevonden?
we weten over gebruikers met goede ervaringen op Linux, Ubuntu, Windows XP, Mac OS als besturingssystemen; we weten dat Opera, Firefox en Safari met succes zijn gebruikt als browsers. Helaas is Internet Explorer niet compatibel met ons click-to-parse mechanisme. In alle andere browsers die we hebben getest, zou een klik op een Grieks of Latijns woord moeten resulteren in een nieuw venster met ontleedinformatie en links naar woordenboeken. Volgende klikken zullen resulteren in hetzelfde parse venster wordt ‘ververst’; als je niets ziet, kan het zijn dat dit venster is verborgen achter uw andere browservenster(s). Als Grieks niet verschijnt als Grieks, zorg er dan voor dat je browser UTF-8 codering kan verwerken en download een Unicode-lettertype met Grieks erin. Er zijn tal van gratis Griekse lettertypen. Snijden en plakken in tekstverwerkers moet gemakkelijk zijn. In de meeste gevallen moet u in staat zijn om woorden te typen waarnaar u zoekt zonder diakritische tekens (dit betekent ook: geen ademhaling en geen jota subscripts), of in transliteratie (Zie ‘Info & Help ‘ voor begeleiding); zorg ervoor dat u ook de bijbehorende radioknop (‘geen diakritiek’, ’transliteratie’) selecteert wanneer u dit doet.
Unicode detail dat is waarschijnlijk te veel informatie: we proberen consistent te zijn in het gebruik van pre-gecombineerde Unicode en het vermijden van de nu verouderde tekens die ‘oxia’ gebruiken in plaats van de canonieke ’tonos’ combinaties). Als u een Griekse invoermethode gebruikt die de ‘oxia’ – variant produceert, overweeg dan om uw zoekopdracht zonder diakritische tekens in te voeren wanneer er acute accenten in het spel zijn of om een invoermethode te installeren die voldoet aan de canonieke praktijk. Het Mac OS X-systeem heeft een ingebouwde polytonische Griekse ingang die ook voldoet aan deze normen.
Wat is deze business over morfologie? En wat betekenen de kleuren?
in het voorjaar van 2008 ontvingen we een ATI-subsidie om morfologische analyse te ontwikkelen voor het Griekse corpus, en om het doorzoekbaar te maken. U kunt meer te weten komen over dit project door het lezen van abstracts van onze presentaties over dit onderwerp of het nemen van een kijkje op deze grote poster over hoe het allemaal in elkaar is gezet. In een recentere presentatie presenteren we een doorloop van een reeks zoekopdrachten. Voor meer informatie over spraaksleutels raadpleegt u de secties ‘Info & Help’ op de zoekformulieren. Het is belangrijk om erop te wijzen dat de teksten niet met de hand zijn ontleed, zodat er veel onjuiste ontleedingen zullen zijn. Wij hopen dat u ons helpt deze te corrigeren!
in een typisch parse-venster ziet u een parse gemarkeerd in lichtblauw. Het geeft aan dat onze automatische deel-van-spraak tagger deze parse heeft geselecteerd als de meest waarschijnlijke in de context. U zult een getal zien (zeg, 0.45678) geassocieerd met de parse. Dit drukt de kans uit dat het systeem (een stomme computer die niet zo goed Grieks kent als jij!) associeert met die specifieke parse. Delen van de teksten zijn met de hand gelabeld. Als u een met de hand gelabeld formulier tegenkomt, zal het groen van kleur zijn. Zelfs daar, gegevensinvoer problemen kunnen komen, dus wees kritisch en rapporteer (stuur een probleemrapport formulier via de link in het parse venster als de juiste parse niet wordt vermeld) eventuele fouten die u vindt.
Hoe zoek ik naar morfologische attributen of lemmas?
Als u wilt zoeken naar gebeurtenissen van een lemma of een deel-van-spraak code, gebruikt u hetzelfde zoekveld als voor normale woorden (of ‘strings’), maar u voegt ze voor met ‘lemma:’ of ‘pos:’. Bijvoorbeeld ‘ lemma: nostos ‘of’lemma:sum’.
Nieuw: met behulp van ‘form:’je kunt de meer complexe instructies voor deel-van-spraak codes die volgen negeren. Schrijf gewoon uit wat je denkt dat het formulier dat u zoekt voldoende zal beschrijven, in elke volgorde, maar gebruik koppeltekens tussen termen. Bijvoorbeeld ‘form: optative-act-singular’ voor een actief optatief in het enkelvoud, waarbij ‘form: sg-opt-act’ hetzelfde zou doen.
De deel-van-spraak codes zijn minder eenvoudig om samen te vatten. De Info & Help sectie heeft een snelle introductie. Het is belangrijk om te weten dat terwijl een volledige analyse tien slots, veel van deze zal leeg zijn (-), en nog meer zal niet van belang zijn voor u op een bepaald moment. Al deze kun je niet gespecificeerd laten met *, maar je formulering moet specifiek genoeg zijn dat een ‘a’ accusatief definieert en niet aoristisch. Hiervoor is het nuttig om de volgorde van de verschillende slots weten. Ze zijn:
1) hoofdwoord: werkwoord, zelfstandig naamwoord, bijvoeglijk naamwoord, voornaamwoord, deeltje (g), bijwoord, cijfer, voorzetsel, voegwoord, interjectie;
2) hoofdwoord: a: Artikel bepalend of (in het latijn is, idem, ipse), Persoonlijke, Aanwijzende, x: aangegaan voor onbepaalde tijd, Vragend, Relatieve, bezitterig, k: reflectief, wederzijdse, goede;
3) persoon: 1, 2, 3;
4) getal: enkelvoud, meervoud, dual;
5) tijd: Huidige, Onvolmaakte, Aorist, perfecte, tijd, Toekomst, toekomst perfect;
6) stemming: Indicatief, Conjunctief, Optativus, imperativus, infinitief, Deelwoord, Gerundive, gerunD, rugligging;
7) stem: Actief, Midden, Passief, midden-passief;
8) geslacht: Mannelijk, Vrouwelijk, Onzijdig, Gemeenschappelijk;
9) geval: Nominatief, Genitief, Datief, Accusatief, ablatieve, Aanspreekvorm);
10) graad: vergelijkend, superlatief.
reguliere expressies zullen tot op zekere hoogte werken. Men zou bijvoorbeeld slechts ‘pos:*a-‘ kunnen specificeren om accusatieven te vangen. (Alle slots van 1 tot en met 8 zijn hier gelaten niet gespecificeerd. We weten dit omdat het zoekveld altijd een volledig woord vereist, en we hebben ons woord afgesloten met ‘ – ‘ en niet met een wild card). Deze eerste formulering zou echter accusatieven missen die ook comparatieven of superlatieven zijn. Om ze op te nemen, probeer ‘pos:*a’ in plaats daarvan. betekent ‘kies een van de items xyz tussen de haakjes’. Omgekeerd, als men op zoek is naar persoonlijke voornaamwoorden, kan het zinvol zijn om pos gebruiken: pp * zonder verdere specificatie Over slots 3-8.
Part-of-speech en lemma zoekopdrachten kunnen worden gecombineerd, door middel van een puntkomma, of afzonderlijk worden gebruikt, met een spatie, als men verschillende woorden specificeert: de zoekopdracht ‘lemma: dokew; pos: v-3s. * pos:.* d – ‘ zoekt naar vormen van δοκέω in het derde enkelvoud (puntkomma), en afzonderlijk iets in het datief.
Dit is waarschijnlijk een goed moment om erop te wijzen dat onze parser en onze zoekmachine geen Griekse of zelfs Latijnse syntaxis kennen! Je zult voor jezelf moeten beslissen, in zoekopdrachten van dit soort, of de datums die je vindt in feite datums zijn die worden beheerst door het werkwoord. is dit allemaal nogal overweldigend? We realiseren ons wel dat de formules er nogal afschrikwekkend uitzien! Als we de tijd en de financiering kunnen vinden, zullen we werken aan meer natuurlijke taal querying(kan ik alsjeblieft een aantal perfecte actieve opties?) ter vervanging van ” pos:v*roa*”.
wat dan nog?
wij denken dat dit corpus grote belofte inhoudt, zowel voor onderzoek als voor onderwijs. Filologen moeten corpus bestuderen buiten het enkele woord; meer in het bijzonder, klassieke taalkundigen moeten werken aan het maken van meer evidence-based en kwantitatieve claims dan in veel van de huidige literatuur worden gevonden. Leraren die willen selecteren welke woordenschat of constructies te benadrukken moet een notie van de frequentie van het gebruik hebben, en in plaats van het maken van voorbeelden, konden ze een snelle zoektocht naar werkelijke voorbeelden van constructies uitvoeren. Om een eenvoudig voorbeeld te geven, drie bepaalde artikelen in volgorde is niet ongebruikelijk. Nu kunt u concrete voorbeelden vinden in Lysias, een geschikte auteur voor inleidende en intermediaire klassen, om dit aan te tonen. Op een praktische opmerking voor leraren, als u uw klas een link van dit soort, het fenomeen dat u wilde benadrukken wordt gemarkeerd op de pagina. Als u de aandacht van uw leerlingen wilt vestigen op een bepaald deel van een pagina – zoek ernaar, en stuur ze de gekopieerde URL van het zoekresultaat. Ze zullen dezelfde accentuering zien.
geweldig! Hoe kan ik helpen?
zoals u zich waarschijnlijk kunt voorstellen, zijn er veel wielen in wielen om deze site te laten doen wat het doet, en soms raken dingen verloren in de shuffle. Als u iets mis ziet, laat het ons weten. Hier is hoe u ons kunt helpen deze site te verbeteren: als u een probleem ondervindt, gebruik dan de link “Meld een probleem” die u vindt op de resultatenpagina ‘ s.
gebruikerscorrecties voor een bepaald woord of passage hebben zowel een lokale impact in hun context, maar kunnen wijzen op meer wijdverbreide problemen, zodat ze een globale impact kunnen hebben op de toekomstige nauwkeurigheid van de database als geheel.
Het parse venster heeft een apart probleem rapport formulier (in het geval geen van de parses is bevredigend, of de korte definitie valt, goed, kort).
wat als ik meer wil doen?
dit project zou niet mogelijk zijn geweest zonder open-source software en data gedeeld onder creative-commons licenties. Als je een faculteitslid, medewerker, student of administrateur bent bij een instelling voor Hoger Onderwijs, informeer dan over Open Access, Open Content en de Creative Commons. Steun de principes die zij vertegenwoordigen, en werk voor verandering waar u kunt in uw eigen instelling en professionele organisaties. Ongeacht affiliatie, kunnen klassieke enthousiastelingen organisaties ondersteunen die met deze principes werken. Je kunt open access en creative commons georiënteerde projecten ondersteunen die je leuk vindt. Voor classici, sommige sites om te bezoeken als goede clearing houses voor dit soort informatie zijn Chuck Jones ‘ s Ancient World Online, Neel Smith Vitruviaanse Design blog, en stoa.org.
Credits
Veel van de programmering op de 2009 release werd gedaan door een enkele Klassiekers BA nastreven van een Master in Computer Science (een goed bedrag van de aanvullende niet-volgestorte werk bepaald door classici helpt, als open-source software en ondersteuning door de ontwikkelaars). Wij willen onze dank aan het kantoor van de Provost van de Universiteit van Chicago voor zijn ATI-beurs voor 2008-09 registreren. En natuurlijk, De κῦδος naar Richard walvisvangst voor het trekken van het af! In het decennium sinds, incrementele verbetering van Perseus en Logeion zou niet mogelijk zijn geweest zonder de steun van het College van de Universiteit van Chicago, van het beleid van dean John Boyer voor het ondersteunen van facultaire projecten aan de briljante studenten. (Als je een huidige student, kom me zoeken!)
Is dat alles?
een laatste line-up, dan, van mensen te danken voor hun hulp in het afgelopen jaar. Alle programma ‘ s voor de release van 2009 werden gedaan door Richard Whaling. Wij, Richard en Helma, willen onze disambiguators bedanken: Kristin Dean, Charlotte Krontiris, en Ursula Poole; Walt Shandruk, voor het op korte termijn door een stapel Latijnse gegevens bladeren; het Perseus Project, voor het delen van gegevens en expertise; Martin Mueller, voor het raadplegen en beschikbaar maken van zijn Homerische gegevens; en Hugh Cayless, voor het gemakkelijker maken van ons leven met zijn Transcoder. We danken het hele personeel van ARTFL voor het verwelkomen van classicisten in hun Midden en het royaal delen van expertise, cafeïne en vrolijkheid.
de uitgave van 2018 heeft veel baat gehad bij het werk van Walter Shandruk. Als we kijken naar het implementeren van meer moderne tools, vragen we om uw geduld met deze oude-stijl site; we denken dat het nog steeds een aantal kilometers in het!
September 2018,
Helma Dik