teksty projektu Perseus załadowane pod Filologic Sezon finałowy dla Filologic 3, Lato 2018
Witamy w Perseus pod Filologic. Minęło trochę czasu, odkąd opublikowaliśmy oficjalną aktualizację, ale oto ona, dzięki niestrudzonym kłótniom (O C, perl, apache i wiele innych arcana) tego lata Walta Shandruka. Kolejne lata przyniosły znaczące prace zwłaszcza po stronie tekstów greckich, a także pewne udoskonalenia funkcjonalności Filologii dla … filologów. Chciałbym podziękować wszystkim, którzy napisali do nas przez lata, aby zgłosić literówki i inne błędy; lub po prostu zgłosić awarię serwera. Cieszymy się, że wracasz po więcej.
jeśli statek-matka Perseusza w Tufts reprezentuje dobrze wyposażoną bibliotekę, z tekstami, komentarzami, słownikami i innymi zasobami w zasięgu ręki na tej samej stronie, organizacja tej strony może być zaskoczeniem. Zamiast czytać z aparatem, staramy się oferować eksplorację tekstów poprzez wiele zapytań korpusowych. Ponieważ wiele tekstów zostało parsowanych ręcznie, a reszta za pomocą komputera, możesz szukać w sposób, którego nie widzisz w zbyt wielu innych miejscach: na przykład, szukać imperatywów obecnych w Platonie lub cząstki μέν tylko w wierszach wypowiadanych przez Ismene. Szukasz formy βροτός na końcu zdania? Jesteśmy tu, by im służyć. Dla doświadczonych i początkujących czytelników polecamy również narzędzia, które będą już znane, mam nadzieję: słowo kluczowe w widoku kontekstowym i narzędzie do kolokacji.
jesteśmy wdzięczni za wszystkie zgłoszenia problemów i sugestie użytkowników; zatrzymaj je (i twoje darowizny: -)). Aby być na bieżąco z wydarzeniami, Śledź nas na Twitterze: @LogeionGkLat. Praca, która czeka: naprawdę chcemy włączyć więcej tekstów, które stale stają się dostępne z Biblioteki Cyfrowej Perseus. Co ważniejsze, musimy dostosować nową generację Filologic, Filologic4, do potrzeb klasyków (pomyśl: nawigacja, która nie jest po numerze strony w wydaniu; lemma wyszukiwania;…), abyśmy nie polegali już na piętnastoletniej technologii. Zostańcie z nami.
Tło: skąd się biorą te teksty?
teksty, które udostępniamy na tej stronie, są praktycznie wszystkie wykorzystywane za zgodą projektu Perseus na Tufts University, pierwszej cyfrowej biblioteki dla klasycznego świata, jeśli nie dla ludzi w ogóle. W zbiorze materiałów greckich i rzymskich czytelnicy znajdą wiele tekstów kanonicznych czytanych dzisiaj. Kolekcja Grecka zbliża się do 8 milionów słów, a kolekcja łacińska ma obecnie 5,5 miliona. Ponadto w zestawie znajduje się wiele słowników języka angielskiego, innych dzieł referencyjnych, tłumaczeń i komentarzy, dzięki czemu każdy, kto ma połączenie z Internetem, ma dostęp do odpowiednika szanowanej Biblioteki klasyków uniwersyteckich. Teksty greckie i łacińskie są bogato zakodowane pod względem treści, a nie formy (np. nie podziały stron, inicjały i wcięcia, ale informacje o mówcach, informacje metryczne i kamienie milowe). Strona Perseusza jest dodatkowo wzbogacona o skomplikowane mechanizmy linkowania między tekstami (w wyniku czego ponad 30 milionów linków). Informacje o licencjach, szczegóły dotyczące redaktorów i tłumaczy itp., kliknij na linki nagłówka XML, które pojawiają się w szczegółach bibliograficznych tekstów. Aby zapoznać się z pracami referencyjnymi, zalecamy teraz przejście bezpośrednio do Logeion w Internecie lub w aplikacji; nadal oferujemy przeszukiwalne LSJ, Lewis & krótki i Slater; i umieściliśmy link do słownika angielsko-greckiego Woodhouse ’ a.
co zrobiłeś z tekstami? albo: gdzie jest lustro?
znajdziesz tutaj wybór tekstu na stronie Tufts, ale mechanizm ich przeglądania i przeszukiwania jest inny. Jest to system Filologiczny, który został specjalnie opracowany dla dużych baz tekstowych przez projekt ARTFL na Uniwersytecie w Chicago. Podczas gdy oryginalna strona Perseus jest doskonałym narzędziem do czytania liniowego, umieszczając wszystkie rodzaje zasobów na tej samej stronie, gdy użytkownik czyta fragment, byliśmy zainteresowani wykorzystaniem bogatego kodowania do wyszukiwania tekstów i innych zadań, które mniej dotyczą czytania, a więcej badań: przede wszystkim lingwistyka korpusowa. Jesteśmy wdzięczni, że projekt Perseus udostępnia swoje teksty osobom trzecim i nadal żyjemy w nadziei, że inne instytucje non-profit zajmujące się (greckim) tworzeniem tekstów poprawią swoją ofertę wyszukiwania i analizy lub pójdą za przykładem Perseusza i zdecydują się udostępnić swoje dane do zaawansowanej analizy za pomocą innych systemów niż własne. Skontaktuj się z nami lub Pobierz własną kopię Filologic, która jest open-source.
Dlaczego Twoja strona nie daje mi Cicero do przeczytania, gdy wpisuję Cicero w polu wyszukiwania?
ważne jest, aby zrozumieć, że formularz wyszukiwania Filologicznego nie jest jak pole wyszukiwania Google. Głównym polem wyszukiwania są słowa, które występują w tekście, dzięki czemu wpisując „Gallia est” znajdziesz zdanie początkowe wojen galijskich, ale wpisanie „Juliusz Cezar” w pierwszej kolejności doprowadzi Cię do tekstów Katullusa i Cycerona. Zaczynając od naszej strony głównej, kliknij link do pełnego formularza wyszukiwania, gdzie możesz użyć pól autora i tytułu lub wpisz standardowe cytowanie na górze (oparte na Oxford Classical Dictionary). Jeśli Twoje cytowanie nie jest tym, czego oczekuje serwer, otrzymasz pełną listę wszystkich tekstów, która pokaże ci skrót, którego używamy.
dlaczego nie jesteś bardziej jak Google?
Filologic ma na celu wykorzystanie bogatego kodowania strukturalnego, które oferują teksty Perseusza, a tym samym poznanie różnicy między rodzajami treści: słowami w tekstach, a tak zwanymi metadanymi: autorami, tytułami i wieloma innymi. Jest również zaprojektowany tak, aby umożliwić precyzyjne odpowiedzi na konkretne pytania, a nie przybliżone szacunki typu „Czy czujesz się szczęśliwy”. Jeśli szukasz słowa „amicitia” w tekstach lub nazwy „Pseudolus”, nie chcemy, abyś znalazł przypadki z tytułów lub wskazań mówcy-chyba że określisz, że jest to rodzaj informacji: tytuły, które zawierają amicitia, słowa wypowiedziane przez Pseudolus, które chcesz. Uważamy, że oba podejścia mają swoje zalety, ale bardziej precyzyjne wyszukiwanie jest czymś, czego chcą klasycy. Podsumowując, przed wpisaniem czegokolwiek w polu wyszukiwania, zadaj sobie pytanie, jaki to rodzaj wyszukiwania: wyszukiwanie słów lub wyszukiwanie metadanych. Jeśli szukasz metadanych, znajdź odpowiednie pole w innym miejscu w formularzu wyszukiwania. Wskazówka: klikając przyciski obok pól wyszukiwania, zawsze otrzymasz listę swoich opcji.
Dlaczego moje wyniki są inne, gdy przeszukuję inne greckie korpusy?
kilka ważnych wyróżnień: co najważniejsze, że korpus jest prawdopodobnie znacznie większy niż wybór oferowany tutaj, a teksty są często bardziej aktualne. Z drugiej strony teksty mogły nie być niejednoznaczne, tak że domysły o częstotliwości mogą być zawsze na najwyższym poziomie i zawierać lemmaty, które w rzeczywistości nie występują w tekstach lub nie występują z ustaloną częstotliwością. Chcielibyśmy zobaczyć funkcjonalność wyszukiwania po części mowy lub po określonym atrybucie (takim jak głośnik) i lepsze wykorzystanie parsowania w ciele każdego, ale nie jesteśmy w stanie wiedzieć, co dzieje się za zamkniętymi drzwiami. Więcej pytań? Chętnie pogadam, oczywiście.
Jak korzystać z tej strony? Gdzie poszły wszystkie formularze wyszukiwania?
jednym z rodzajów reakcji, które słyszeliśmy wiele o oryginalnym Perseuszu w witrynie Filologicznej, było to, że formularze wyszukiwania były raczej onieśmielające dla nowicjusza. Teraz, gdy istniejemy już ponad dekadę i mamy dobre alternatywy do czytania tekstów, takie jak piękna nowa przeglądarka Scaife, możemy powiedzieć, że wracamy do naszych korzeni. Jeśli szukasz podstawowych tekstów i tłumaczeń, kliknij Grecki lub łaciński na górze tej strony. Prace referencyjne można znaleźć w Logeion; gramatyki wśród monografii.
teksty i ich tłumaczenia żyją w tych samych bazach danych. Możesz przejść od tłumaczenia do oryginału lub przeczytać je obok siebie, klikając linki (’angielski’, 'grecki’, 'łaciński’). Jeśli istnieje wiele tłumaczeń, zobaczysz 'angielski’ i 'English2′. Aby pokazać typową wizytę, sprawdź kroki we wcześniejszej części tej prezentacji.
komentarze i Monografie znajdują się w dwóch odrębnych bazach danych. Wprowadź starożytnego autora lub tytuł w polu tytuł w formularzu wyszukiwania, aby dowiedzieć się, czy komentarz jest dostępny dla konkretnego starożytnego tekstu. Monografie zawierają różne gramatyki. Na stronie wyszukiwania monografii znajduje się okno szybkiego wyszukiwania sekcji gramatycznych, zgodnie z tym, jak te prace są zwykle cytowane w komentarzach i w klasach.
Aby wyszukać słowo i jego parse, kliknij na niego w tekstach greckim i łacińskim. Pojawi się okno, które będzie również zawierać link do Logeion, który pokaże słowo, jak pojawia się w pełnym zestawie słowników i prac referencyjnych, które mamy dostępne. Wyszukiwanie pełnotekstowe pozostaje dostępne w formularzach wyszukiwania dla niektórych poszczególnych słowników, dostępnych na górze tej strony.
jakiej przeglądarki powinienem użyć? Nie mogę już znaleźć okna parsowania! Dlaczego moje całkowicie normalne słowo z ostrym akcentem nie zostało znalezione?
wiemy o Użytkownikach z dobrymi doświadczeniami na Linuksie, Ubuntu, Windows XP, Mac OS jako systemach operacyjnych; wiemy, że Opera, Firefox i Safari były z powodzeniem używane jako przeglądarki. Niestety Internet Explorer nie jest kompatybilny z naszym mechanizmem click-to-parse. We wszystkich innych przeglądarkach, które testowaliśmy, kliknięcie na greckie lub łacińskie słowo powinno skutkować nowym oknem z informacjami o analizie i linkami do słowników. Kolejne kliknięcia spowodują, że to samo okno analizy zostanie „odświeżone”; jeśli nic nie widzisz, może to być okno ukryte za innymi oknami przeglądarki. Jeśli Grecki nie pojawia się jako Grecki, upewnij się, że twoja przeglądarka radzi sobie z kodowaniem UTF-8 i pobierz czcionkę Unicode, która zawiera Grecki. Istnieje wiele darmowych czcionek greckich. Cięcie i wklejanie w edytorach tekstu powinno być łatwe. W większości przypadków powinieneś być w stanie wpisać wyszukiwane słowa bez znaków diakrytycznych (oznacza to również: bez wdechów i zapisów iota), lub w transliteracji (patrz ’ Info & Help’ dla wskazówek); po prostu pamiętaj, aby wybrać odpowiedni przycisk radiowy (’brak diakrytyków’, 'Transliteracja’).
szczegóły Unicode to chyba zbyt wiele informacji: staramy się być konsekwentni w użyciu wstępnie połączonego Unicode i unikaniu przestarzałych znaków, które używają „oxia” zamiast kanonicznych kombinacji „tonos”). Jeśli używasz Greckiej metody wprowadzania danych, która daje wariant „oxia”, rozważ wprowadzenie wyszukiwania bez znaków diakrytycznych, gdy w grze występują ostre akcenty lub zainstalowanie metody wprowadzania, która jest zgodna z praktyką kanoniczną. System Mac OS X ma wbudowane wejście polytonic, które również spełnia te standardy.
o co chodzi z morfologią? A co oznaczają kolory?
wiosną 2008 roku otrzymaliśmy grant ATI na opracowanie analizy morfologicznej korpusu greckiego i umożliwienie jego przeszukiwania. Możesz dowiedzieć się więcej o tym projekcie, czytając streszczenia naszych prezentacji na ten temat lub patrząc na ten duży plakat o tym, jak to wszystko zostało złożone. W nowszej prezentacji przedstawiamy przegląd zbioru poszukiwań. Aby uzyskać więcej informacji na temat kodów części mowy, zapoznaj się z sekcjami”Info & pomoc ” w formularzach wyszukiwania. Ważne jest, aby podkreślić, że teksty nie zostały przeanalizowane ręcznie, tak że będzie wiele błędnych parses. Mamy nadzieję, że pomożesz nam je poprawić!
w typowym oknie parse zobaczysz jeden parse podświetlony jasnoniebieskim kolorem. Oznacza to, że nasz automatyczny tagger części mowy wybrał ten Pars jako najbardziej prawdopodobny w kontekście. Zobaczysz liczbę (powiedzmy, 0.45678) związaną z analizą. To wyraża prawdopodobieństwo systemu (głupi komputer, który nie zna greckiego tak dobrze jak ty!) wiąże się z tym konkretnym parse. Części tekstów zostały otagowane ręcznie. Jeśli napotkasz ręcznie oznakowany formularz, będzie on koloru zielonego. Nawet tam mogą pojawić się problemy z wprowadzaniem danych, więc bądź krytyczny i zgłoś (Prześlij formularz zgłoszenia problemu za pomocą linku w oknie analizowania, jeśli poprawny analizator nie jest wymieniony) wszelkie błędy, które znajdziesz.
jak szukać cech morfologicznych lub lematów?
jeśli chcesz wyszukać wystąpienia lematu lub kodu części mowy, użyj tego samego pola wyszukiwania, co dla zwykłych słów (lub „ciągów”), ale przedrostek 'lemma:’ lub 'pos:’. Na przykład „lemma: nostos” lub „lemma: sum”.
Nowość: za pomocą ’ formularza:”możesz zignorować bardziej złożone instrukcje dotyczące kodów części mowy. Po prostu napisz, co Twoim zdaniem wystarczy opisać formularz, którego szukasz, w dowolnej kolejności, ale użyj myślników między terminami. Na przykład „form: optative-act-singular” dla aktywnego optative w liczbie pojedynczej, gdzie „form: sg-opt-act” zrobiłby to samo.
kody części mowy są mniej proste do podsumowania. Informacje & sekcja pomocy zawiera krótkie wprowadzenie. Ważne jest, aby wiedzieć, że podczas gdy Pełna analiza stanowi dziesięć slotów, wiele z nich będzie pustych (-), a jeszcze więcej nie będzie cię interesować w danym momencie. Wszystko to możesz zostawić nieokreślone za pomocą*, ale twoje sformułowanie musi być na tyle specyficzne, że ” a ” definiuje biernik, a nie aorystę. W tym celu pomocne jest poznanie kolejności różnych gniazd. Są to:
1) większa część mowy: czasownik, rzeczownik, przymiotnik, zaimek, partykuła (g), przysłówek, liczebnik, przyimek, spójnik, Interpunkcja;
2) mniejsza część mowy: a: Artykuł lub determinatywny (łac. is, idem, ipse), osobowy, demonstracyjny, x: nieokreślony, pytający, względny, dzierżawczy, k: refleksyjny, wzajemny, właściwy;
3) osoba: 1, 2, 3;
4) liczba: pojedyncza, mnoga, Podwójna;
5) Czas: teraźniejszy, niedoskonały, Aorysta, doskonały, współbieżny, przyszły, przyszły doskonały;
6) nastrój: orientacyjny, Subjunctive, Optative, imperatywny, bezokolicznik, imiesłów, gerundive, gerund, supine;
7) głos: aktywny, środkowy, bierny, środkowy-bierny;
8) Płeć: Męski, żeński, nijaki, powszechny;
9) przypadek: mianownik, dopełniacz, celownik, biernik, ablatyw, wołacz;
10) stopień: porównawczy, najwyższy.
wyrażenia regularne będą działać w pewnym stopniu. Na przykład, można po prostu określić ” pos: * a -„, aby uchwycić oskarżycieli. (Wszystkie sloty od 1 do 8 są tutaj nieokreślone. Wiemy o tym, ponieważ pole wyszukiwania zawsze wymaga pełnego słowa, a nasze słowo skończyło się na” -„, a nie dziką kartą). Jednak w tym początkowym sformułowaniu brakuje oskarżycieli, które są również porównawcze lub superlatywy. Aby je uwzględnić, spróbuj zamiast tego 'pos:*a’. oznacza „wybierz jeden z elementów xyz między nawiasami”. I odwrotnie, jeśli ktoś szuka zaimków osobowych, może mieć sens użycie pos: pp* bez dalszej specyfikacji o slotach 3-8.
Wyszukiwanie części mowy i lematu można łączyć, za pomocą średnika, lub stosować osobno, ze spacją, jeśli podaje się różne słowa: wyszukiwanie 'lemma:dokew;pos:v-3s.* pos:.* d – ’ wyszukuje formy δοκέω w trzeciej liczbie pojedynczej (średnik), a osobno coś w celowniku.
jest to chyba równie dobry moment jak każdy, aby zwrócić uwagę, że nasz parser i nasza wyszukiwarka nie znają składni greckiej, a nawet Łacińskiej! Będziesz musiał sam decydować, w tego rodzaju poszukiwaniach, czy znalezione przez Ciebie odpowiedniki są w rzeczywistości odpowiednikami, które są regulowane przez czasownik.
Czy to wszystko jest raczej przytłaczające? Zdajemy sobie sprawę, że formuły wyglądają raczej zabraniająco! Jeśli uda nam się znaleźć czas i fundusze, będziemy pracować nad bardziej naturalnym pytaniem o język (czy mógłbym mieć jakieś doskonałe aktywne opcje?) na miejsce „pos: v * roa*”.
i co z tego?
uważamy, że ten korpus ma wielką obietnicę zarówno dla badań, jak i dla nauczania. Filolodzy muszą prowadzić badania nad korpusem poza jednym słowem; bardziej szczegółowo, klasyczni lingwiści powinni pracować nad tworzeniem większej liczby twierdzeń opartych na dowodach i ilościowych niż w większości obecnej literatury. Nauczyciele, którzy chcą wybrać słownictwo lub konstrukcje do podkreślenia, powinni mieć pojęcie częstotliwości użycia i zamiast wymyślać przykłady, mogliby szybko wyszukać rzeczywiste przykłady konstrukcji. Aby dać prosty przykład, trzy określone artykuły w kolejności nie jest niczym niezwykłym. Teraz możesz znaleźć rzeczywiste przykłady w Lysias, odpowiednim autorze dla klas wprowadzających i pośrednich, aby to zademonstrować. W praktycznej notce dla nauczycieli, jeśli wyślesz klasie link tego rodzaju, zjawisko, które chciałeś podkreślić, zostanie wyróżnione na stronie. Jeśli chcesz zwrócić uwagę uczniów na konkretną część strony-wyszukaj ją i wyślij im skopiowany adres URL wyniku wyszukiwania. Zobaczą to samo podświetlenie.
Super! Jak mogę pomóc?
jak pewnie sobie wyobrażasz, istnieje wiele kół w kołach, aby ta strona robiła to, co robi, a czasami rzeczy gubią się w przetasowaniu. Jeśli zauważysz coś nie tak, daj nam znać. Oto jak możesz pomóc nam ulepszyć tę stronę: jeśli napotkasz problem, użyj linku „Zgłoś Problem”, który znajdziesz na stronach wyników.
poprawki użytkownika dla konkretnego słowa lub fragmentu będą miały zarówno lokalny wpływ w ich kontekście, ale mogą wskazywać na bardziej powszechne problemy, więc mogą mieć globalny wpływ na przyszłą dokładność bazy danych jako całości.
okno parse ma osobny formularz zgłoszenia problemu (w przypadku, gdy żaden z Parsów nie jest zadowalający lub krótka definicja spada, cóż, krótka).
co jeśli chcę zrobić więcej?
ten projekt nie byłby możliwy bez otwartego oprogramowania i danych udostępnionych na licencji creative commons. Jeśli jesteś członkiem wydziału, pracownikiem, studentem lub administratorem instytucji szkolnictwa wyższego, otrzymuj informacje o otwartym dostępie, otwartych treściach i Creative Commons. Wspieraj zasady, które reprezentują i działaj na rzecz zmian tam, gdzie możesz w swojej instytucji i organizacjach zawodowych. Niezależnie od przynależności, entuzjaści klasyki mogą wspierać organizacje, które pracują z tymi zasadami. Możesz wspierać projekty open-access I Creative-commons, które lubisz. Dla klasyków niektóre witryny do odwiedzenia jako Dobre Domy rozliczeniowe dla tego rodzaju informacji to Ancient World Online Chucka Jonesa, Vitruvian Design Blog Neela Smitha i stoa.org.
kredyty
Większość programowania w wydaniu 2009 została wykonana przez jednego licencjata z informatyki (duża ilość dodatkowej niefinansowanej pracy przez zdeterminowanych klasyków pomaga, a także oprogramowanie open-source i pomoc jego programistów). Pragniemy wyrazić naszą wdzięczność dla Rektora Uniwersytetu w Chicago za grant ATI na lata 2008-2009. I oczywiście dla Ryszarda wieloryba za to, że to zrobił! W dekadzie od, stopniowa poprawa Perseus i Logeion nie byłoby możliwe bez wsparcia College of the University of Chicago, z polityki dean John Boyer za wspieranie projektów wydziału do jego genialnych studentów. (Jeśli jesteś obecnie undergrad, przyjdź do mnie!
to wszystko?
ostateczny skład osób, którym należy podziękować za pomoc w minionym roku. Wszystkie programy do wydania z 2009 roku zostały wykonane przez Richarda Whalinga. My, Richard I Helma, chcemy podziękować naszym disambiguators: Kristin Dean, Charlotte Krontiris, i Ursula Poole; Walt Shandruk, za munging przez stos danych łacińskich w krótkim czasie; Perseus Project, za dzielenie się danymi i ekspertyz; Martin Mueller, za konsultacje i udostępnianie swoich Homeric danych; i Hugh Cayless, za ułatwienie nam życie z jego transkoder. Dziękujemy całemu personelowi ARTFL za powitanie klasyków wśród nich i hojne dzielenie się wiedzą, kofeiną i radością.
wydanie z 2018 roku znacznie skorzystało z pracy Waltera Szandruka. Patrząc na wdrażanie bardziej nowoczesnych narzędzi, prosimy o cierpliwość wobec tej strony w starym stylu; uważamy, że nadal ma w sobie jakiś przebieg!
wrzesień 2018,
Helma Dik