페 프로젝트를 텍스트로드에서 PhiloLogicFinal 시즌에 대한 PhiloLogic3,여름 2018
영 Perseus 에서 PhiloLogic. 그것은 이후 우리는 공식 업데이트를 출시했지만,여기에 그것은,덕분에 지칠 줄 모르는 논쟁(C,perl,아파치 및 다른 많은 카나)이 여름 기 Shandruk. 개입 년 특히 그리스어 텍스트의 측면에 상당한 작업을 보았다,및 PhiloLogic 의 기능에 대한 몇 가지 향상… 철학자. 나는 모든 사람들을 우리에게 쓴 년 이상을 보고 오타와 다른 오류가 발생하거나 단순히 보고 서버가 중단되었습니다. 우리는 당신이 더 많은 것을 위해 계속 돌아와서 기쁩니다.
경우 Perseus 모선에서 술을 나타내는 잘 부착한 라이브러리 carrel,텍스트와 함께,주석,전과 다른 자원을 모두 당신의 범위 내에서,동일한 페이지에 다음의 조직이 사이트에 놀랄 수 있습니다. 보다는 독서와 함께–기구,우리는 우리를 제공하는 것을 목표로 삼고 있습니의 탐험을 통해 텍스트의 갑옷 코퍼 쿼리를 처리합니다. 기 때문에 많은 텍스트 구문 분석하고,나머지 그들과 함께 컴퓨터를 검색할 수 있는 방법으로 보이지 않으면서도 다른 많은 장소:스 검색에 대한 현재 명령이 플라톤이거나,입자 μέν 만 라인에서 음성으로 Ismene. 문장의 끝에서 βοοτός 의 형태를 찾고 계십니까? 우리는 그들을 봉사하기 위해 여기에 있습니다. 에 대한 경험하고 게시 초 독자는 또한 우리를 추천하는 도구로 지금은 익숙,I hope:에서의 컨텍스트 보기,배열 도구입니다.
우리는 모든 문제 보고서 및 사용자 제안에 감사드립니다; 계속 그들(그리고 당신의 기부:-))오는. 개발 나란히 유지하기 위해,트위터에 우리를 따라 고려:@LogeionGkLat. 기다리고있는 일:우리는 페르세우스 디지털 라이브러리에서 꾸준히 사용할 수있게되고있는 더 많은 텍스트를 실제로 통합하고자합니다. 더 중요한 것은,우리가 적응해야하는 새로운 세대의 PhiloLogic,PhiloLogic4,의 요구 classicists(생각:탐색하지 않는 페이지 번호를 통해서 edition,lemma 검색;…),그래서 우리는 더 이상 열 다섯 살짜리 기술에 의존하지 않습니다. 계속 지켜봐주십시오.
배경:그 텍스트는 어디에서 왔습니까?
이 텍스트에서 우리가 사용할 수 있도록 이 사이트를 실질적으로 모든 사용 권한에서 페 프로젝트에서 터프츠 대학교,이 foremostDigital 라이브러리를 위해 클래식 세계를 위해하지 않는 경우,theHumanities 에서 일반적입니다. 그리스 및 로마 자료 모음에서 독자는 오늘날 읽은 정식 텍스트를 많이 찾을 수 있습니다. Greekcollection 은 800 만 단어에 접근하고 라틴어 컬렉션은 현재 550 만 개가 있습니다. 또한,많은 영어 사전 다른 참고 번역,주석이 포함되어 있습니다,그래서는 누구나 인터넷에 연결된 액세스 권한 해당하는 존경하는 대학 클래식 라이브러리입니다. 그리스어와 라틴 텍스트는 풍부한 인코딩을 위한 컨텐츠가 아닌가 원하는 보고방식(예를 들어,지 않는 페이지를 나누,이니셜을 들여쓰기이지만,스피커의 정보를 미터 정보 및 이정표). Perseus 사이트는 더욱 풍성하여 복잡한 연결 메커니즘의 텍스트 중(의 결과로 30 개 이상의 백만의 링크). 라이센스 정보,편집자 및 번역자에 대한 세부 정보 등,텍스트의 서지 세부 사항에 표시 XML 헤더 링크를 클릭합니다. 컨설팅에 대한 참조는 작품,우리는 지금가는 것이 좋습니다 바로 Logeion 에 웹이나 앱에서는다;우리는 아직도 제공합 검색 가능한 LSJ,루이스&짧고,슬레이트;그리고 우리는 우리에 넣어에 대한 링크를 드 스어-그리스어 사전입니다.
당신은 텍스트에 무엇을 했습니까? 또는:거울은 어디에 있습니까?
Tufts 사이트에서 텍스트 선택을 찾을 수 있지만 forbrowsing 및 검색 메커니즘은 다릅니다. 그것은 PhiloLogic,asystem 는 특히 개발한 큰 텍스트 데이터베이스에 의해 ARTFL 프로젝트에서는 대학의하고 있습니다. 원래 동안 스톡홀름 사이트는 훌륭한 도구에 대한 선형을 읽고,모든 종류의 자원에서 동일한 페이지는 동안에는 사용자를 읽을 구절,우리가 관심을 활용하여 풍부한 인코딩을 검색하는 텍스트,그리고 다른 작업에 대해 덜 읽고 더 많은 연구에 대한:코퍼스 언어학,다. 우리는 감사하는 페 프로젝트의 텍스트를 사용할 수 있는 제삼자,그리고 계속해 희망에 살고있는 다른 비영리 기관에 전념하(그리스어)텍스트 큐레이션을 향상시킬 것이 그들의 검색 및 분석을 제공하거나를 따라 예 페르세우스의 결정을 만들 수 있는 데이터를 위한 고급 분석을 가진 다른 시스템보다 자신 있습니다. 연락,또는 오픈 소스 인 PhiloLogic 의 자신의 사본을 다운로드하십시오.
검색 상자에 Cicero 를 입력 할 때 사이트에서 읽을 Cicero 를 제공하지 않는 이유는 무엇입니까?검색 양식이 Google 검색 상자와 같지 않다는 것을 이해하는 것이 중요합니다. 검색 상자에 대한 단어에서 발생하는 텍스트,그래서는’를 입력하여 갈리아 est’을 찾을 수 있 개 문장의 이베리아,그러나 들어가’율리우스 카이사르’는 첫 번째 인스턴스에서 당신을 이끌 텍스트의 카툴 및 Cicero. 에서 출발은 저희 홈페이지 링크를 클릭하여 전체 검색 양식을 사용할 수 있습니다 저자이자 타이틀 필드를 입력 표준을 인용 상단(에 기반한 옥스포드 클래식어 사전). 인용이 서버가 기대하는 바가 아니라면,우리가 사용하는 약어를 보여줄 모든 텍스트의 전체 목록을 얻을 수 있습니다.
왜 Google 과 더 비슷하지 않습니까?
PhiloLogic 가를 활용할 수 있도록 설계되어 풍부한 구조를 인코딩하는 페르세우스 텍스트를 제공,따라서 알아 사이의 차이는 유형의 콘텐츠:말에 텍스트와 그래서 소위 메타데이터:저자,제목,그리고 훨씬 더 많은. 그것은 또한할 수 있도록 설계된 정확한 특정 질문에 대한 답변을 보다는 오히려,야구장의 추정은’당신은 운이 좋은 느낌’형식입니다. 는 경우 검색할 단어를’amicitia’에서 텍스트나 이름이’Pseudolus’,우리는 당신을 원하지 않는 경우를 찾기에서 타이틀을,또는 스피커–표시하지 않는 한 당신이 지정하는 정보의 종류:타이틀을 포함하는 amicitia,말씀을 통해서 Pseudolus,하고 있습니다. 우리는 두 가지 접근법 모두 장점이 있지만 더 정확한 검색은 고전 주의자들이 원하는 경향이있는 것이라고 믿습니다. 에 들어가기 전에 아무것도 검색 분야,너는 물이 어떤 종류의 검색:는 단어로 검색이거나 검색에 대한 메타데이터가 포함되어 있습니다. 검색이 메타 데이터에 대한 것이면 검색 양식의 다른 곳에서 피팅 필드를 찾으십시오. 팁:검색 필드 옆에있는 버튼을 클릭하면,당신은 항상 당신의 옵션의 목록을 얻을 것이다.
다른 그리스 코퍼스를 검색 할 때 결과가 다른 이유는 무엇입니까?
여러 가지 중요한 차이:가장 중요한 것은,음은 아마 많은 것 보다 훨씬 더 큰 선택을 제공 여기고,본문은 종종의 최근티 빈티지도 있습니다. 다른 한편으로,텍스트가 없을 수 있었다 명확히는 추측에 대한 주파수 수 있다는 항상 높은 끝에 포함 lemmata 하지 않는 사실에서 발생하는 텍스트 또는 발생하지 않으로 주파수를 주장했다. We would like to see 우리가 보고 싶은 기능을 찾으로 음성 부분,또는 지정된 특성은(스피커),그리고 더 나은 활용의 분석에서 모든 사람의 코퍼스,하지만 우리는 위치에 무엇을 알고 뒤에서 문을 닫았다. 더 많은 질문? 물론 채팅하게되어 기쁩니다.
이 사이트를 어떻게 사용합니까? 모든 검색 양식은 어디로 갔습니까?
한 종류의 반응은 우리가 많이 들었어요 원래에 대한에서 페 PhiloLogic 사이트는 검색 양식이었다는 오히려 위협하는 초보자. 이제 우리는 우리가 잘 십 년간,그리고 좋은 대안에 대한 텍스트를 읽고,같은 아름다운 새로운 Scaife 뷰어,우리는 우리의 뿌리,당신이 말할 수 있습니다. 기본 텍스트 및 번역을 찾고 있다면이 페이지 상단의 그리스어 또는 라틴어를 클릭하십시오. 참고 작품은 Logeion 에서 찾을 수 있습니다;단행본 중 문법.
텍스트와 그 번역은 동일한 데이터베이스에 살고 있습니다. 번역에서 원본으로 이동하거나 링크(‘영어’,’그리스어’,’라틴어’)를 클릭하여 나란히 읽을 수 있습니다. 번역이 여러 개인 경우’영어’와’English2’가 표시됩니다. 일반적인 방문에 대한 데모를 보려면이 프레젠테이션의 이전 부분의 단계를 확인하십시오.
논평과 모노 그래프는 두 개의 개별 데이터베이스에 살고 있습니다. 입력하 고대 저자 또는 제목에 제목 필드 검색 폼에는지 여부를 알아보려면 해설을 사용할 수 있는 특정한 고대의 텍스트입니다. 단행본에는 다양한 문법이 포함됩니다. 에서 검색 페이지에 대한 논문,빠른 검색 상자에 대한 문법 부분에 따라,어떻게 이 작품은 일반적으로 얻기에서 인용한 논평과 교실.
단어와 구문 분석을 검색하려면 그리스어 및 라틴어 텍스트에서 클릭하십시오. 창이 나타나는 것입니다 또한 링크를 제공합 Logeion 을 보여줍니다 당신 말씀에 나타나는 전체 세트의 사전 및 참고 우리가 사용할 수 있습니다. 전체 텍스트 검색을 계속 사용할 수 있에서 검색 양식에 대한 일부 개별적인 사전에서 액세스할 수 있는 최고의 이 페이지로 이동합니다.
어떤 브라우저를 사용해야합니까? 더 이상 구문 분석 창을 찾을 수 없습니다! 왜 급성 억양을 가진 내 완벽하게 정상적인 단어를 찾을 수 없습니까?
우리가 알고 있는 사용자에 대한 좋은 경험 Linux,Ubuntu,Windows XP,Mac OS 등 운영체제는 우리가 알고 있는 오페라,파이어폭스,사파리 성공적으로 이용되었습으로 브라우저입니다. 불행히도 Internet Explorer 는 클릭 투 구문 분석 메커니즘과 호환되지 않습니다. 에는 모든 다른 브라우저 우리는 테스트,클릭스 그리스 또는 라틴어야 한 결과에서 새로운 창으로 분석한 정보와 링크하는 사전. 이후 클릭 결과 이와 동일한 구문 분석 창에는’상쾌하’;지 않으면 아무것도 볼것이 될 수 있는 것이 창 뒤에 숨겨진의 다른 브라우저의 창(s). 그리스 실패로 그리스어 있는지 확인하는 귀하의 브라우저를 다룰 수 있 UTF-8 인코딩을,및 다운로드는 유니코드 글꼴은 그리스에 있습니다. 무료 그리스어 글꼴이 많이 있습니다. 워드 프로세서에 자르고 붙여 넣기가 쉬워야합니다. 대부분의 경우 분음 부호없이 검색하는 단어를 입력 할 수 있어야합니다(이는 또한 의미합니다: 아 breathings 및 없는 iota subcripts),또는 음역(참조하십시오’정보&’도움’에 대한 지침);단지를 선택하는 해당 라디오 버튼(‘아톱’,’음’)때는 이것이 가능합니다.
유니코드는 아마도 너무 많은 정보:이 되기 위해 최선을 다하겠습니다 일관에서 사용하여 미리 결합되는 유니코드 및 피하고 지금은 사용되지 않는 문자를 사용하는’oxia’보다는 오히려 정식’tonos’조합). 사용하는 경우에는 그리스어 입력 방법을 생산하는’oxia’변형을 고려해 입력하신 검색 없이 분음이 있을 때에 급성 악센트 플레이거나 설치하는 입력 방식을 준수하는 정규습니다. Mac OS X 시스템에는 이러한 표준을 준수하는 폴리 토닉 그리스어 입력 기능이 내장되어 있습니다.
형태학에 관한이 사업은 무엇입니까? 그리고 색상은 무엇을 의미합니까?
2008 년의 봄에 우리가 받은 ATI 권한을 부여하여 개발하는 형태소 분석을 위해 그리스어 코르푸스,그리고 그것을 검색할 수 있습니다. 에 대해 자세히 알아볼 수 있습니다 이는 프로젝트를 읽고의 초록 저희가 제공하는 프리젠테이션에 이 주제 또는 살펴보고 이에 큰 포스터 어떻게 모든 하였습니다. 더 최근의 프리젠 테이션에서,우리는 검색의 집합의 워크 스루를 제시한다. 품사 코드에 대한 자세한 내용은 검색 양식의’Info&도움말’섹션을 참조하십시오. 텍스트가 손으로 구문 분석되지 않았 음을 지적하는 것이 중요하므로 많은 잘못된 구문 분석이있을 것입니다. 우리는 당신이 우리가 그 문제를 해결하는 데 도움이되기를 바랍니다!
일반적인 구문 분석 창에서 밝은 파란색으로 강조 표시된 구문 분석 하나가 표시됩니다. 그것은 우리의 자동 품사 태거가이 구문 분석을 컨텍스트에서 가장 가능성있는 것으로 선택했음을 나타냅니다. 구문 분석과 관련된 숫자(예:0.45678)가 표시됩니다. 이 확률 시스템(그리스어뿐만 아니라 당신이 모르는 바보 같은 컴퓨터를 표현!)는 특정 구문 분석과 연관시킵니다. 텍스트의 일부가 손으로 태그되었습니다. 손으로 태그가 지정된 양식을 만나면 색상이 녹색이됩니다. 심지어 있는 데이터 입력 문제에 올 수 있습니다,그래서 바다 중요하고 보고서(제출 문제가 보고서 형태로 링크를 통해서 분석 창의 경우 올바른 분석이 나열되지 않음)어떠한 오류를 찾을 수 있습니다.
형태 학적 특성이나 lemmas 를 어떻게 검색합니까?
경우에 당신이 검색하고자하는 항목을 lemma 또는 음성 부분에 코드를 사용하여 동일한 검색 필드를 위해 정상적인 단어(또는 문자열),하지만 당신은 접두사’lemma:’또는’pos:’. 예를 들어’lemma:nostos’또는’lemma:sum’입니다.
New:’form’을 사용하여:’따르는 품사 코드에 대한보다 복잡한 지침을 무시할 수 있습니다. 단순히 작성 당신이 무엇을 생각하는 것이 충분히 설명하는 양식을 찾고 있는 어떤 순서로만 사용 하이픈습니다. 예를 들어,’form:optative-act-singular’단수의 활성 optative 에 대해’form:sg-opt-act’는 동일한 작업을 수행합니다.
품사 코드는 요약하기가 덜 간단합니다. 정보&도움말 섹션에는 간단한 소개가 있습니다. 그것이 중요하다는 것을 알고있는 동안 풀 구성 분석 십 슬롯,이들의 많은 비어있을 것입니다(-),그리고 더 많은 것이 되지 않 당신에게 관심을 보는 간단한 방법을 제공합니다. 이들 모두는*로 지정되지 않은 채로 남겨 둘 수 있지만,귀하의 제형은’a’가 비난적이고 aorist 를 정의하지 않을 정도로 구체적이어야합니다. 이를 위해 다른 슬롯의 순서를 아는 것이 도움이됩니다. 그들이있다:
1)주요 부:동사,명사,형용사,대명사,입자(g),부사,숫자,전치사,함께,감탄사;
2)사소한 부분의 음성기:: 문서 또는 확정(라틴어,idem,ipse),개,시범,x:무기한,의문문,친지,소유,k:반사,상호,적절한;
3)사람은:1,2,3;
4)숫자:단일,복수형,듀얼;
5)긴장:현재의 불완전한,부정과거 완벽한,대 과거,미래,미래를 완벽;
6)기분을 나타내,가정법,Optative,이 필수적,부정, 분사,Gerundive,동명사,부정사;
7)음성:활동 적이고,중동,수동,중동;
8)성별:남성,여성,중성,일반적인;
9)의 경우:주격,소유격,여격,목적어,융제,호격;
10)학위:비교,최상급.
정규 표현식은 어느 정도 작동합니다. 예를 들어,단순히’pos:*a-‘를 지정하여 비난을 포착 할 수 있습니다. (1 에서 8 까지의 모든 슬롯은 여기에 지정되지 않은 채로 있습니다. 검색 필드에 항상 완전한 단어가 필요하기 때문에이를 알고 있으며 와일드 카드가 아닌’-‘로 단어를 종료했습니다). 그러나이 초기 제형은 비교 또는 최상급 인 비난을 놓칠 것입니다. 그들을 포함 시키려면 대신’pos:*a’를 시도하십시오. ‘괄호 사이의 xyz 항목 중 하나를 선택’을 의미합니다. 반대로,개인 대명사를 찾고 있다면 pos:pp*에 대한 추가 사양이없는 슬롯 3-8 을 사용하는 것이 합리적 일 수 있습니다. 검색’lemma:dokew;pos:v-3s.*pos:.*d-‘는 3 단수(세미콜론)에서 δοκέω 의 형태를 검색하고 dative 에서 별도로 무언가를 검색합니다.
이것은 아마도로 좋은 순간으로 모든 것을 지적의 파서 우리의 검색 엔진지 않을 알리거나 심지어는 라틴어 구! 당신이 결정하는 자신에 대한 검색에 이런 종류의 여부를 datives 당신을 찾는 사실 datives 그에 의해 지배의 동사입니다.
이 모든 것이 다소 압도적입니까? 우리는 수식이 오히려 금지되어 있다는 것을 깨닫습니다! 면 우리를 찾을 수 있습 시간과 자금,우리는 작업에 더 많은 자연어 쿼리(수 있는 내시부한 활성 optatives?)’pos:v*roa*’를 대신합니다.
그래서 뭐?
우리는이 코퍼스가 연구와 교육 모두에 큰 약속을 지니고 있다고 생각합니다. 언어학을 할 필요가 코퍼스 연구를 넘어 단어;특히,클래식 언어학 작동해야에 더 많은 증거 기반의 정량적 요구상에서 발견되는 많은 현재 문학. 하고자 하는 교사들에게 무엇을 선택 단어 또는 구조물을 강조해야의 개념을 사용 빈도,그리고 만드신 것이 아니라,예제들을 실행할 수 있는 빠른 검색을 위해 실제 예제의 구조물이다. 간단한 예를 들자면,순서대로 세 가지 확실한 기사가 특이하지 않습니다. 이제 이것을 보여주기 위해 입문 및 중급 수업에 적합한 저자 인 Lysias 에서 실제 예제를 찾을 수 있습니다. 교사를위한 실용적인 메모에서 수업에 이런 종류의 링크를 보내면 강조하고 싶은 현상이 페이지에 강조 표시됩니다. 하고자하는 경우 그리는 학생들의 관심을 특정 페이지의 일부-그것을 위해 찾고,그들을 보내 복사한 URL 의 검색 결과입니다. 그들은 같은 강조 표시를 볼 것입니다.
좋아요! 어떻게 도와 드릴까요?
으로 당신은 아마 상상할 수있는 많은 많은 바퀴에 바퀴 이 사이트를 수행하고 당신이 원하는 무엇이고 때로는 일에서 손실됩니다. 당신이 비스듬히 뭔가를 볼 경우,알려 주시기 바랍니다. 할 수 있는 방법은 다음과 같습니다 우리가 개선하는 데 도움이트 문제가 발생하는 경우,사용하시기 바랍니”문제”를 보고하는 링크에서 찾을 수 있습니다 결과 페이지입니다.
사용자 수정을 위해 특정 단어 또는 구절이 있는 로컬 영향에서 자신의 컨텍스트,하지만 지적할 수 있는 더 광범위한 문제,그래서 그들이 할 수 있는 세계적인 영향을 미래에 대한 정확도의 데이터베이스 전체적으로.
는 구문 분석 창에는 별도의 문제가 보고서 형태(경우에 없을 분석하는 만족입,또는 짧은 정의 폭포,well,쇼).
내가 더하고 싶다면?
이 프로젝트를 가능하지 않았을 것이라고 없이 오픈 소스 소프트웨어와 데이터 공유 크리에이티브-커먼즈 라이센스. 당신은 교수,직원,학생,또는 관리자가에서 고등 교육 기관,학습에 대한 정보를 얻을 열 액세스 콘텐츠를 열고 크리에이티브 커먼즈. 그들이 대표하는 원칙을지지하고,자신의 기관과 전문 기관에서 할 수있는 곳에서 변화를 위해 일하십시오. 제휴 관계에 관계없이 고전 애호가는 이러한 원칙으로 일하는 조직을 지원할 수 있습니다. 당신은 당신이 좋아하는 오픈 액세스 및 크리에이티브 커먼즈 중심의 프로젝트를 지원할 수 있습니다. 에 대한 classicists,일부 사이트를 방문하는 좋은 청소를 위한 집의이 종류는 정보는 척 존스의 고대 세계에 온라인 닐 스미스의 인체 디자인을 블로그 stoa.org.
크레딧
의 많은 프로그래밍에 2009 년 출시에 의해 수행되었다 하나의 고전 BA 을 추구하이 마스터의 컴퓨터 공학(의 좋은 금액을 추가 자동으로 결정 classicists 도움뿐만 아니라,오픈 소스 소프트웨어와 지원자). 우리는 2008-09 에 대한 ATI 그랜트에 대한 시카고 대학의 Provost 의 사무실에 우리의 감사를 등록하고자합니다. 그리고 물론,그것을 떼어 내기 위해 리차드 포경에게δδος! 에 십 년 이후,속적인 개선의 페 및 Logeion 없었을 것이 없이 가능한 지원의 대학의 대학교 시카고에서,딘 존 보이어의 정책을 지원하는 교수의 프로젝트를 화려한 학부생했다. (현재 학부생이라면 나를 찾아 오십시오!)
그게 전부입니까?
마지막 라인업,다음,사람들의 지난 해에 도움을 주셔서 감사합니다. 2009 년 릴리스의 모든 프로그래밍은 Richard Whaling 이 수행했습니다. 우리는,리처드 및 Helma,감사의 말을 전하고 싶 우리의 disambiguators:크리스틴 딘,샬럿 Krontiris 및 Ursula Poole;트 Shandruk,에 대한 은폐를 통해 더미의 라틴어 데이터에서 짧은;Perseus 프로젝트를 위한 데이터를 공유 및 전문성,마틴 Mueller,상담하고 사용할 수 있는 그의 호머의 데이터 및 휴 Cayless,을 만들기 위한 우리의 인생을 더 쉽게 자신의 Transcoder. 우리는 감사가 전체에서 직원 ARTFL 을 환영 classicists 그들 가운데서하고 관대한 전문 지식을 공유하는,카페인,그리고 기쁨.
2018 릴리스는 Walter Shandruk 의 작업에서 큰 이익을 얻었습니다. 로운 방식으로 구현하는 더 현대적인 도구,우리는 양해를 부탁드립 이전 스타일이다;우리는 생각은 여전히 몇 가지 마리에서 그것!
2018 년 9 월,
Helma Dik