PhiloLogicの下でロードされたペルセウスプロジェクトテキストPhiloLogic3,Summer2018
PhiloLogicの下でペルセウスへようこそ。 私たちが公式のアップデートをリリースしてからしばらく経ちましたが、ここでは、Walt Shandrukによるこの夏のindefatigable wrangling(C、perl、apache、および他の多くのarcanaの)のおかげです。 その間の年は、特にギリシャ語のテキストの側に重要な仕事を見てきました,そしてのためのPhiloLogicの機能にいくつかの機能強化… 言語学者。 私は、タイプミスやその他のエラーを報告するために長年にわたって私たちに書かれているすべての人に感謝したいと思います。 私達は嬉しいです多くのためにもどって来続けて下さい。
タフツのペルセウス母船は、すべて同じページ上のあなたの手の届くところにテキスト、解説、辞書やその他のリソースで、整ったライブラリcarrelを表してい 装置を使って読むのではなく、コーパスクエリのパノプリーを通じてテキストの探索を提供することを目指しています。 多くのテキストは手で解析され、残りのテキストはコンピュータで解析されているため、他の場所ではあまり見られない方法で検索することができます。例えば、プラトンの現在の命令、またはイスメネによって話されている行でのみ助詞を検索します。 文の終わりにβ γの形を探していますか? 私たちはそれらを提供するためにここにいます。 経験豊富で初心者の読者のために、我々はまた、今ではおなじみになるツールをお勧めします、私は願っています:コンテキストビューのキーワード、およびコロケーショ
私たちは、すべての問題の報告やユーザーの提案に感謝しています; それらを保ちなさい(そしてあなたの寄付:-))来なさい。 開発に遅れないようにするには、Twitterで私たちをフォローすることを検討してください:@LogeionGkLat。 待っている仕事:私たちは本当に着実にペルセウス電子図書館から利用可能になっているより多くのテキストを、組み込みたいです。 さらに重要なのは、古典主義者のニーズに合わせて、新しい世代のPhiloLogic、Philologic4を適応させる必要があることです(考えてください:版のページ番号ではないナビゲーシ..)、私たちはもはや十五歳の技術に依存しないように。 お楽しみに。
背景:これらのテキストはどこから来たのですか?
このサイトで利用できるテキストは、実際にはすべて、一般的な人間のためではないにしても、古典的な世界のためのforemostDigitalライブラリであるタフツ大学のペルセウスプロジェクトからの許可によって使用されています。 ギリシャ語とローマ語の資料のコレクションでは、読者は今日読んだ標準的なテキストの多くを見つけるでしょう。 Greekcollectionは8万語に近づき、Latin collectionは現在5.5万語を持っています。 さらに、多くの英語の辞書、他の参考文献、翻訳、解説が含まれているので、インターネットに接続している人は誰でも立派な大学の古典図書館に相当する ギリシャ語とラテン語のテキストは、フォームではなくコンテンツ用に豊富にエンコードされています(例えば、改ページ、イニシャル、インデントではなく、スピーカー情報、計量情報、マイルストーンなど)。 ペルセウスのサイトは、テキスト間の複雑なリンクメカニズムによってさらに強化されています(30万以上のリンクが得られます)。 ライセンス情報、編集者や翻訳者の詳細などについては、、テキストの書誌情報の詳細に表示されるXMLヘッダーリンクをクリックします。 私たちはまだ検索可能なLSJ、Lewis&Short、およびSlater;を提供しています。Woodhouseの英語-ギリシャ語辞書へのリンクを入れています。
あなたはテキストに何をしましたか? または:ミラーはどこですか?
ここではTuftsサイトでテキストの選択を見つけることができますが、それらをブラウズして検索するメカニズムは別のものです。 これは、特にシカゴ大学のARTFLプロジェクトによって大規模なテキストデータベースのために開発されたPhiloLogic、asystemです。 元のペルセウスのサイトは、線形読み取りのための優れたツールですが、ユーザーが一節を読んでいる間に同じページにすべての種類のリソースを置くことで、私たちは、テキストを検索するための豊富なエンコードを活用することに興味がありました。 私たちは、ペルセウスプロジェクトが第三者にそのテキストを利用可能にすることに感謝しており、(ギリシャの)テキストキュレーションに専念する他の非営利機関が彼らの検索と分析の提供を強化したり、ペルセウスの例に従ったり、独自の以外のシステムで高度な分析のために彼らのデータを利用できるようにすることを望んで生き続けています。 オープンソースのPhiloLogicのコピーをご自身でダウンロードするか、ご自身のものをダウンロードしてください。
検索ボックスにCiceroと入力したときに、あなたのサイトがCiceroに読んでもらえないのはなぜですか?
文献検索フォームはGoogle検索ボックスのようなものではないことを理解することが重要です。 メインの検索ボックスは、テキスト内に発生する単語のためのものであるので、’Gallia est’を入力すると、ガリア戦争の開始文を見つけることができますが、’Julius Caesar’を入力すると、最初のインスタンスでCatullusとKiceroのテキストにつながります。 ここでは、著者とタイトルのフィールドを使用するか、(オックスフォード古典辞書に基づいて)上部に標準的な引用を入力することができます。 あなたの引用がサーバーが期待しているものでない場合は、すべてのテキストの完全なリストが表示され、私たちが使用する略語が表示されます。 なぜあなたはもっとGoogleのようではありませんか?
PhiloLogicは、ペルセウスのテキストが提供する豊富な構造エンコードを活用するために設計されているため、コンテンツの種類の違いを知るために設計されています:テキスト内の単語、いわゆるメタデータ:著者、タイトル、および大いに多く。 また、特定の質問に正確な答えを可能にするために設計されています,むしろ”あなたは幸運を感じています”タイプの球場の推定値よりも. テキストで’amicitia’という単語や’Pseudolus’という名前を検索する場合、それが情報の種類であることを指定しない限り、タイトルや話者の指示からインスタンスを見つ 私たちは、両方のアプローチには利点があると信じていますが、より正確な検索は古典主義者が望む傾向があるものです。 要するに、検索フィールドに何かを入力する前に、これがどのような種類の検索であるかを自問してください:単語検索またはメタデータの検索。 メタデータを検索する場合は、検索フォームの他の場所でフィッティング項目を検索します。 ヒント:検索フィールドの横にあるボタンをクリックすると、常にオプションのリストが表示されます。
他のギリシャ語コーパスを検索すると結果が異なるのはなぜですか?
いくつかの重要な区別:最も重要なのは、そのコーパスはおそらくここで提供される選択よりもはるかに大きく、テキストはより最近のビンテージ 一方、テキストは曖昧さが解消されていない可能性があるため、周波数についての推測は常にハイエンドにあり、実際にテキストでは発生しないか、 品詞や指定された属性(speakerなど)で検索し、みんなのコーパスで解析をよりよく活用する機能を見たいと思いますが、密室で何が起こっているのかを知る より多くの質問か。 もちろん、チャットして幸せ。
このサイトはどのように使用しますか? すべての検索フォームはどこに行ったのですか?
私たちはPhiloLogicサイトの下で元のペルセウスについて多くのことを聞いた反応の一つのタイプは、検索フォームが初心者にはかなり威圧的 今、私たちは十年以上にわたって周りしてきたことを、そしてそのような美しい新しいScaifeビューアなどのテキストを読むためにそこに良い選択肢と、私た 主なテキストと翻訳を探している場合は、このページの上部にあるギリシャ語またはラテン語をクリックしてください。 参照作品はLogeion;モノグラフの中の文法で見つけることができます。
テキストとその翻訳は同じデータベースに住んでいます。 あなたは、オリジナルに翻訳から行く、またはリンク(”英語”、”ギリシャ語”、”ラテン語”)をクリックして、並んでそれらを読むことができます。 複数の翻訳がある場合は、”English”と”English2″が表示されます。 典型的な訪問のデモについては、このプレゼンテーションの前半の手順を確認してください。
解説とモノグラフは二つの別々のデータベースに住んでいます。 検索フォームのタイトルフィールドに古代の著者またはタイトルを入力して、特定の古代のテキストの解説が利用可能かどうかを確認します。 モノグラフには様々な文法が含まれています。 モノグラフの検索ページには、これらの作品が通常論評や教室でどのように引用されるかに応じて、文法セクションのクイックルックアップボックスがあります。
単語とその解析を検索するには、ギリシャ語とラテン語のテキストでそれをクリックします。 それは私たちが利用可能な辞書や参照作品の完全なセットに表示されるようにあなたの単語が表示されますLogeionへのリンクも提供するウィンドウが表示されますが表示されます。 全文検索は、このページの上部からアクセス可能な、いくつかの個々の辞書の検索フォームから利用可能なままです。
どのブラウザを使用すればよいですか? 私はもはや解析ウィンドウを見つけることができません! なぜ急性アクセントを持つ私の完全に正常な単語が見つからないのですか?
Linux、Ubuntu、Windows XP、Mac OSをオペレーティングシステムとして使用しているユーザーについて知っています。 残念ながら、Internet Explorerはクリックして解析するメカニズムと互換性がありません。 私たちがテストした他のすべてのブラウザでは、ギリシャ語やラテン語の単語をクリックすると、解析情報と辞書へのリンクを持つ新しいウィン 何も表示されない場合は、このウィンドウが他のブラウザウィンドウの後ろに隠されている可能性があります。 ギリシャ語がギリシャ語として表示されない場合は、ブラウザがUTF-8エンコーディングを処理できることを確認し、ギリシャ語を含むUnicodeフォントをダ 無料のギリシャ語フォントがたくさんあります。 ワードプロセッサへの切断と貼り付けは簡単です。 ほとんどの場合、発音区別記号なしで検索する単語を入力できるはずです(これも意味します: これを行うときは、対応するラジオボタン(’diacriticsなし’、’transliteration’)も選択してください。
Unicodeの詳細おそらくあまりにも多くの情報です:私たちは、事前に結合されたUnicodeを使用し、標準的な’tonos’の組み合わせではなく’oxia’を使用する今非推奨の文字を避けて、一貫性を保つようにしています)。 ‘Oxia’変種を生成するギリシャ語の入力方法を使用する場合は、劇中に急性アクセントがあるときに発音区別なしで検索を入力するか、標準的な練習に Mac OS Xシステムには、これらの標準にも準拠したポリトニックギリシャ入力が内蔵されています。
形態学についてのこのビジネスは何ですか? そして、色はどういう意味ですか?
2008年の春に、ギリシャ語コーパスの形態素解析を開発し、検索可能にするためのATI助成金を受け取りました。 あなたはこのトピックに関する私たちのプレゼンテーションの抄録を読むか、それがすべて一緒に置かれた方法については、この大きなポスターを見 より最近のプレゼンテーションでは、一連の検索のウォークスルーを提示します。 品詞コードの詳細については、検索フォームの’Info&ヘルプ’セクションを参照してください。 テキストは手作業で解析されていないので、多くの誤った解析があることを指摘することが重要です。 私たちは、あなたが私たちがそれらを修正するのに役立
典型的な解析ウィンドウでは、水色で強調表示された解析が表示されます。 これは、自動品詞タガーがこの解析をコンテキスト内で最も可能性の高いものとして選択したことを示します。 解析に関連付けられた番号(たとえば、0.45678)が表示されます。 これは、確率システムを表現します(ギリシャ語を知らない愚かなコンピュータだけでなく、あなたがそうであるように!)は、その特定の解析に関連付けられています。 テキストの一部は手でタグ付けされています。 あなたが手でタグ付けされたフォームに遭遇した場合、それは色が緑色になります。 そこにあっても、データ入力の問題が発生する可能性がありますので、重大であり、あなたが見つけたエラーを報告してください(正しい解析がリストされていない場合は、解析ウィンドウのリンクを介して問題報告フォームを提出してください)。 形態学的属性または補題を検索するにはどうすればよいですか?
補題または品詞コードの出現を検索する場合は、通常の単語(または’文字列’)と同じ検索フィールドを使用しますが、それらの前に’lemma:’または’pos:’を付けます。 たとえば、’lemma:nostos’または’lemma:sum’です。
New:’form’を使用して:”あなたは、続く品詞コードのためのより複雑な命令を無視することができます。 あなたが探しているフォームを任意の順序で十分に記述すると思うものを書き出すだけですが、用語の間にハイフンを使用してください。 たとえば、「form:optative-act-singular」は、単数形のアクティブなoptativeの場合、「form:sg-opt-act」も同じことを行います。
品詞コードは要約するのが簡単ではありません。 Info&ヘルプセクションには簡単な紹介があります。 完全な分析は10のスロットを構成していますが、これらの多くは空になります(-)、さらには特定の時間にあなたには興味がありません。 これらはすべて*で指定したままにすることができますが、あなたの定式化は、’a’が対格を定義し、アオリストではないほど具体的でなければなりません。 このためには、異なるスロットの順序を知っておくと便利です。 彼らは次のとおりです。
1)品詞の主要な部分:動詞、名詞、形容詞、代名詞、粒子(g)、副詞、数字、前置詞、接続詞、間投詞;2)品詞のマイナーな部分:a: 3)人:1、2、3;
4)数:単数形、複数形、デュアル;
5)時制:現在、不完全、アオリスト、完璧な、pLuperfect、未来、未来完璧;
6)気分:指標、仮定法、Optative、命令的、不定詞、分詞、Gerundive、動名詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞、動詞仰臥位;
7)声:アクティブ、ミドル、パッシブ、ミドル-パッシブ;
8)性別:男性的、フェミニン、中性、共通;
9)ケース:主格、属格、与格、対格、ablative、発声;
10)程度:比較、最上級。
正規表現はある程度動作します。 たとえば、告発をキャプチャするには、単に’pos:*a-‘を指定するだけです。 (1から8までのすべてのスロットは、ここでは指定されていません。 検索フィールドには常に完全な単語が必要であり、ワイルドカードではなく’-‘で単語を終了しているため、これを知っています)。 しかし、この最初の定式化は、比較的または最上級でもある告発を見逃すだろう。 それらを含めるには、代わりに’pos:*a’を試してください。 “括弧の間の項目xyzのいずれかを選ぶ”ことを意味します。 逆に、人称代名詞を探している場合は、スロット3-8についてのそれ以上の仕様なしでpos:pp*を使用することは理にかなっているかもしれません。
品詞検索と補題検索は、セミコロンを使用して組み合わせることも、別の単語を指定している場合はスペースと別々に使用することもできます。’lemma:dokew;pos:v-3s.*pos:.*d-‘は、3番目の単数形(セミコロン)でδ σ ωの形式を検索し、別々に、与格の何かを検索します。
これはおそらく、私たちのパーサーと私たちの検索エンジンがギリシャ語やラテン語の構文を知らないことを指摘するのと同じくらい良い瞬間です! あなたが見つけるdativesが実際に動詞によって支配されているdativesであるかどうか、この種の検索では、自分で決定する必要があります。
このすべてはかなり圧倒的ですか? 私たちは、式がむしろ禁止に見えることを認識しています! 時間と資金を見つけることができれば、より自然な言語クエリに取り組みます(私はいくつかの完璧なアクティブなoptativesを持っていてもいいですか?)’pos:v*roa*’の代わりに使用します。
だから何?
このコーパスは、研究と教育の両方に大きな約束を持っていると思います。 より具体的には、古典的な言語学者は、現在の文献の多くに見られるよりも多くの証拠に基づいた定量的な主張を行うことに取り組むべきである。 強調する語彙や構造を選択したい教師は、使用頻度の概念を持っている必要があり、例を作るのではなく、構造の実際の例を迅速に検索することがで 簡単な例を挙げると、三つの定冠詞が順番に並んでいることは珍しいことではありません。 これを実証するために、入門クラスと中級クラスに適した著者であるLysiasで実際の例を見つけることができます。 教師のための実用的なメモでは、この種のリンクをクラスに送信すると、強調表示したい現象がページ上で強調表示されます。 ページの特定の部分に学生の注意を喚起したい場合は、それを検索し、検索結果のコピーされたURLを送信します。 彼らは同じ強調表示が表示されます。
素晴らしい! どうしたらいいですか?
あなたはおそらく想像できるように、このサイトはそれが何をするかを行うために車輪の中に多くの多くの車輪があり、時には事 あなたがゆがんで何かを見た場合は、私たちに知らせてください。 このサイトの改善に役立つ方法は次のとおりです。問題が発生した場合は、結果ページにある”問題を報告する”リンクを使用してください。
特定の単語や通路のユーザーの修正は、そのコンテキストでローカルな影響の両方を持つことになりますが、より広範な問題を指すことができるので、彼らは全体として、データベースの将来の精度にグローバルな影響を持つことができます。
解析ウィンドウには別の問題報告フォームがあります(解析のどれも満足できない場合、または短い定義が短い場合)。 もっとやりたい場合はどうすればいいですか?
このプロジェクトは、クリエイティブコモンズのライセンスの下で共有されたオープンソースソフトウェアとデータなしでは不可能でした。 あなたが高等教育機関の教員、スタッフ、学生、または管理者である場合は、オープンアクセス、オープンコンテンツ、クリエイティブコモンズについて情報を 彼らが表す原則をサポートし、あなた自身の機関や専門機関でできることを変更するために働きます。 所属にかかわらず、古典的な愛好家は、これらの原則を扱う組織を支援することができます。 あなたが好きなオープンアクセスとクリエイティブ*コモンズ指向のプロジェクトをサポートすることができます。 古典主義者のために、この種の情報のための良いクリアリングハウスとして訪問するいくつかのサイトは、Chuck JonesのAncient World Online、Neel SmithのVitruvian Design blog、およびstoa.org.
Credits
2009年のリリースのプログラミングの多くは、コンピュータサイエンスの修士号を追求する単一の古典BAによって行われました(決定された古典主義者による追加の未資金作業のかなりの量は、オープンソースのソフトウェアとその開発者による支援に役立ちます)。 私たちは、2008-09のためのATI助成金のためのシカゴ大学の学長のオフィスに感謝の気持ちを登録したいと思います。 そしてもちろん、それを引き離すためにリチャード捕鯨にσ δ σ! 以来、ペルセウスとLogeionの漸進的な改善は、その華麗な学部生に教員プロジェクトを支援するためのディーンジョン*ボイヤーの政策から、シカゴ大学の大学の (あなたが現在の学部生であれば、私を見つけて来てください!
それはすべてですか?
最後のラインアップは、その後、人々の昨年に彼らの助けに感謝します。 2009年のリリースのためのすべてのプログラミングはRichard Whalingによって行われました。 私たちは、リチャードとヘルマは、私たちの曖昧さ回避者に感謝したい:クリスティン*ディーン、シャーロット*クロンティリス、およびUrsulaプール;ウォルト*シャンドルク、急な通知にラテンデータの山を介してmungingための;ペルセウス*プロジェクト、データと専門知識を共有するための;マーティン*ミューラー、相談し、彼のHomericデータを利用できるようにするための;とヒュー*ケイレス、彼のトランスコーダで私たちの人生を楽にするための。 私たちは、彼らの真っ只中に古典主義者を歓迎し、寛大に専門知識、カフェイン、そして笑いを共有するためのARTFLのスタッフ全員に感謝します。
2018年のリリースはWalter Shandrukの仕事から大きく恩恵を受けました。 私たちは、より近代的なツールの実装に向けて見て、私たちはこの古いスタイルのサイトであなたの忍耐を求めます。
2018年9月、
Helma Dik