Bienvenido a Perseo bajo Filológica, 2018 edition

    Proyecto Perseus Textos Cargados en PhiloLogicFinal temporada para Filológica 3, Verano de 2018

    Bienvenido a Perseo bajo Filológica. Ha pasado un tiempo desde que lanzamos una actualización oficial, pero aquí está, gracias a la lucha incansable (de C, perl, apache y muchos otros arcanos) de Walt Shandruk este verano. Los años intermedios han visto un trabajo significativo, especialmente en el lado de los textos griegos, y algunas mejoras en la funcionalidad de Filologic for … filólogos. Me gustaría dar las gracias a todos los que nos han escrito a lo largo de los años para informar de errores tipográficos y otros errores; o simplemente para informar de una interrupción del servidor. Nos alegra que sigas regresando por más. Si la nave nodriza Perseus en Tufts representa un carro de biblioteca bien equipado, con textos, comentarios, diccionarios y otros recursos a su alcance en la misma página, entonces la organización de este sitio puede ser una sorpresa. En lugar de leer con aparatos, nuestro objetivo es ofrecer la exploración de los textos a través de una panoplia de consultas de corpus. Debido a que muchos textos se han analizado a mano, y el resto con el ordenador, se puede buscar de maneras que no se ven en muchos otros lugares: Por ejemplo, buscar imperativos presentes en Platón, o la partícula μέν solo en líneas habladas por Ismene. Buscando formas de βροτός al final de la frase? Estamos aquí para servirles. Para los lectores experimentados y post-principiantes, también recomendamos herramientas que a estas alturas serán familiares, espero: la vista de palabras clave en contexto y la herramienta de colocación. Estamos agradecidos por todos los informes de problemas y sugerencias de usuarios; manténgalos (y sus donaciones:-)) llegando. Para mantenerse al tanto de los acontecimientos, considere seguirnos en Twitter: @LogeionGkLat. Trabajo que nos espera: realmente queremos incorporar más textos, que están cada vez más disponibles en la Biblioteca Digital Perseus. Más importante aún, necesitamos adaptar la nueva generación de Filologic, PhiloLogic4, a las necesidades de los clasicistas (piense: navegación que no esté por número de página en una edición; búsquedas de lema;…), para que ya no dependamos de la tecnología de hace quince años. Estén atentos.

    Background: ¿de dónde vienen esos textos?

    Los textos que ponemos a disposición en este sitio se utilizan prácticamente todos con permiso del Proyecto Perseus de la Universidad de Tufts, la Biblioteca digital principal para el mundo clásico, si no para las Humanidades en general. En su colección de materiales griegos y romanos, los lectores encontrarán muchos de los textos canónicos leídos hoy en día. La colección griega se acerca a 8 millones de palabras y la colección latina tiene actualmente 5,5 millones. Además, se incluyen muchos diccionarios en inglés, otras obras de referencia, traducciones y comentarios, para que cualquier persona con conexión a Internet tenga acceso al equivalente de una respetable biblioteca de Clásicos universitarios. Los textos griegos y latinos están codificados de forma en lugar de contenido (por ejemplo, no saltos de página, iniciales y sangrías, sino información del orador, información métrica e hitos). El sitio de Perseo se enriquece aún más con intrincados mecanismos de enlace entre textos (que dan como resultado más de 30 millones de enlaces). Para obtener información sobre licencias, detalles sobre editores y traductores, etc., haga clic en los enlaces de encabezado XML que aparecen en los detalles bibliográficos de los textos. Para consultar las obras de referencia, ahora recomendamos ir directamente a Logeion en la web o en una aplicación; todavía ofrecemos un LSJ con capacidad de búsqueda, Lewis & Corto y Slater; y hemos puesto un enlace al Diccionario Inglés-Griego de Woodhouse.

    ¿Qué le hiciste a los textos? o: ¿Dónde está el espejo?

    Aquí encontrará una selección del texto en el sitio de Tufts, pero el mecanismo para abrirlos y buscarlos es diferente. Es un sistema filológico que fue desarrollado especialmente para grandes bases de datos textuales por el proyecto ARTFL de la Universidad de Chicago. Si bien el sitio original de Perseus es una excelente herramienta para la lectura lineal, al poner todo tipo de recursos en la misma página mientras un usuario lee un pasaje, estábamos interesados en aprovechar la rica codificación para buscar los textos y para otras tareas que no son de lectura sino de investigación: la lingüística de corpus, sobre todo. Estamos agradecidos de que el Proyecto Perseus ponga sus textos a disposición de terceros, y seguimos viviendo con la esperanza de que otras instituciones sin fines de lucro dedicadas a la curación de textos (griegos) mejoren sus ofertas de búsqueda y análisis, o sigan el ejemplo de Perseus, y decidan poner sus datos a disposición para un análisis avanzado con otros sistemas que no sean el suyo. Por favor, póngase en contacto o descargue su propia copia de PhiloLogic, que es de código abierto.

    ¿Por qué su sitio no me da Cicero para leer cuando escribo Cicero en el cuadro de búsqueda?

    Es importante entender que un formulario de búsqueda FilolÓgica no es como un cuadro de búsqueda de Google. El cuadro de búsqueda principal es para las palabras que aparecen en el texto, de modo que al escribir ‘Gallia est’ encontrará la frase inicial de las Guerras Galas, pero al ingresar ‘Julio César’, en primera instancia, le llevará a los textos de Catulo y Cicerón. A partir de nuestra página de inicio, haga clic en el enlace al formulario de búsqueda completo, donde puede usar los campos Autor y Título o escribir una cita estándar en la parte superior (basada en el Diccionario Clásico de Oxford). Si su cita no es lo que el servidor espera, obtendrá una lista completa de todos los textos, que le mostrará la abreviatura que usamos.

    ¿Por qué no te pareces más a Google?

    PhiloLogic está diseñado para aprovechar la rica codificación estructural que ofrecen los textos de Perseus y, por lo tanto, para conocer la diferencia entre los tipos de contenido: palabras en los textos, versus los llamados metadatos: autores, títulos y mucho más. También está diseñado para permitir respuestas precisas a preguntas específicas, en lugar de estimaciones aproximadas del tipo «te sientes afortunado». Si busca la palabra ‘amicitia’ en textos, o el nombre ‘Pseudolus’, no queremos que encuentre instancias de títulos o indicaciones de oradores unless a menos que especifique que ese es el tipo de información: títulos que incluyen amicitia, palabras habladas por Pseudolus, que desea. Creemos que ambos enfoques tienen sus ventajas, pero que la búsqueda más precisa es algo que los clasicistas tienden a desear. En resumen, antes de ingresar algo en un campo de búsqueda, pregúntese qué tipo de búsqueda es: una búsqueda de palabras o una búsqueda de metadatos. Si busca metadatos, busque el campo apropiado en otro lugar del formulario de búsqueda. Consejo: Al hacer clic en los botones junto a los campos de búsqueda, siempre obtendrá una lista de sus opciones.

    ¿Por qué mis resultados son diferentes cuando busco ese otro corpus griego?

    Varias distinciones importantes: Lo más importante, ese corpus es probablemente mucho más grande que la selección ofrecida aquí, y los textos son a menudo de época más reciente. Por otro lado, los textos pueden no haber sido desambiguados, de modo que las conjeturas sobre la frecuencia siempre pueden estar en el extremo superior e incluir lemmata que de hecho no ocurren en los textos o no ocurren con la frecuencia afirmada. Nos gustaría ver la funcionalidad de la búsqueda por parte de la voz, o por atributo especificado (como el orador), y un mejor aprovechamiento del análisis en el corpus de todos, pero no estamos en posición de saber lo que sucede a puerta cerrada. Más preguntas? Encantado de charlar, por supuesto.

    ¿Cómo uso este sitio? ¿A dónde fueron todos los formularios de búsqueda?

    Un tipo de reacción que escuchamos mucho sobre el Perseo original en el sitio FilolÓgico fue que los formularios de búsqueda eran bastante intimidantes para el novato. Ahora que hemos existido durante más de una década, y con buenas alternativas para leer textos, como el nuevo y hermoso Visor Scaife, podemos decir que regresamos a nuestras raíces. Si está buscando los textos y traducciones principales, haga clic en griego o latín en la parte superior de esta página. Las obras de referencia se pueden encontrar en Logeion; gramáticas entre las monografías.
    Los textos y sus traducciones viven en las mismas bases de datos. Puede pasar de la traducción al original, o leerlos uno al lado del otro, haciendo clic en los enlaces (‘Inglés’, ‘Griego’, ‘Latín’). Si hay varias traducciones, verá ‘Inglés’ e ‘Inglés2’. Para una demostración de una visita típica, consulte los pasos de la parte anterior de esta presentación.Comentarios y monografías se encuentran en dos bases de datos separadas. Ingrese autor o título antiguo en el campo título del formulario de búsqueda para averiguar si hay un comentario disponible para un texto antiguo en particular. Las monografías incluyen varias gramáticas. En la página de búsqueda de las monografías, hay un cuadro de búsqueda rápida de secciones gramaticales, de acuerdo con la forma en que estos trabajos suelen citarse en los comentarios y en las aulas.
    Para buscar una palabra y su análisis, haga clic en ella en los textos griego y latino. Aparecerá una ventana que también proporcionará un enlace a Logeion, que le mostrará la palabra tal como aparece en el conjunto completo de diccionarios y obras de referencia que tenemos disponibles. La búsqueda de texto completo permanece disponible en los formularios de búsqueda de algunos diccionarios individuales, accesibles desde la parte superior de esta página.

    ¿Qué navegador debo usar? ¡Ya no encuentro la ventana de análisis! ¿Por qué no se encuentra mi palabra perfectamente normal con un acento agudo?

    Conocemos a usuarios con buenas experiencias en Linux, Ubuntu, Windows XP, Mac OS como sistemas operativos; sabemos que Opera, Firefox y Safari se han utilizado con éxito como navegadores. Desafortunadamente, Internet Explorer no es compatible con nuestro mecanismo de análisis de clics. En todos los demás navegadores que hemos probado, un clic en una palabra griega o latina debería dar lugar a una nueva ventana con información de análisis y enlaces a diccionarios. Los clics posteriores darán como resultado que esta misma ventana de análisis se «actualice»; si no ve nada, puede ser que esta ventana esté oculta detrás de las otras ventanas de su navegador. Si el griego no aparece como griego, asegúrese de que su navegador pueda manejar la codificación UTF-8 y descargue alguna fuente Unicode que contenga griego. Hay un montón de fuentes griegas gratuitas. Cortar y pegar en procesadores de texto debería ser fácil. En la mayoría de los casos, deberías poder escribir las palabras que buscas sin diacríticos (esto también significa: sin respiraciones ni subíndices de iota), o en transliteración (consulte ‘Info & Help’ para obtener orientación); solo asegúrese de seleccionar también el botón de opción correspondiente (‘sin diacríticos’, ‘transliteración’) cuando haga esto.
    Detalle de Unicode que probablemente sea demasiada información: tratamos de ser consistentes al usar Unicode pre-combinado y evitar los caracteres ahora obsoletos que usan ‘oxia’ en lugar de las combinaciones canónicas de ‘tonos’). Si utiliza un método de entrada griego que produce la variante ‘oxia’, considere ingresar su búsqueda sin diacríticos cuando haya acentos agudos en juego o instalar un método de entrada que se adhiera a la práctica canónica. El sistema Mac OS X tiene entrada griega politónica incorporada que también cumple con estos estándares.

    ¿Qué es este negocio de la morfología? ¿Y qué significan los colores?

    En la primavera de 2008 recibimos una subvención ATI para desarrollar análisis morfológicos para el corpus griego y para que se pudiera realizar una búsqueda. Puede obtener más información sobre este proyecto leyendo resúmenes de nuestras presentaciones sobre este tema o echando un vistazo a este gran póster sobre cómo se armó todo. En una presentación más reciente, presentamos un recorrido de un conjunto de búsquedas. Para obtener más detalles sobre los códigos de parte de voz, consulte las secciones «Info & Help » en los formularios de búsqueda. Es importante señalar que los textos no fueron analizados a mano, por lo que habrá muchos análisis erróneos. ¡Esperamos que nos ayude a corregirlos!
    En una ventana de análisis típica, verá un análisis resaltado en azul claro. Indica que nuestro etiquetador automático de partes de voz ha seleccionado este análisis como el más probable en el contexto. Verá un número (digamos, 0.45678) asociado con el análisis. Esto expresa la probabilidad de que el sistema (una computadora estúpida que no sabe griego tan bien como tú!) se asocia con ese análisis en particular. Partes de los textos han sido marcados a mano. Si encuentras un formulario etiquetado a mano, será de color verde. Incluso allí, pueden surgir problemas de entrada de datos, así que por favor, sea crítico e informe (envíe un formulario de informe de problemas a través del enlace en la ventana de análisis si el análisis correcto no está en la lista) de cualquier error que encuentre.

    ¿Cómo busco atributos morfológicos o lemas?

    Si desea buscar ocurrencias de un lema o código de parte de voz, use el mismo campo de búsqueda que para palabras normales (o ‘cadenas’), pero póngales el prefijo ‘lema:’ o ‘pos:’. Por ejemplo, ‘lemma: nostos’ o ‘lemma: sum’. Nuevo: usando el formulario:»puede ignorar las instrucciones más complejas para los códigos de parte del habla que siguen. Simplemente escriba lo que cree que describirá suficientemente la forma que está buscando, en cualquier orden, pero use guiones entre términos. Por ejemplo, ‘form: optative-act-singular’ para un optativo activo en singular, donde ‘form: sg-opt-act’ haría lo mismo.
    Los códigos de parte del habla son menos simples de resumir. La sección de ayuda Info & tiene una introducción rápida. Es importante saber que, si bien un análisis completo constituye diez espacios, muchos de ellos estarán vacíos (-), y aún más no le interesarán en un momento dado. Todos estos pueden dejarse sin especificar con *, pero su formulación debe ser lo suficientemente específica como para que una » a » defina acusativo y no aoristo. Para ello es útil conocer el orden de las diferentes ranuras. Son:
    1) parte mayor del habla: Verbo, Sustantivo, Adjetivo, Pronombre, partícula (g), Adverbio, nuMeral, pReposición, Conjunción, Interjección;
    2) parte menor del habla: a: Artículo o determinativo (Latín es, idem, ipse), Personal, Demostrativo, x: indefinido, Interrogativo, Relativo, Posesivo, k: reflexivo, recíproco, Propio;
    3) persona: 1, 2, 3;
    4) número: singular, plural, dual;
    5) tiempo: Presente, Imperfecto, Aoristo, Perfecto, pluscuamperfecto, Futuro, Futuro perfecto;
    6) estado de ánimo: Indicativo, Subjuntivo, Optativo, Imperativo, iNfinitivo, Participio, Gerundio, Gerundio, Supino;
    7) voz: Activa, Media, Pasiva, Media-pasiva;
    8) género: Masculino, Femenino, Neutro, Común;
    9) caso: Nominativo, Genitivo, Dativo, Acusativo, Ablativo, Vocativo;10) grado: Comparativo, Superlativo.
    Las expresiones regulares funcionarán hasta cierto punto. Por ejemplo, uno podría simplemente especificar ‘pos: * a -‘ para capturar acusativos. (Todas las ranuras del 1 al 8 quedan aquí sin especificar. Sabemos esto porque el campo de búsqueda siempre requiere una palabra completa, y hemos terminado nuestra palabra con ‘-‘ y no con un comodín). Sin embargo, esta formulación inicial dejaría de lado los acusativos que también son comparativos o superlativos. Para incluirlos, prueba ‘pos: * a’ en su lugar. significa «elegir cualquiera de los elementos xyz entre los corchetes». Por el contrario, si uno está buscando pronombres personales, puede tener sentido usar pos: pp * sin más especificaciones sobre las ranuras 3-8. Las búsquedas de palabras parciales y de lema se pueden combinar, por medio de un punto y coma, o se pueden usar por separado, con un espacio, si se especifican palabras diferentes: El lema de búsqueda: dokew; pos: v-3s. * pos:.* d – ‘ busca formas de δοκέω en el 3er singular (punto y coma), y por separado, algo en el dativo.
    Este es probablemente un buen momento como cualquier otro para señalar que nuestro analizador y nuestro motor de búsqueda no saben sintaxis griega o incluso latina. Tendrás que decidir por ti mismo, en búsquedas de este tipo, si los dativos que encuentres son de hecho dativos que se rigen por el verbo. ¿Es todo esto bastante abrumador? ¡Nos damos cuenta de que las fórmulas parecen bastante prohibitivas! Si podemos encontrar el tiempo y la financiación, trabajaremos en consultas de lenguaje más natural (¿podría tener algunas optativas activas perfectas?) en lugar de » pos: v * roa*».

    ¿y qué?

    Creemos que este corpus es muy prometedor tanto para la investigación como para la enseñanza. Los filólogos necesitan hacer un estudio de corpus más allá de una sola palabra; más particularmente, los lingüistas clásicos deben trabajar en hacer más afirmaciones cuantitativas y basadas en evidencia que las que se encuentran en gran parte de la literatura actual. Los profesores que deseen seleccionar qué vocabulario o construcciones enfatizar deben tener una noción de frecuencia de uso, y en lugar de inventar ejemplos, podrían realizar una búsqueda rápida de ejemplos reales de construcciones. Para dar un ejemplo simple, tres artículos definidos en secuencia no es inusual. Ahora puedes encontrar ejemplos reales en Lysias, un autor adecuado para clases introductorias e intermedias, para demostrar esto. Como nota práctica para los profesores, si envía a su clase un enlace de este tipo, el fenómeno que desea resaltar se resalta en la página. Si desea llamar la atención de sus estudiantes sobre una parte en particular de una página, búsquela y envíeles la URL copiada del resultado de la búsqueda. Verán el mismo resaltado.

    ¡Genial! ¿Cómo puedo ayudar?

    Como se puede imaginar, hay muchas ruedas dentro de las ruedas para hacer de este sitio lo que hace, y a veces las cosas se pierden en la confusión. Si ve algo mal, por favor háganoslo saber. Así es como puede ayudarnos a mejorar este sitio: Si encuentra un problema, utilice el enlace «Reportar un problema» que encontrará en las páginas de resultados. Las correcciones de usuario para una palabra o pasaje en particular tendrán un impacto local en su contexto, pero pueden apuntar a problemas más generalizados, por lo que pueden tener un impacto global en la precisión futura de la base de datos en su conjunto.
    La ventana de análisis tiene un formulario de informe de problemas separado (en caso de que ninguno de los análisis sea satisfactorio, o la definición corta caiga, bueno, corta).

    ¿Qué pasa si quiero hacer más?

    Este proyecto no habría sido posible sin software de código abierto y datos compartidos bajo licencias creative commons. Si usted es un miembro de la facultad, personal, estudiante o administrador de una institución de educación superior, infórmese sobre el Acceso Abierto, el Contenido abierto y Creative Commons. Apoye los principios que representan y trabaje por el cambio donde pueda en su propia institución y organizaciones profesionales. Independientemente de la afiliación, los entusiastas de la música clásica pueden apoyar a las organizaciones que trabajan con estos principios. Puede apoyar los proyectos de acceso abierto y orientados a creative commons que le gusten. Para los clasicistas, algunos sitios para visitar como buenos centros de intercambio de este tipo de información son el Mundo Antiguo en línea de Chuck Jones, el blog de diseño Vitruviano de Neel Smith y stoa.org.

    Credits

    Gran parte de la programación en el lanzamiento de 2009 fue realizada por un solo LICENCIADO en Ciencias de la Computación (una buena cantidad de trabajo adicional no financiado por determinados clasicistas ayuda, así como software de código abierto y asistencia de sus desarrolladores). Deseamos dejar constancia de nuestra gratitud a la oficina del Rector de la Universidad de Chicago por su beca ATI para 2008-09. ¡Y por supuesto, κδδος a Richard Ballenero por lograrlo! En la década posterior, la mejora incremental de Perseus y Logeion no habría sido posible sin el apoyo del Colegio de la Universidad de Chicago, desde las políticas del decano John Boyer para apoyar proyectos de la facultad hasta sus brillantes estudiantes universitarios. (Si eres un estudiante de pregrado actual, ¡ven a buscarme!)

    ¿eso Es todo?

    Una lista final de personas a las que agradecer su ayuda en el último año. Toda la programación para el lanzamiento de 2009 fue realizada por Richard Whaling. Nosotros, Richard y Helma, queremos agradecer a nuestros disambiguadores: Kristin Dean, Charlotte Krontiris y Ursula Poole; Walt Shandruk, por analizar un montón de datos latinos en poco tiempo; el Proyecto Perseus, por compartir datos y experiencia; Martin Mueller, por consultar y poner a disposición sus datos Homéricos; y Hugh Cayless, por hacernos la vida más fácil con su Transcodificador. Agradecemos a todo el personal de ARTFL por dar la bienvenida a los clasicistas y compartir generosamente su experiencia, cafeína y alegría.

    El lanzamiento de 2018 se ha beneficiado enormemente del trabajo de Walter Shandruk. A medida que miramos hacia la implementación de herramientas más modernas, pedimos su paciencia con este sitio de estilo antiguo; ¡creemos que todavía tiene algo de kilometraje!

    Septiembre de 2018,
    Helma Dik

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *