MenĂº principal Powered by <TEI:TOK> |
CoOrAJe - Corpus Oral de Ladino
Bienvenido a CoOrAJe - el Corpus oral anotado del judeoespañol. CoOrAJe es un corpus multigénero que contiene documentos orales, clasificados según su género textual, fecha y origen geográfico, acompañados de la correspondiente transcripción enriquecida automática o semiautomáticamente con anotaciones lingüísticas de varios tipos. CoOrAJe contiene metadatos que proporcionan información sobre los autores de los documentos orales (lugar y fecha de nacimiento, lugar de residencia, estatus social, etc.) y sobre los propios documentos (tipo de texto, fecha y lugar de su creación, etc.) El flujo de trabajo de la edición digital de CoOrAJe se compone de dos tareas principales: el procesamiento lingüístico y anotación de los documentos utilizando diversas herramientas del procesamiento de lenguajes naturales (Freeling: http://nlp.lsi.upc.edu/freeling/ y Neotag: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1098.html) y la codificación de metadatos y anotación lingüística incorporada a los textos usando XML para ser visualizados y realizar las búsquedas con TEITOK. Cómo citar este corpus CoOrAJe - Corpus oral anotado del judeoespañol. Directora: Aldina Quintana. Disponible en línea: http://recursos-glif.upf.edu/teitok/cooraje/ [Fecha de la consulta]. 12/08/2018
|