Menú principal Powered by <TEI:TOK> |
CoDiAJe - Corpus diacrónico anotado del judeoespañol (ladino)Bienvenido a CoDiAJe - Corpus diacrónico anotado del judeoespañol. CoDiAJe es un corpus multigénero diacrónico que contiene documentos de entre los siglos XVI y XXI, clasificados según su género textual, fecha y origen geográfico, enriquecidos automática o semiautomáticamente con anotaciones lingüísticas de varios tipos. CoDiAJe contiene metadatos que proporcionan información sobre los autores de los documentos (lugar y fecha de nacimiento, lugar de residencia, estatus social, etc.) y sobre los propios documentos (tipo de texto, fecha y lugar de su creación o impresión, alfabeto en que fue redactado, si se trata de un texto manuscrito o impreso, si es original, traducido o adaptado de otro). El flujo de trabajo de la edición digital de CoDiAJe se compone de dos tareas principales: el procesamiento lingüístico y anotación de los documentos utilizando diversas herramientas del procesamiento de lenguajes naturales (Freeling: http://nlp.lsi.upc.edu/freeling/ y Neotag: http://www.lrec-conf.org/proceedings/lrec2012/summaries/1098.html) y la codificación de metadatos y anotación lingüística incorporada a los textos usando XML para ser visualizados y realizar las búsquedas con TEITOK.
Cómo citar este corpus CoDiAJe - Corpus diacrónico anotado del judeoespañol. Directora: Aldina Quintana. Disponible en línea: http://recursos-glif.upf.edu/teitok/codiaje/ [Fecha de la consulta].
---- CoDiAJe forma parte de tres proyectos de investigación núms. 473/11, 486/19 y 1505/24 financiados por la Fundación de Ciencias de Israel (ISF). 2019-12-09
|