Esta es una colección de "tuits" en español irónicos y no irónicos (background) extraídos de la red social Twitter. La parte irónica fue curada a mano.
El procedimiento para obtener la colección fue el siguiente:
Para mayor detalle del procedimiento etiquetación consultar este Reporte técnico y para mayor detalle de la recolección pueden consultar la siguiente tesiscontacto:
Siguiendo los lineamientos de Twitter esta colección sólo incluye la información de los identificadores de los "tuits".
Corpus "tuits" irónicos por Gabriela Jasso, Ivan Meza, Red Temática en Tecnologías del Lenguaje, CONACYT se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional.
Archivos del corpus, consistente en: irónicos, no_ironicos (con #irónia o #sarcasmo) y background. Adicionalmente se incluyen scripts de estadísticas básicas del corpus.
Si usas el corpus, en tus trabajos puedes hacer referencia al siguiente artículo:
La creación del recurso fue posible gracias al apoyo de la Red Temática en Tecnologías del Lenguaje, CONACYT