Corpus
"Tuits" irónicos
Más información

Corpus

Presentación del recurso

Esta es una colección de "tuits" en español irónicos y no irónicos (background) extraídos de la red social Twitter. La parte irónica fue curada a mano.

El procedimiento para obtener la colección fue el siguiente:

  • Para los textos irónicos se extrajo "tuits" con los hashtags #ironía y #sarcasmo
  • De los "tuits" extraidos, manualmente se etiquetaron los que se consideraron irónicos
  • Para los textos de background, se extrajeron "tuits" con palabras normales, eg. donde o que

Para mayor detalle del procedimiento etiquetación consultar este Reporte técnico y para mayor detalle de la recolección pueden consultar la siguiente tesiscontacto:

  • Jasso, Gabriela: Identificación de ironía en textos cortos. Facultad de ingeniería, Univesidad Nacional Autónoma de México.. Facultad de Ingeniria, Universidad Nacional Autónoma de México. 2016.


  • Siguiendo los lineamientos de Twitter esta colección sólo incluye la información de los identificadores de los "tuits".

    Licencia Creative CommonsCorpus "tuits" irónicos por Gabriela Jasso, Ivan Meza, Red Temática en Tecnologías del Lenguaje, CONACYT se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional.

    Descargar

    Archivos y código

    Corpus

    Archivos del corpus, consistente en: irónicos, no_ironicos (con #irónia o #sarcasmo) y background. Adicionalmente se incluyen scripts de estadísticas básicas del corpus.

    Herramienta de etiquetación

    Código de herramienta de etiquetación con capacidades de manejar usuarios, asignar tareas y monitorear dudas.

    Este sitio

    Código de este sitio



    Si usas el corpus, en tus trabajos puedes hacer referencia al siguiente artículo:

    Participantes

  • Gabriela Jasso, recolección, etiquetación, supervisión y PLN
  • Fernanda Hernández, etiquetación y PLN
  • Antonio Mora, etiquetación y PLN
  • Ivan Meza, supervisión y coordinación
  • La creación del recurso fue posible gracias al apoyo de la Red Temática en Tecnologías del Lenguaje, CONACYT

    Contacto

    Para mayor información no dudes en contactarnos