|
Nombre de la campaña |
|
|
Nombre de la tarea |
Plagiarism detection |
|
Tipo de tarea |
Evaluación de sistemas de clasificación automática: plagio vs. no plagio |
|
Descripción de la tarea |
Dado un conjunto de documentos (en inglés) y unos documentos fuentes (en inglés, español y alemán), la tarea consiste en encontrar todos los fragmentos de textos que han sido plagiados y los correspondientes fragmentos en los documentos fuente. Dos han sido las subtareas: detección externa de plagio (a partir de los documentos fuente) y detección intrínseca de plagio (analizando el cambio de estilo en el documento sospechoso). |
|
Categoría de la tarea |
Procesamiento del lenguaje natural, traducción automática (plagio monolingüe y translingüe) |
|
Fecha evento / edición |
2011 |
|
Organizadores |
|
|
Grupos destinatarios |
Abierto a quien quiera participar: han participado grupos de investigación académicos y de institutos de investigación, así como del detector de plagio Ferret. |
|
Elegibilidad |
Cualquiera puede participar (grupos de investigación académicos, de la industria o investigadores individuales). Hay un control de calidad en los working notes presentados (peer review) |
|
Calendario |
|
|
Número de participantes |
11 equipos (~33 personas) |
|
Número de participantes de España |
1 equipos (~2 personas) |
|
Dominio |
El corpus está compuesto por 26.939 documentos y 61. 064 casos de plagio (libros del proyecto Gutenberg). En comparación a la tarea de los años anteriores, el corpus contiene más casos de plagio con paráfrasis. |
|
Idiomas |
lnglés (documentos fuente en inglés, español y alemán)
|
Nombre de la campaña
Nombre de la tarea
Plagiarism detection
Tipo de tarea
Evaluación de sistemas de clasificación automática: plagio vs. no plagio
Descripción de la tarea
Dado un conjunto de documentos (en inglés) y unos documentos fuentes (en inglés, español y alemán), la tarea consiste en encontrar todos los fragmentos de textos que han sido plagiados y los correspondientes fragmentos en los documentos fuente. Dos han sido las subtareas: detección externa de plagio (a partir de los documentos fuente) y detección intrínseca de plagio (analizando el cambio de estilo en el documento sospechoso).
Categoría de la tarea
Procesamiento del lenguaje natural, traducción automática (plagio monolingüe y translingüe)
Fecha evento / edición
2011
Organizadores
Grupos destinatarios
Abierto a quien quiera participar: han participado grupos de investigación académicos y de institutos de investigación, así como del detector de plagio Ferret.
Elegibilidad
Cualquiera puede participar (grupos de investigación académicos, de la industria o investigadores individuales). Hay un control de calidad en los working notes presentados (peer review)
Calendario
Número de participantes
11 equipos (~33 personas)
Número de participantes de España
1 equipos (~2 personas)
Dominio
El corpus está compuesto por 26.939 documentos y 61. 064 casos de plagio (libros del proyecto Gutenberg). En comparación a la tarea de los años anteriores, el corpus contiene más casos de plagio con paráfrasis.
Idiomas
|
Datos de entrenamiento |
|
|
Derecho de redistribución de datos |
Sólo para investigación |
|
Enlace a datasets |
Datos de entrenamiento
Derecho de redistribución de datos
Sólo para investigación
Enlace a datasets
|
Métrica de evaluación |
Plagdet: combinación entre precisión y recall (a nivel de caracteres) y granularidad. |
|
Rendimiento |
|
|
Disponibilidad del código |
- |
|
Tipo de ejecución |
Local |
|
Número total de resultados enviados |
14 (miembros de tres equipos han participado en las dos subtareas) |
|
Resultados con los rankings |
Martin Potthast, Andreas Eiselt, Alberto Barrón-Cedeño, Benno Stein, and Paolo Rosso. Overview of the 3rd International Competition on Plagiarism Detection. In Vivien Petras, Pamela Forner, and Paul D. Clough, editors, Working Notes Papers of the CLEF 2011 Evaluation Labs, September 2011 http://ceur-ws.org/Vol-1177/CLEF2011wn-PAN-PotthastEt2011a.pdf [PDF ] |
|
Volumen de publicación |
vol. 1177, CEUR-WS.org (441 citas a 15/10/2018) |
|
Gestión web de usuarios |
Sí |
|
Atención a participantes |
Email: pan@webis.de Google Groups |
Métrica de evaluación
Plagdet: combinación entre precisión y recall (a nivel de caracteres) y granularidad.
Rendimiento
Disponibilidad del código
-
Tipo de ejecución
Local
Número total de resultados enviados
14 (miembros de tres equipos han participado en las dos subtareas)
Resultados con los rankings
Martin Potthast, Andreas Eiselt, Alberto Barrón-Cedeño, Benno Stein, and Paolo Rosso. Overview of the 3rd International Competition on Plagiarism Detection. In Vivien Petras, Pamela Forner, and Paul D. Clough, editors, Working Notes Papers of the CLEF 2011 Evaluation Labs, September 2011
http://ceur-ws.org/Vol-1177/CLEF2011wn-PAN-PotthastEt2011a.pdf [PDF ]
Volumen de publicación
vol. 1177, CEUR-WS.org (441 citas a 15/10/2018)
Gestión web de usuarios
Sí
Atención a participantes
Email: pan@webis.de
Google Groups
Este sitio web utiliza cookies propias y de tercreos para ofrecer un mejor servicio. Si continúa naveando consideramos que acepta su uso.