Proyectos ganadores del I Hackathon de Tecnologías del Lenguaje
Primer Premio
TextDigester: Resumen Automático Ubicuo, de UPF-TextDigester Team (Francesco Ronzano)
Integra diferentes recursos de PLN para soportar la generación de resúmenes de texto libre a gran escala y en diferentes idiomas. Además de textos planos, TextDigester puede analizar contenidos textuales de páginas HTML como las de un periódico, documentos XML como RSS feed y objetos JSON como los post de Twitter. Una vez detectado el idioma, TextDigester ejecuta el análisis léxico y semántico de los documentos. Gracias a esta información, TextDigester implementa varios métodos para generar resúmenes.
Los diccionarios contextuales permiten buscar la traducción de palabras y expresiones sobre grandes corpus bilingües, ofreciendo así ejemplos de su uso real en contexto. Desafortunadamente, los productos existentes son cerrados y trabajan sobre un número reducido de idiomas. Este proyecto pretende desarrollar una alternativa libre que permitirá la creación automática de diccionarios contextuales a partir de cualquier corpus paralelo así como su consulta mediante una interfaz web.
Su objetivo es facilitar la búsqueda de ofertas de empleo TIC mediante un chatbot, en fuentes de datos estructuradas y no estructuradas mediante su categorización y la consulta en lenguaje natural. El sistema integra un módulo que, a partir de la descripción en lenguaje natural de una oferta, detecta las entidades presentes en la oferta: titulación, lenguajes de programación, idiomas, sistemas operativos, bases de datos…