Sesión de impacto sobre la confluencia de datos abiertos y tecnologías del lenguaje
Compartir
Fecha: 6 de Octubre 2016, 16:45 - 17:45.
Lugar: Madrid, Centro de convenciones IFEMA NORTE, Sala B.
Metodología
Reunir a algunas visiones y experiencias relevantes sobre la utilidad de los Datos Abiertos para la Traducción Automática y el Procesamiento de Lenguaje Natural.
Los expertos expondrán sus visiones y casos de uso sobre la confluencia de Datos Abiertos y Tecnologías del Lenguaje. Le seguirá un debate abierto entre ellos y con la audiencia. El moderador introducirá a los expertos y extraerá algunas conclusiones al final.
Agenda
- Introducción (Moderador): 5’
- Visiones y casos de uso (Panel de expertos): 32’ (7 minutos cada uno)
- Discusión abierta: 15’
- Conclusiones y mensajes finales (Presentación): 5’
Ponentes
Márta Nagy-Rothengass
- Directora de la unidad “Data Value Chain“, Comisión Europea.
- Título: Datos Abiertos y Tecnologías del Lenguaje. La visión de la Comisión Europea. El caso de uso de la plataforma de traducción automática CEF.
- Resumen: en el marco de la estrategia del Mercado Digital Único, el objetivo en poner en marcho un círculo virtuoso de los datos. Esto incluye una Estrategia de Datos Abiertos Multilingües.Un ejemplo relevante del valor de los Datos Abiertos para las Tecnologías del Lenguaje son las memorias de traducción de la Dirección General de Tradución de la Comisión Europea (https://open-data.europa.eu/es/data/), que es el conjunto de datos más descargado del portal de datos abiertos de la Unión Europea.CEF.AT es una plataforma de traducción automática que hará multilingües los servicios públicos europeos con el propósito de hacer los servicios públicos digitales igualmente accesibles a todos los ciudadanos europeos independientemente de su lengua de trabajo y sus habilidades lingüísticas, y para facilitar el intercambio de información transfronterizo en la administración pública.
Bente Maegaard
- University of Copenhagen Centre for Language Technology Copenhagen, Denmark.
- Título: Infraestructura común de recursos y tecnologías del lenguaje: CLARIN.
- Resumen: CLARIN proporciona acceso fácil y sostenible a datos lingüísticos digitales (escritos, orales o multimodales) para investigadores de ciencias sociales y humanidades. CLARIN también proporciona herramientas avanzadas para descubrir, explorar, explotar, anotar, analizar y combinar estos conjuntos de datos, independientemente de dónde se encuentren. Para eso, CLARIN está construyendo una red federada de repositorios de datos, centros de servicio y centros de conocimiento, con un acceso único para todos los miembros de la comunidad académica de todos los países participantes. Los datos y las herramientas de los diferentes centros son interoperables, de modo que las colecciones de datos pueden combinarse y las herramientas de diferentes fuentes pueden encadenarse para realizar operaciones complejas en apoyo del trabajo de los operadores.
Martin Krallinger
- Centro Nacional de Investigaciones Oncológicas (CNIO).
- Título: OpenMinted: una infraestructura-e abierta orientada a servicios para minería de datos y textos (TDM) de contenido científico y académico.
- Resumen: Los últimos años son testigos de un aumento de las cantidades de datos digitales de investigación que ofrecen nuevas perspectivas y oportunidades para una comprensión más profunda. La minería de datos y textos se está convirtiendo en una herramienta poderosa para aprovechar la potencialidades contenidas en los datos estructurados y no estructurados, analizándolos en múltiples niveles y varias dimensiones para descubrir el conocimiento oculto y nuevo. Sin embargo, las soluciones de minería de texto no son fáciles de descubrir y utilizar, ni son fácilmente combinables por los usuarios finales. OpenMinTeD aspira a crear una infraestructura que promueva y facilite el uso de las tecnologías de minería de textos en el mundo publicaciones científicas. Se basa en herramientas y plataformas de minería de textos existentes, y las hace visibles e interoperables a través de registros apropiados y una capa de interoperabilidad basada en estándares. Es compatible con la formación de los usuarios de minería de texto y desarrolladores por igual y demuestra los méritos del enfoque través de varios casos de uso identificados por los expertos de diferentes ámbitos científicos, que van desde la comunicación académica genérica a la literatura relacionada con las ciencias de la vida, la alimentación y la agricultura, y las ciencias sociales y las humanidades. A través de sus actividades de infraestructura, la visión de OpenMinTeD es que se ponga en funcionamiento un ciclo virtuoso en el que a) se acceda al contenido principal a través de interfaces y reglas de acceso estandarizadas b) por servicios de minería de textos bien documentados y accesibles que procesen, analicen y realicen anotaciones de texto c) para identificar patrones y extraer nuevo conocimiento significativo, que será utilizado d) para estructurar, indexar y buscar contenido y, al mismo tiempo, e) actuar como nuevo conocimiento útil para dibujar nuevas relaciones entre los elementos de contenido y disparar un nuevo ciclo de la minería.
David Pérez
- Adviser to the Secretary of State for Telecommunications and Information Society, Spain.
- Título: El Plan de Impulso de las Tecnologías del Lenguaje.
- Resumen: El Plan de Impulso de las Tecnologías del Lenguaje pretende desarrollar el sector del procesamiento de lenguaje natural y la traducción automática en España. Parte de una evaluación de la situación que puede resumirse así: alto potencial de crecimiento y desarrollo, oportunidad única, y recursos disponibles, pero dispersos. Comprende un amplio espectro de medidas. Entre ellas está la generación, estandarización y distribución de recursos lingüísticos abiertos útiles para las tecnologías del lenguaje, principal, pero no exclusivamente, en el ámbito de la Política de Reutilización de la Información del Sector Público (RISP).
Más información
Para cualquier información sobre este taller, por favor, escriba a: PlanTecnologiasLenguaje@minetur.es