En las pasadas décadas se produjo una digitalización masiva de todo tipo de contenidos y hoy buena parte de la materia prima informativa se produce ya directamente en formato electrónico (textos, audio, vídeo, mediciones, etc.). Sin embargo, aunque se encuentre en formato electrónico, se trata esencialmente de una forma de almacenamiento de la información, que facilita operaciones como su replicación y transmisión. Pero sigue siendo una información destinada para comprendida por humanos (libros, fotografías, películas, música, etc.); y se distingue de la denominada información estructurada, que es aquella cuyo contenido puede interpretar directamente un ordenador, lo que le permite asimilarla, buscarla y procesarla muy rápidamente (por ejemplo, las bases de datos).
Sin embargo, el volumen de información no estructurada crece tan vertiginosamente que su aprovechamiento está ya fuera del alcance de las capacidades humanas. Buena parte de esta información es de contenido lingüístico (oral y escrito). Y son las tecnologías del lenguaje las que permiten explotar automáticamente (“estructurar”) dicha información.
Por ello, las tecnologías del lenguaje tienen un protagonismo principal para construir una siguiente etapa en la economía de los datos. Las tecnologías del lenguaje son el pilar de un sector emergente transversal vinculado a la innovación con capacidad para promover crecimiento, competitividad y empleo de calidad. Esto, unido a la importancia del español en el mundo, a la existencia de una buena gobernanza del idioma y de destacados grupos investigación en España, y a la rica experiencia que supone la existencia de varias lenguas cooficiales, presenta una oportunidad que no debemos perder.
Para catalizar este potencial, la Secretaría de Estado impulsa el Plan de Impulso de las Tecnologías del Lenguaje, que tiene por objeto fomentar el desarrollo del sector del procesamiento del lenguaje natural, la traducción automática y los sistemas conversacionales en España, y aprovechar estas novedosas capacidades para mejorar los servicios de las Administraciones Públicas.
El Plan de Impulso de las Tecnologías del Lenguaje se articula en cuatro ejes:
- Eje 1: Desarrollo de infraestructuras lingüísticas: El objetivo de este eje es impulsar la industria de las tecnologías del lenguaje en español y lenguas cooficiales poniendo a su disposición infraestructuras lingüísticas de propósito general con el fin de que la industria española se sitúe en la frontera de la innovación, evitando la replicación de esfuerzos, logrando economías de escala y completando cadenas de valor en España.
- Eje 2: Impulso de la industria de las tecnologías del lenguaje: Las medidas de este eje se centran en las actuaciones de visibilidad, formación, transferencia del conocimiento e internacionalización.
- Eje 3: La Administración Pública como impulsora de la Industria del Lenguaje: En este eje se propone la creación de sendas plataformas comunes de procesamiento de lenguaje natural y de traducción automática para las Administraciones Públicas, y apoyar la generación, estandarización y difusión de recursos lingüísticos creados en el contexto de la actividad de gestión pública propia de la Administración aprovechando el marco la política de Reutilización de la Información del Sector Público (RISP).
- Eje 4: Proyectos Faro: El objetivo de este eje es poner en valor desde el primer momento las demás medidas del Plan, que son de naturaleza horizontal, transversal, con actuaciones en servicios públicos concretos de alto impacto social, que abarquen toda la cadena de valor y den lugar a productos y servicios acabados; con el fin de demostrar las capacidades y beneficios de las tecnologías del procesamiento del lenguaje natural y la traducción automática.
Para llevar las acciones contempladas en el Plan de Impulso de las Tecnologías del Lenguaje la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital cuenta con un presupuesto consignado a tal efecto. Sin perjuicio de esto, la Secretaría de Estado para la Sociedad de la Información y la Agenda Digital pretende movilizar también financiación de programas internacionales, como el programa "Fomento de Innovación desde la Demanda y de la Compra Pública Innovadora" (en adelante FID) cofinanciado con Fondos Europeos de Desarrollo Regional (FEDER) o el programa HORIZONTE 2020 de la Comisión Europea, entre otros.
Con el doble objetivo de mejorar el servicio público mediante el empleo de tecnologías del lenguaje y llevar a la industria española a la vanguardia de la innovación en este sector, se arranca un procedimiento de Compra Pública de Innovación en el marco del Plan de Impulso de las Tecnologías del Lenguaje mediante la convocatoria de una Consulta Preliminar al Mercado.