s

Resumen

En los últimos años asistimos a un aumento espectacular en el volumen y la variedad de la información disponible proveniente de diversas fuentes de datos, desde datos estructurados, hasta Open Data, redes sociales, sensores o dispositivos móviles. Estas fuentes pueden proporcionar más información sobre el entorno de las organizaciones y, mejorar así la toma de decisiones estratégicas. Este fenómeno, conocido como Big Data, se prevé que genere una economía de 15 billones de euros en 2016.

Sin embargo, el Big Data presenta tantos retos y problemas como expectativas y potencial. El retorno de la inversión en Big Data no está garantizado y diversos estudios demuestran que los proyectos de Big Data presentan una tasa de fracasos muy alta. Las instituciones y organismos públicos están destinando grandes recursos para solventar los problemas inherentes al Big Data.

La gestión de Big Data tiene unas características especiales, que la mayoría de expertos coinciden en definir como las 5 Vs (Volumen, Velocidad, Variedad, Veracidad, Valor). Dichas características hacen necesario contar con avances tecnológicos aún no existentes y que abren un sinfín de oportunidades de investigación y transferencia con beneficios tangibles para la sociedad.

En la actualidad, las principales soluciones y aproximaciones se están centrando en proporcionar soluciones para el procesamiento distribuido y almacenamiento masivo de datos (basadas en bases de datos NOSQL y/o sistemas Hadoop) y/o en la aplicación de técnicas estadísticas y de inteligencia artificial en dominios concretos para intentar extraer conocimiento de tales volúmenes ingentes de datos. Si bien estas aproximaciones están generando resultados esperanzadores, la selección y tratamiento de fuentes de Big Data adolece hoy en día de una aproximación metodológica y global que permita aprovechar economías de escala y aplicarlo a diversos dominios, ofreciendo oportunidades de negocio a PYMES y emprendedores.

El principal objetivo del proyecto coordinado SEQUOIA es aportar modelos, métodos y herramientas software que permitan a las organizaciones afrontar los proyectos de Big Data maximizando las posibilidades de éxito. Esto conlleva una aproximación sistemática y metodológica para incorporar Big Data en el proceso diario de toma de decisiones, considerando la sinergia entre enfoques de la Ingeniería del Negocio, Ingeniería del Software e Ingeniería de Datos. Los nodos participantes son grupos de reconocido prestigio internacional en las áreas anteriormente descritas:

  • La UCLM trabajará en los aspectos relativos a la calidad y seguridad de los datos de Big Data.
  • La UA trabajará en aspectos relativos a la definición de los Key Performance Indicators de Big Data a incorporar en la toma de decisiones y en el desarrollo de una metodología sistemática.
  • La US desarrollará los modelos y herramientas que permitan mejorar el diseño y ejecución de procesos de negocio que generan y usan Big Data.

El proyecto se enmarca en el reto (7) Economía y Sociedad Digital del Plan Estatal, y adicionalmente el reto (8) Seguridad, protección y defensa, aunque su carácter sistemático e interdisciplinar persigue generar soluciones que se puedan aplicar a proyectos de Big Data de otros Retos. Además, los principales objetivos del proyecto están también alineados con la estrategia H2020 para el Big Data y con asociaciones nacionales e internacionales que impulsan este tipo de soluciones.

Summary

SEQUOIA (SEcurity and QUality in prOcesses with bIg data and Analytics)

Recent years have seen a spectacular increase in the volume and range of information available. A wide variety of data sources, from traditional structured data to Open Data, social networks, sensors or mobile devices, can provide more information on organizational environments, thus improving strategic decision-taking. This phenomenon, known as Big Data, is forecast to generate revenue of 15 billion Euros in 2016.

Big Data, however, presents us with as many challenges and problems as it does expectations and potential. Guaranteed return on investment in Big Data exists, yet several studies show that projects in this field have a high failure rate. Institutions and public bodies earmark huge amounts of resources towards solving problems inherent to Big Data.

Big Data management has some special features; most experts accept that these may be described as the 5 “V’s” (Volume, Velocity, Variety, Veracity, Value); they call for technological advances that do not yet exist and provide endless opportunities for research, the results of which would bring about tangible benefits for society.

At present, the main solutions and approaches are focusing on providing solutions for distributed processing and the storage of massive data (based on NoSQL databases and / or Hadoop systems) and / or the application of statistical techniques and artificial intelligence in particular domains trying to extract knowledge from such huge volumes of data. While these approaches are generating encouraging results, the selection and management of Big Data sources suffers today from a methodological and global approach that could exploit economies of scale and apply it to various domains, offering business opportunities to SMEs and entrepreneurs.

The main objective of the coordinated SEQUOIA project is to contribute models, methods and software tools to allow organizations to take on Big Data projects and maximise their chances of success. Involving a systematic and methodical way of seeing how to incorporate Big Data into the daily decision-making process, it optimises the synergy between the different approaches of Business Engineering, Software Engineering and Data Engineering. The participating nodes are groups with renowned international prestige in these fields.

  • The UCLM will work on aspects related to Big Data quality and security.
  • The UA will work on defining the Big Data Key Performance Indicators that should be incorporated into decision-making and the development of a systematic methodology.
  • The US will develop models and tools for improving the design and execution of the business processes which generate and use Big Data.

The project lies mainly within the framework provided both by challenge (7) of the State Plan, dealing with Digital Economy and Society, and addtitionaly by challenge (8), which has to do with Security, protection and defence; although its systematic and interdisciplinary seeks to generate solutions that can be applied to Big Data projects of other challenges. In addition, the project’s main objectives are in harmony with the H2020 strategy for Big Data, conforming to the goals of national and international associations with initiatives in these kinds of solutions.