Las organizaciones se están dando cuenta del volumen considerable de datos que tienen, y necesitan explotarlos para sacarles valor e incorporarlos en la mejora de sus procesos. Para ello, buscan empresas que les guíen sobre qué hacer con esos datos. Aquí es el momento en el que entran en juego las consultorías de Big Data.
El término de consultoría Big Data es un término muy amplio que abarca infinidad de procesos. El Big Data es la unión de diferentes tecnologías, pero todas con un objetivo común: extraer información de los datos para generar valor. Lo que nos encontramos habitualmente es que se ha hecho mucha labor de “evangelización” de este mundo del Big Data.
Cuando hablamos de Big Data, no podemos olvidar los parámetros por los que se rigen las características más importantes, las 7 V del Big Data: Volumen, Velocidad, Variedad, Veracidad, Viabilidad, Visualización, y la más importante, el Valor de los datos. Para todos los parámetros anteriores, el Big Data requiere el uso de un conjunto de herramientas, aplicaciones y marcos para almacenar, procesar y explotar los datos.
Las empresas han oído que los datos son un recurso más y que si los explotas puedes sacar valor y así mejorar tus procesos de negocio, ¿por dónde empezar?
¿Qué se hace en una consultoría Big Data?
Cuando una consultoría de Big Data entra en juego, lo primero que hay que ver es qué datos tienen y qué problemas quieren resolver, y cómo piensan que el análisis de los datos podría ayudarles.
Normalmente, las consultorías de Big Data comienzan haciendo tareas de entender con el cliente las necesidades que tienen y los datos que pueden aportar. O bien, los datos que se pueden aportar desde la propia consultoría. Por ejemplo, datos libres. Con esto, hay un movimiento en auge del Open Data o datos abiertos.
La expresión Open Data hace referencia a datos que las organizaciones hacen públicos, como pueden ser gobiernos, ayuntamientos, periódicos de investigación, entre otros. Éstos son un subconjunto de todos los datos que se encuentran disponibles en la red.
Por ejemplo, a raíz de lo que podamos pensar, los datos de Twitter no se consideran Open Data ya que son datos públicos por naturaleza, pero igualmente es una fuente disponible para proyectos de consultoría Big Data.
También, hay que tener en cuenta las empresas que venden datos comercialmente, como los datos de meteorología, que pueden ayudar igualmente a enriquecer el proyecto que se esté llevando a cabo.
La primera labor de consultoría Big Data sería juntar y analizar toda esta información y llegar a una solución común en base a esas necesidades iniciales. O incluso, en caso de que el cliente no tenga un problema definido, se puede llegar a mejorar a base de analizar sus datos disponibles.
Fases de una consultoría Big Data
Para poder llevar a cabo un proyecto de Big Data, las consultorías definen una serie de fases donde llevar a cabo todos los puntos estructuradamente, de manera que se llegue a una solución eficaz para la empresa que está requiriendo ese asesoramiento.
Fase 1. Workshops para ver datos y necesidades
Normalmente, cuando una consultoría recibe un proyecto de Big Data, se realizan una serie de workshops donde se llevan a cabo dos acciones:
- Ver los datos disponibles. Se estudian todos los datos que tiene esa empresa y cómo se relacionan entre ellos. También se identifican aquí las fuentes de datos externas que puedan ser de utilidad para la empresa.
- Identificar necesidades. Se identifican las necesidades que la empresa pretende resolver con el estudio de los datos. En muchos casos, la experiencia de una consultoría puede establecer cruces que ya se hayan establecido anteriormente en empresas de la misma área o incluso de sectores diferentes.
En ocasiones, el tipo de datos que se obtienen de las empresas son muy variados, desde bases de datos muy estructuradas, documentos de texto como en pdf, imágenes, vídeos, siendo este último el formato más complejo de analizar.
Fase 2. Listado de soluciones
Como resultado de esta primera fase de la consultoría de Big Data y tras analizar los datos, se prepara un listado con las posibles soluciones que pueden implementarse en vista de los datos disponibles y las necesidades de la empresa. Es el momento en el que el cliente toma la decisión de qué solución aplicar.
Fase 3. Ordenación y limpieza de los datos
Una vez que llegamos a este punto, los datos se ordenan y organizan, y se extrae información relevante para la toma de decisiones. Tener los datos ordenadospermite la elaboración de conclusiones y la identificación de nuevas vías de desarrollo del negocio.
Fase 4. Prototipo de la solución
Una vez que el cliente sabe la solución a aplicar ante el problema que tenían, y que los datos se han ordenado, la empresa consultora de proyectos Big Data puede realizar un prototipo sobre la solución que explota esos datos para conseguir mejorar sus procesos empresariales o resolver la necesidad que se ha identificado.
En otras ocasiones, el proceso es más sencillo pues la empresa tiene establecida la solución que quiere mejorar y sabe de qué datos se disponen. En tal caso, en esta fase se compara la nueva solución prototipo con la solución ya existente, midiendo de forma fiable la mejora que se tendría al pasar a la nueva solución.