Big Data, la solución de las grandes empresas

Bryan Leinder Cordero Caballeros

Estudiante de Ingeniería en Ciencias y Sistemas - USAC

Palabras Clave:
Business, intelligence, datos, análisis, diseño, contextual, estrategia, informe, resultados, modelos.

El éxito de los negocios empresariales muchas veces tiene que ver con aprender de los errores cometidos en el pasado, reforzar áreas débiles en la organización, optimizar procesos, etcetera. Luego de una mala etapa surgen preguntas como ¿Qué se hizo mal? ¿Qué falló en la planeación? ¿Se llevó el control adecuado de los procesos?, y sobre todo ¿Quién o Quienes tienen la culpa?, como ya sabemos siempre se busca culpar a alguien de las cosas desafortunadas que pasan.

Puede que algunas veces sea ocasionado por un error humano, pero una mejor idea sería que antes de decidir culpables, sea verificar el proceso que están ejecutando y la persona a cargo, posteriormente determinar sí en verdad el proceso es el ideal para cumplir con los objetivos de la empresa.

Entonces, supongamos que la empresa decide que se va a verificar el proceso, se realizará un análisis de los datos durante un rango de tiempo, sí la empresa tiene la capacidad de generar reportes a través de su gestor de base de datos, la información es insuficiente y plana, es decir de un solo punto de vista para tomar una decisión. Por lo cual las organizaciones, sobre todo las que manejan un alto volumen de datos, optan por utilizar Big Data, que permite realizar un análisis más profundo de los datos recolectados.

¿Cuál es la importancia de Big Data?, principalmente generar soluciones necesarias para optimizar procesos que retrasan la producción. En algunas ocasiones, los negocios no son conscientes que tienen un problema, sobre todo las empresas que tienen una gran cantidad de procesos para lograr el producto final. “La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera eficiente. También les permite eliminar las áreas problemáticas antes de que los problemas acaben con sus beneficios o su reputación”. [1]

Imagen 1: Big Data Blog Fuente: Big Data International Campus

Podemos decir que el Big Data proporciona las siguientes ventajas:

  • Reducción de Costos: Tecnologías como Hadoop y el análisis basado en la nube, generan una gran ventaja para ahorrar costos y almacenar grandes cantidades de datos.
  • Más rápido, mejor toma de decisiones: Hadoop proporciona una velocidad combinada con la capacidad de analizar nuevas fuentes de datos.
  • Nuevos productos y servicios: Con la capacidad de medir las necesidades de los clientes a través de análisis, viene dar a los clientes lo que quieren.

Big Data ayuda a las empresas, pero también conlleva algunos desafíos, por ejemplo:

  • Los datos provienen de múltiples fuentes y puede ser de diferentes tipos, esto ocasiona que la información sea compleja y no estructurada.
  • La cantidad de datos es muy grande, por lo que debe considerarse una estrategia conveniente, que logre proporcionar las conclusiones que se desean.
  • No existe una estandarización de los datos que se almacenan, la organización Internacional de Normalización publicó algunos estándares de datos en 2011 (ISO 8000), pero para Big Data la investigación para estandarizar sus datos es muy pobre y no ha dado resultados.

Debido a todos estos inconvenientes se necesitan usar herramientas que permitan que los análisis sean lo más exactos posibles. Entre las herramientas recomendadas están:

- Hadoop: desarrollada por Google “utiliza modelos de programación simples para el almacenamiento y procesamiento distribuido de grandes conjuntos de datos” [2]. Es bastante práctica, Open Source y se puede utilizar en diferentes sistemas operativos, lo que da una amplia comodidad.

Imagen 2: Guía de las mejores prácticas y beneficios de Apache Hadoop 3.0 Fuente: XenonStack

  • MongoDB: “Es una base de datos orientada a documentos (guarda los datos en documentos, no en registros)” [2]. Esta herramienta tiene la característica que los documentos son almacenados en un formato BSON, es una base de datos NoSQL.
  • Python: “Es un lenguaje avanzado de programación con la ventaja de ser relativamente fácil de usar para usuarios que no estén familiarizados con la informática de manera profesional” [2]. La razón por la que Python aparece como una herramienta para el análisis de los datos de Big Data, es por la facilidad para trabajar con datos, además de poseer una gran comunidad que proveen de mucha documentación acerca de varias funcionalidades de Python.
  • MapReduce: Es un framework el cual permite que cierta cantidad de datos sean procesados de forma ordenada, posee la función Map que recibe como parámetro una clave y un valor, y devuelve una lista de pares ordenados aplicando esta función a cada elemento de la entrada; Reduce recibe como parámetro una clave y lista, y devuelve una lista con los valores que puedan realizar alguna fusión.

Ya tenemos la idea de lo que es Big Data, sabemos de herramientas, de ventajas y desventajas, pero ahora aún queda la pregunta ¿De dónde vienen los datos?, la respuesta a esta pregunta es simple, los datos vienen de todo aquello con lo que la organización interactúa, estos datos pueden venir de personas que a menudo son los clientes que sostienen el negocio, esta información se puede obtener a través de encuestas y/o sugerencias que vienen directamente del cliente.

Un ejemplo muy actual son los restaurantes de comida rápida las cuales por dar una opinión regalan productos, esto con el fin de almacenar sugerencias en su afán de mejorar; los datos pueden venir también entre máquinas por ejemplo de los GPS, de teléfonos móviles, parquímetros, etc. Todos estos son casos muy comunes en los que una organización interactúa con varias fuentes de datos, por lo que de toda esta información es tomada en cuenta en la toma de decisiones.

Conclusiones

  • Los datos de Big Data no están estructurados por lo que el análisis debe realizarse de una manera cuidadosa, para que no existan resultados erróneos.
  • Existen varias herramientas para trabajar con Big Data, estas herramientas estructuran los datos de tal manera que el análisis se pueda realizar de una forma ordenada.
  • El Big Data proporciona una manera más completa de análisis de datos para generar una estrategia de acción en una organización.

Referencias