7 ¿Muchos datos por procesar? Permite que la ciencia de datos lo haga por ti. {#2.2 }



PALABRAS CLAVE Volumen de datos, importancia de la información, reportes estadísticos, procesamiento, deep learning, predicciones, toma de decisiones, big data.

7.1 Introducción

Data science o ciencia de datos, como se le quiera llamar, es un término que se ha popularizado con el pasar de los años, establecido actualmente en la sociedad y que está para quedarse por mucho tiempo. Es común escuchar el término de data science y del software que se ha desarrollado e incluso se sigue desarrollando en entornos empresariales, notando que gracias a su expansión permitió su introducción a entornos de uso personal. Pero ¿se conoce realmente su significado? Empíricamente se puede decir que es el análisis de grandes cantidades de datos y su respectiva transformación en reportes que pueden ser comprendidos por cualquier persona. Si bien esta definición no es incorrecta, tiene vacíos que es bueno abordar.

7.2 Artículo

Grosso modo, podemos decir que la ciencia de datos es “pulir un diamante en bruto”, porque la información ya existe, y está al alcance de nuestras manos, pero le falta ser pulida para que sea valiosa, para que nos sea útil en la toma de decisiones. La información sin procesar puede no tener sentido, puede no decirnos nada de lo que está pasando con nuestros datos. De esto es de lo que se encarga la ciencia de datos, se encarga de procesar la información y transformarla a un lenguaje entendible. Todo esto, mediante una serie de pasos, que se pueden estandarizar en los siguientes:

I. Entendimiento del negocio. II. Entendimiento de los datos. III. Preparación de la información IV. Modelado de datos V. Evaluación VI. Muestra de resultados

Todos estos procesos se pueden llevar a cabo mediante el uso de software. Software que se ha desarrollado con la finalidad de procesar información mediante la ciencia de datos. Existe una gran variedad de software que han sido desarrollados con ese propósito, desde entornos meramente empresariales como es el caso de Azure Synapse o Power BI, hasta programas que pueden ser de uso más personal como Excel y SQL Server. El incremento en el uso de la ciencia de datos trajo consigo el aumento de la demanda en el mercado de desarrollo de software capaz de construir modelos y con nuevas herramientas que faciliten el trabajo.

Las empresas son un ejemplo claro de las ventajas de utilizar la ciencia de datos. Uno de los casos de éxito de grandes empresas es el caso de Amazon. Amazon sin duda es el gigante de las ventas online. Utilizó diversas herramientas de ciencia de datos para analizar el comportamiento de sus clientes, analizando un gran volumen de datos. Utilizó métodos de aprendizaje automático para analizar las compras de sus usuarios; con esa información fue posible crear lo que se conoce como el análisis predictivo de compras, el cual analiza el comportamiento de los usuarios; como los artículos que han comprado, la fecha en la que los han comprado, qué artículos agregó al carro de compras y cuáles quitó. Con esto Amazon puede presentar sugerencias variadas, dependiendo del usuario, esto mejora considerablemente la experiencia del usuario dentro de la tienda, ya que es personalizada a cada cliente. Este análisis hizo que Amazon incrementara sus ventas año con año, especialmente en días como el Black Friday y el Cyber Monday consiguiendo batir récords de ventas en esos días.

Comparativa de las características de cuatro herramientas de ciencia de datos

Figura 7.1: Comparativa de las características de cuatro herramientas de ciencia de datos

Gráfica 1

Ventas anuales de Amazon desde 2015 hasta 2022, en miles de millones de dólares

Figura 7.2: Ventas anuales de Amazon desde 2015 hasta 2022, en miles de millones de dólares

7.3 Conclusiones

Es notorio que la ciencia de datos y el uso de software especializado mejora el rendimiento de las empresas al poder anticiparse a ciertos movimientos. Quizá ahora nos sea imposible imaginarnos una vida sin la ciencia de datos; el futuro de la ciencia de datos tiene un panorama prometedor, con muchas más opciones de software que se desarrollan día con día, pero ¿qué pasaría si esto no fuera así? ¿Seríamos como humanos, capaces de procesar un gran volumen de información sin necesidad de ayuda de un sistema automatizado? Posiblemente tendríamos que emplear el recurso humano en gran medida para poder realizar lo que el software hace de forma automática. Con esto en mente, es mejor aprovechar las bondades del software especializado en ciencia de datos y apoyar el desarrollo de este.

7.4 Referencias