Analista de Datos

Glen Abra-ham Calel Robledo

Estudiante de Ingeniería en Ciencias y Sistemas - USAC

Palabras Clave:
Dato, información, analista, R, Datacamp.

¿Cuál es la diferencia entre dato e información?

Como es de costumbre, en algún momento de la carrera nos han preguntado si existe la diferencia entre dato e información, probablemente al inicio de la carrera no hemos determinado la diferencia entre estos dos conceptos tan distintos e importantes. Dato se define como “Cifra, letra o palabra que se suministra a la computadora como entrada y la máquina almacena en un determinado formato” [1] en otras palabras un dato es un conjunto de caracteres almacenados. Información se define como “el conjunto de datos organizados y procesados que constituyen mensajes, instrucciones, operaciones, funciones y cualquier tipo de actividad que tenga lugar en relación con un ordenador” [2] en otras palabras es un conjunto de datos que tienen un sentido o un significado.

Luego de esta breve introducción como cultura general “en 1963, se introdujo el término base de datos en un simposio llamado Development and Management of a Computer-Centered Data Base”[3] si analizamos las definiciones previas, ¿Por qué se llaman bases de datos y no bases de información? Si el lector tiene la oportunidad de leer el libro Modelos de Bases de Datos del ingeniero Luis Espino, en el capítulo 2 encontraran la respuesta.

¿Qué significa analista de datos? Al entender la diferencia entre un dato e información se puede abarcar el tema principal, el cual consiste en definir qué significa un analista de datos. El término fue creado por William Cleveland, él definió un analista de datos como una persona que tiene un título de ingeniería de software o ingeniería en sistemas, que tiene como objetivo principal programar software para el análisis de datos. Puede sonar algo redundante el nombre con relación a su término, pero si le damos mayor profundidad al término hoy en día se le conoce como el profesional que “se encarga de recolectar, procesar y ejecutar análisis estadísticos de datos” [4]. Cabe destacar otra definición que identifica a un analista de datos el encargado de participar en la recopilación de datos, que además estructuran bases de datos, creando y ejecutando modelos para realizar el análisis y determinar patrones en los datos que hayan obtenido, con el fin de presentar resultados para la toma de decisiones.

Esta profesión nace debido a la cantidad enorme de datos que se procesan diariamente en cualquier tipo de ámbito, podemos hacer mención de los siguientes casos: la cantidad de nacimientos o decesos que se dan en un determinado tiempo, o la cantidad de carros que ingresan a un parqueo en ciertas temporadas, o la cantidad de transacciones que realiza una empresa en un determinado tiempo. En general podemos observar que en situaciones básicas donde no interviene la tecnología o en áreas donde es de vital importancia la tecnología, podemos recopilar enormes cantidades de datos, almacenarlos en grandes volúmenes y además podemos agregar condiciones a cada situación donde se puede obtener múltiples resultados, es ahí donde el analista de datos aplica los términos de extracción, limpieza, análisis y visualización, utilizando una de las ramas esenciales de la ciencia, como lo es la estadística, donde este puede realizar predicciones basándose en el historial de todos los datos procesados o puede identificar patrones en un determinado conjunto de datos. Un analista de datos “es un perfil profesional que gracias a la interpretación de los datos puede establecer estrategias dentro de una empresa” [5].

Un analista de datos debe determinar cómo se deben usar los datos con el fin de responder preguntas y resolver problemas, recordemos que los analistas de datos trabajan con volúmenes grandes de datos almacenados que no tienen ninguna interpretación o sentido hasta que él ejecuta una serie de acciones hasta tener un resultado. Un analista de datos aplica y ejerce su profesión en una amplia y extensa variedad de áreas. Previamente definido este término, podemos destacar ciertas funciones y características que un analista de datos debe aplicar, como:

  • Debe poseer y aplicar conocimientos en bases de datos y lenguajes de programación.

  • Debe poseer técnicas en diseño de bases de datos.

  • Debe manejar y aplicar conocimientos sobre Hadoop & MapReduce.

  • Debe aplicar técnicas para visualizar datos (Reportes).

  • Se encarga de realizar el proceso de extracción, procesamiento y agrupación de datos.

  • Identifica patrones o tendencias en un conjunto de datos.

  • Analiza los patrones o agrupaciones de datos utilizando herramientas y técnicas estadísticas.

  • Puede generar resultados utilizando distintas técnicas (utilizando estadística).

  • Generan resultados utilizando un formato de tipo informe.

  • Es esencial al momento de la toma de decisiones o para establecer estrategias.

  • Identifican nuevas soluciones para la mejora de procesos.

  • Pueden diseñar, crear y dar mantenimiento a los sistemas de bases datos.

¿Qué herramientas usa un analista de datos? Un analista de datos emplea y aplica cálculos utilizando sistemas informáticos, debido a la extensa variedad de áreas en la que un analista de datos puede ejercer su profesión, se podría recomendar en general el uso de las siguientes herramientas, conceptos y lenguajes de programación, como:

  • Software: IBM SPSS, Statistical Analysis System (SAS), Herramientas de Business Intelligence(SSDT, SAP BI, Oracle BI, Tableau, etc.), Bases de Datos SQL, Hadoop, Apache Spar.

  • Lenguajes de programación: Python, R, C/C++, Java, Javascript.

¿Dónde puedo especializarme? A este punto de la lectura es necesario entender que se debe tener una carrera universitaria enfocada a la informática, como una licenciatura en informática, ingeniería de software, ingeniería en sistemas e inclusive una licenciatura en estadística. Si deseas obtener una certificación en análisis de datos puede ingresar en las siguientes plataformas: Datacamp, IEBSchool, Coursera, Ubiqum, Acamica, Florida Business School, Digitalhouse, UniSA Online, Western Sydney University, UNSW Sydney.

Si el lector desea explorar sobre el análisis de datos, la plataforma DataCamp ofrece una lista amplia de cursos gratuitos, así como también cursos de categoría Premium, estos se pueden acceder por un costo cómodo en comparación a las demás plataformas.

Imagen 1: Data Analyst with R.

Conclusiones

  • Un dato es un conjunto de caracteres almacenados, mientras que información es un conjunto de datos que tienen un sentido o un significado.

  • Un analista de datos es la persona encargada de extraer, analizar, procesar y visualizar un conjunto de datos aplicando métodos y técnicas estadísticas.

  • Un analista de datos es fundamental en la toma de decisiones o en la gestión de sugerencias dentro de una organización o empresa.

  • Un analista de datos debe manejar los conceptos de business intelligence, bases de datos, Hadoop, lenguajes de programación como R, Python, Javascript, C/C++ entre otros.

  • DataCamp es una plataforma que brinda de un catálogo extenso de cursos (algunos gratuitos) con el fin de formar especialistas en el área de la ciencia de los datos.

Referencias