¿Cómo convertirse en un científico de datos?

Herber Alexander Vásquez Hernández

Estudiante de Ingeniería en Ciencias y Sistemas - USAC

Palabras Clave:
Ciencia de los datos, científico de datos, insights

La ciencia de los datos es un campo que une conocimientos de matemática, estadística, programación de computadoras y dominios de negocio. Tiene como objetivos la identificación, representación y extracción de información significativa de fuentes de datos. Un científico de datos es una persona que se desempeña en el campo de la ciencia de los datos. Este campo en crecimiento tiene el potencial de ayudar al crecimiento de organizaciones como el gobierno, el sector de salud y muchas otras más, mediante valiosos hallazgos en los datos que pueden ser utilizados para la toma decisiones. Además, el trabajo de un científico de datos se espera que sea uno de los trabajos mejores pagados del siglo XXI debido al incremento de la demanda por parte de las organizaciones y la poca oferta de profesionales con las habilidades necesarias para desempeñar este trabajo. Debido a estas necesidades y atractivos el siguiente artículo tiene el objetivo de presentar una guía de las cualidades necesarias que las personas necesitan tener o desarrollar para convertirse en un científico de datos.

La ciencia de los datos es un campo multidisciplinar que une básicamente tres grandes áreas de conocimiento:

programación de computadoras, (matemática, estadística) y dominios específicos de negocio. Tiene el potencial de ayudar al crecimiento y desarrollo de las organizaciones por medio de la manipulación de los datos de dichas organizaciones para obtener conocimiento que puede ser utilizado para la toma de decisiones.

En una frase atractiva la ciencia de los datos tiene como fin desbloquear o liberar el poder o potencial que tienen los datos de las organizaciones para la toma de decisiones.

La ciencia de los datos en nuestra época tiene dos características principales: cualidades raras y alta demanda. ¿A que nos referimos con cualidades raras? “Es la habilidad de tomar datos no estructurados y encontrar orden, significado y valor”, Data Hawk Technologies. En cuanto a la característica de alta demanda se refiere a que provee conocimientos de valor con los cuales se puede lograr una ventaja competitiva en los distintos dominios o áreas de negocio.

Ya hablamos acerca de la ciencia los datos, ahora, te estarás preguntando, ¿A qué personas denominamos científicos de datos? pues simplemente a las personas que desempeñan las tareas relacionadas con la ciencia de los datos, las cuales mencionamos brevemente al inicio del artículo, pero que veremos más adelante con más detalle.

¿Qué cualidades necesito para desempeñarme como científico de datos?

Hay algunas preguntas que debes hacerte antes de comenzar la travesía para convertirte en científico de datos:

  • ¿Te entusiasma la manipulación de lenguajes de programación de computadoras y los distintos medios de almacenamiento de datos (Bases de datos, archivos de texto, etc.)?

  • Te sientes atraído o te entusiasma el conocimiento en el área de matemática y estadística?

  • ¿Estás dispuesto o te apasiona conocer nuevos campos en la industria, comercio u otras organizaciones?

Luego de contestar las preguntas anteriores, si las respuestas a todas las preguntas fueron positivas, es un buen indicador para que consideres expandir tu conocimiento en el campo de la ciencia de los datos o ¿por qué no? Sumergirte en este mundo y dar un giro a tu carrera.

Áreas involucradas en la ciencia de los datos

Como se mencionó anteriormente un científico de datos tiene que tener conocimientos de 3 áreas específicas que se pueden segmentar de la siguiente manera:

  • Programación de computadoras o comúnmente llamado en inglés Hacking Skills. Principalmente necesitadas para recolectar y preparar los datos para su posterior análisis. También se requiere la habilidad de trabajar con formatos de datos poco usuales, que usualmente no encajan en las filas y columnas de hojas de cálculo, ni bases de datos, un ejemplo de esto pueden ser imágenes, videos, etc

  • Matemática y Estadística: En esta área no es necesario ser un experto en la materia para lograr resultados satisfactorios, pero si es necesario poder identificar los procedimientos y métodos matemáticos y estadísticos adecuados para las distintas situaciones que se presenten con respecto al análisis de los datos. También puede ser requerido en algunas situaciones para desarrollar y mejorar dichos procedimientos y métodos.

  • Dominios de negocio: Se refiere a que debemos tener claro los objetivos, restricciones y lo que es considerado de valor en el campo en que se esté desempeñan do la tarea de la ciencia de los datos, estas áreas pueden ser: Salud, Educación, Gobierno, etc.

Proyecciones en el campo laboral

La organización “McKinsey Global lnstitute” realizó un estudio que proyecta un aumento en la demanda de personas con alto conocimiento analítico para el presente año 2018, área dentro de la cual encajan los científicos de datos.

Imagen 3: Recomendación de contenido. Fuente: https://www.analyticsvidhya.com/blog/2015/09/application s-data-science/

Proyecciones específicas para Estados Unidos en el año 2018 estiman la apertura de 140,000 a 190,000 plazas de trabajo que requieren de personas con un profundo talento analítico. Se estima un salario promedio de $144,000 USD anuales, con lo cual el rol del científico de datos posicionaría como el tercer trabajo mejor pagado en Estados Unidos.

Aplicaciones de la ciencia de los datos en el mundo real

Podemos mencionar algunos ejemplos como los sistemas de recomendación, los cuales nos proporcionan recomendaciones de contenido en base a nuestras preferencias. Dentro de estos sistemas, podemos mencionar los servicios de música y video en línea los cuales nos sugieren contenido que muchas veces nos parece atractivo debido a que los sistemas aprenden acerca de lo que hemos visto y escuchado anteriormente. Estos sistemas de recomendación también son ampliamente utilizados en los sistemas de comercio en línea para ofrecernos productos y servicios en base a nuestras compras y búsquedas anteriores en internet. Otro de sus usos más comunes son los sistemas de detección de fraude, los cuales crean perfiles de clientes, los cuales, pueden ser identificados en base a cálculo de probabilidades si son clientes fraudulentos o confiables. Además de los ejemplos mencionados anteriormente, la ciencia de los datos tiene un sin número de aplicaciones en los campos de la medicina, videojuegos, logística, reconocimiento de voz, etc.

Conclusiones

  • La ciencia de los datos ayuda a obtener datos valiosos para la toma de decisiones en las organizaciones.

  • Para iniciar una carrera como científico de datos se requieren conocimientos en las áreas de matemática, estadística, programación de computadoras y áreas de negocio.

  • Un científico de datos trabaja en un equipo multidisciplinario con el cual reforzará sus áreas de conocimiento débiles y viceversa.

Referencias