10 preguntas para entrevistar a un data scientist

El Científico de Datos o Data Scientist es un perfil TI que analiza grandes volúmenes de información (Big Data) para extraer conocimiento que ayude a las empresas a tomar mejores decisiones de negocio.

El Data Scientist tiene conocimientos matemáticos y estadísticos. Domina el software estadístico, la programación y los sistemas de análisis de datos masivos como el machine learning. También tienen amplio conocimiento en tecnologías de bases de datos.

Pero, ¿cómo podemos identificar a un buen data scientist?, ¿qué preguntas le realizamos en la entrevista?, ¿qué respuestas debemos de buscar?. Las siguientes preguntas te ayudarán a identificar la capacidad y la destreza de los postulantes a tus vacantes de data scientist.

1. Para ti, ¿qué es Data Science?

El objetivo de esta pregunta es que conozcas la filosofía de trabajo del candidato. Aquí lo que tienes que revisar es que el candidato explique de manera clara para él que es data science. Un buen candidato siempre hablará con pasión cuando le preguntan sobre su trabajo.

Lo más básico que debería de responder el candidato es que data science o ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para generar conocimiento a través de datos.

2. En un día normal, ¿cuáles son las tareas que harías como data scientist?

Esta pregunta es para qué tú conozcas  el perfil del data scientist. No hay mejor forma de conocer un perfil que tú preguntando directamente al candidato cuál es su rol dentro de una empresa.

Algunas de las tareas que podría mencionar el candidato son:

  • Extraer datos
  • Fusionar datos
  • Analizar datos
  • Buscar patrones o tendencias
  • Desarrollar y probar nuevos algoritmos
  • Simplificar los problemas de datos
  • Desarrollar modelos predictivos
  • Construir visualizaciones de datos
  • Escribir resultados para compartir con otros

3. ¿Qué tecnologías usas normalmente para hacer data science?

Los data scientist trabajan todos los días con lenguajes de programación, bases de datos, herramientas de visualización, entre otras tecnologías. Esta pregunta te ayudará a saber si el candidato maneja el stack de herramientas que requiere tu vacante o si es que necesita capacitarse en alguna tecnología en particular en caso de que tome el puesto.

Algunas de las tecnologías que podría mencionar el candidato son…

Bases de datos: MySQL, PostgreSQL, MongoDB o DynamoDB.
Big Data: Hadoop, Hive, Pig, Flume, Mahout o Sqoop.
Lenguajes de programación: Python o R.
Inteligencia Artificial/Machine Learning: Tensor Flow, Sklearn o IBM Watson.
ETL: Embulk, Python, Airflow or Azure Data Factory.
Herramientas de visualización: Tableu, Power BI, Redash, Matplotlib o TensorBoard.

4. ¿Qué es un modelo predictivo?

Esta es una pregunta técnica que te va ayudar a descubrir si el candidato es alguien que domina la parte de estadística. También te ayudará a saber cómo el candidato explica términos complejos a alguien que no conoce sobre el tema.

5. Cuéntame sobre algún algoritmo que hayas desarrollado, ¿Cuál fue la metodología que usaste para desarrollarlo y cuál era su propósito?

El objetivo de esta pregunta es indagar en el conocimiento matemático que tiene el candidato, los skills y herramientas que tiene a su disposición. Un buen data scientist no debería de tener problema para explicar cómo manejó los datos, qué herramientas usó para construir el algoritmo y cómo logró descubrirlo.

La respuesta debería incluir cuáles herramientas utilizaron, ya sea diseño de base de datos, SQL, diseño de tablas e indexación. Una excelente respuesta debería de incluir cómo este algoritmo beneficio a la empresa a nivel negocio.

6. Háblame sobre un proyecto en el que te hayas enfrentado a un gran problema ¿cómo lo manejaste?

Cuando trabajas con miles de datos, tarde o temprano vas a encontrar algún problema. Debes de buscar candidatos que conozcan cómo manejar problemas y errores relacionados con datos. El punto de esta pregunta es descubrir cómo el candidato resuelve los errores y cómo se comunica con sus líderes.

La respuesta del candidato debe revelar su habilidad para resolver problemas. Busca pistas que te indiquen que el candidato aprendió de esta experiencia y que sabe qué precauciones debe de tomar para que el mismo problema no vuelva a suceder.

7. ¿Cuál es la mayor base de datos que has manejado, cómo la procesaste y cuáles fueron los resultados?

El objetivo de esta pregunta es conocer cuál es el proyecto de mayor escala que ha manejado el candidato, cuál es su metodología de trabajo y si los resultados que obtuvo fueron interesantes.

El candidato debería de responder de forma clara cuáles fueron los pasos que siguió para procesar la información y como los resultados que obtuvo impactaron al negocio.

8. ¿Cuál es tu metodología para limpiar datos?

Un buen data scientist se esfuerza por asegurarse de que los datos con los que está trabajando sean de alta calidad. Los datos «sucios» o desorganizados pueden empañar el valor del análisis y generar información engañosa, por lo que es esencial saber que tu candidato tiene experiencia en la limpieza y organización de datos, sin importar cuán grande sea el conjunto de datos.

En esta pregunta el candidato podría mencionar una gran variedad de técnicas de limpieza de datos como métodos de detección y corrección de errores y herramientas de limpieza automatizadas como Paxata. Una buena respuesta incluiría el porqué utilizó esas técnicas en específico

9. Dame un ejemplo de alguna vez que le hayas aportado valor a un cliente o stakeholder a través de datos.

El objetivo de hacer data science en una empresa es mejorar la toma de decisiones o el desempeño de la empresa a través de datos. Ya sea para mejorar la experiencia del cliente o bien ayudar a mejorar un proceso de la empresa. El candidato debe ser capaz de decir cómo su trabajo impacta positivamente a la empresa. Si no lo puede hacer, es porque probablemente no ve el panorama general.

En esta pregunta debes de buscar cómo el candidato alinea la ciencia de datos con los objetivos de negocio. Escucha si el candidato busca cómo agregar valor a la empresa a través de su trabajo.

10. ¿Has aportado en algún proyecto open source?

Esta pregunta busca una mentalidad de aprendizaje continuo. Pero también te dice si un candidato es curioso y qué tan bien trabaja en equipo. Los buenos data scientists son personas colaborativas, que comparten nuevas ideas, conocimientos e información entre sí para mantenerse al día con la ciencia de datos que cambia rápidamente.

El candidato debe de decir específicamente en qué proyectos han trabajado y cuál es el objetivo de estos. Una buena respuesta también incluiría qué es lo que han aprendido al participar en proyectos open source.

Ahí lo tienes, 10 preguntas para entrevistar a un data scientist. En Empleos TI siempre recomendamos a los reclutadores realizar un par de preguntas técnicas al candidato. No con el objetivo de evaluar el conocimiento técnico del candidato, eso lo tiene que hacer el equipo de TI.

No importa si estás entrevistando a un data scientist, o a un programador o a un tester, lanza preguntas sobre términos técnicos que no comprendes del todo. Esto te ayudará a tener un lenguaje técnico más desarrollado, entender mejor los perfiles y realizar un mejor reclutamiento.

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *