Cómo mostrar sus habilidades en ciencia de datos

Comience a crear su cartera de ciencia de datos.

Los gerentes de contratación tienen su propia versión de esa pregunta: si un científico de datos no tiene una cartera, ¿realmente tiene las habilidades?

Necesitas tener un portafolio. Un portafolio es evidencia de que usted tiene las habilidades y conocimientos técnicos que dice tener. Pero, ¿qué incluye un portafolio y qué significa eso en la ciencia de datos?

Qué entra en una cartera

En última instancia, depende exactamente de usted lo que ponga en su cartera. Este proyecto al final de nuestra Ruta de habilidades de preparación para la entrevista lo ayudará a asegurarse de haber cubierto todas las categorías principales, pero los proyectos en sí dependen completamente de usted.

Le recomendamos que demuestre capacidad para:

  • Formule preguntas que puedan responderse con datos reales.
  • Limpiar y transformar un conjunto de datos real para prepararlo para el análisis.
  • Aplicar las técnicas estadísticas adecuadas para que los datos respondan la pregunta.
  • Aplicar los modelos de aprendizaje automático adecuados cuando corresponda
  • Apoye su análisis con visualizaciones
  • Resume las principales conclusiones de tu proyecto.

A lo largo de esta trayectoria profesional, encontrará proyectos Capstone y Portfolio. Estos absolutamente se pueden poner en su cartera. Sin embargo, miles de personas eligen esta carrera profesional. Para destacar realmente, querrás agregar proyectos sobre cosas que te interesen.

Si te gustan los deportes, usa datos deportivos, si te gusta la ciencia, usa datos científicos, etc. Mostrar un poco de tus intereses y lo que te da curiosidad no solo hará que el proyecto sea más divertido para ti, sino que también te permitirá mostrar tus habilidades. propio dominio conocimiento o curiosidad. El interés y el entusiasmo en sus proyectos le ayudarán a diferenciarse de otros candidatos cuando presente su solicitud y se entreviste.

Hay muchos lugares para buscar conjuntos de datos. Tenemos una lección completa sobre dónde encontrar datos más adelante en esta trayectoria profesional. Por ahora, lo mejor que puedes hacer es sentir curiosidad por el mundo que te rodea y realizar un seguimiento de algunas cosas que quizás quieras explorar a medida que creas tu portafolio.

Cómo se ve una cartera de ciencia de datos

Un portafolio de ciencia de datos puede tomar muchas formas: puede crear su propio sitio web profesional, cargar documentos en su LinkedIn u otro sitio de redes sociales, o crear un repositorio en GitHub. Recomendamos ampliamente GitHub. Es simple, liviano y, con diferencia, el lugar más popular para guardar un portafolio.

Tiene algunas opciones en términos de qué tipos de archivos desea cargar. Una regla general es que cuanto más simple, mejor. Puede cargar cuadernos Jupyter de sus proyectos, .Rmdarchivos Python de su código, archivos PDF o presentaciones de informes resumidos.

El tipo de archivos que cargue dependerá del tipo de puesto de científico de datos que esté solicitando. Un puesto que esté más centrado en la programación (es decir, una especialización en aprendizaje automático) debería tener una cartera con más programación. Un rol más centrado en el análisis y la comunicación debería tener al menos un informe resumido.

La cultura de las carteras

Hay algunas reglas tácitas sobre las carteras que debes tener en cuenta. A lo largo de Career Path, hemos tratado de ser explícitos sobre cuándo surgen estas cosas y hemos presentado las mejores prácticas en todo momento. Sin embargo, queremos señalar algunos de los posibles peligros y asegurarnos de que los evite.

Conjuntos de datos

Hay algunos conjuntos de datos que se utilizan mucho para enseñar. Específicamente, el conjunto de datos del iris y el conjunto de datos del Titanic son los más comunes. Los usamos en el Camino y probablemente los encontrarás en la naturaleza. Son tan populares que casi todos los que trabajan en ciencia de datos los han visto. Estos no son buenos proyectos de portafolio porque los empleadores pueden leerlos como proyectos de estudiantes con un alto nivel de andamiaje o simplemente como una réplica de un tutorial, y no lo diferenciarán de otros candidatos.

Formato

Es importante prestar mucha atención a la presentación. Utilizar los tipos de archivos correctos y presentar el contenido en el formato correcto es esencial para conseguir la primera entrevista.

Por ejemplo, si ha escrito algún código para analizar un conjunto de datos, debe almacenarse como un archivo .py, .ipynb, .Ro .Rmd. Le enseñamos cómo hacer esto en Career Paths, pero vale la pena mencionar nuevamente que el código casi nunca debe almacenarse en un documento de texto (por ejemplo, .txt, .docetc.) a menos que esté formateado como un fragmento de código y se use como ejemplo. o evidencia.

Otro ejemplo son las visualizaciones y paneles de Tableau (o PowerBI). Hay dos formas de almacenarlos que demuestran competencia con estas herramientas. Primero, ambas plataformas ofrecen repositorios. Tableau Public es un excelente lugar para mostrar su trabajo y ver lo que hacen otras personas. La otra forma es incrustarlos en un sitio web con un iframe.

No debe tomar capturas de pantalla, descargarlas como archivos JPEG, PDF ni transformar de otro modo los paneles interactivos y enriquecidos que ha creado en imágenes estáticas.

Puede (y debe) incorporar visualizaciones estáticas (que realiza en Python, R o incluso Excel o Tableau) en informes escritos, pero la habilidad que está demostrando es comunicarse visualmente sobre datos (no dominio de Tabeleau).

Finalmente, los informes y resúmenes pueden integrarse en sus Jupyter Notebooks, presentarse como documentos escritos (y almacenarse como PDF) o compilarse en presentaciones de diapositivas (también almacenadas como PDF).

Higiene del código

Se necesita mucho tiempo y mucha práctica para escribir código claro y bien estructurado. Sin embargo, puede dar grandes pasos en esa dirección escribiendo código bien comentado y organizado. Al igual que escribir un ensayo, escribir un buen código a menudo requiere edición. No es necesario editar todos sus proyectos. Sin embargo, si elige resaltar uno o dos (lo que puede hacer fijándolos en GitHub), querrá asegurarse de haber escrito algunos comentarios y reorganizado su código para mayor claridad posible.

Gramática

Al igual que en su currículum y carta de presentación, desea revisar los proyectos de su cartera para asegurarse de que no contengan errores gramaticales u ortográficos. A diferencia de tu currículum/carta de presentación, un par de errores tipográficos probablemente no te descalifiquen. Sin embargo, todo científico de datos necesita comunicar sobre los datos y usted desea demostrar que puede hacerlo con claridad. Incluso simplemente ejecutar cualquier informe que escriba a través de un corrector ortográfico ayudará a este respecto.

Conclusión

En última instancia, su portafolio es la forma en que verifica que tiene todas las habilidades que tanto ha trabajado para adquirir. Diviértete incluyendo algunos proyectos que te entusiasmen y asegúrate de estar listo para hablar sobre esos proyectos con los reclutadores cuando tengas la primera entrevista.


Arriba

Copyright © 2024 Fernando Rioseco.