miércoles, 31 de enero de 2018

Cómo debe crecer un Data Scientist

Para que un científico de datos crezca, deben ser desafiados más allá de los aspectos técnicos de sus trabajos. Necesitan cuestionar sus fuentes de datos, ser concisos en sus ideas, conocer su negocio y ayudar a guiar a sus líderes.

El papel de un científico de datos aún varía de una compañía a otra e incluso de un equipo a otro. Esto hace que sea mucho más difícil para las empresas crear un plan de crecimiento estandarizado para sus científicos de datos.

Sin un plan de crecimiento claro, existe el riesgo de que estos talentosos asistentes informáticos se queden estancados. Podrían proporcionar buenas perspectivas, pero nunca crecerán realmente ni proporcionarán el verdadero ROI que tienen para ofrecer a un negocio o, lo que es más importante, a ellos mismos.



Con esta idea, conversamos con los gerentes de Seattle que trabajaban en las principales compañías tecnológicas para averiguar qué querían y esperaban de sus principales científicos de datos. Queríamos compartir la información que aprendimos tanto para ayudar a los científicos de datos a crecer, como para ayudar a los gerentes que intentan desafiar a sus nuevos científicos de datos a seguir creciendo.

Asi descubrimos que no se trataba de programación o diseño de algoritmos (que era una referencia para un científico de datos Jr.). Cuando les preguntamos a estos gerentes qué querían ver de sus científicos de datos más antiguos, nos informaron que querían personas motivadas que pudieran comunicarse de manera concisa, que pudieran pensar por sí mismas y que tuvieran una sólida comprensión del negocio.

"Los científicos de datos tienen la oportunidad de influir en las decisiones de la compañía".

Para que un científico de datos crezca, deben ser desafiados más allá de los aspectos técnicos de sus trabajos. Los científicos de datos tienen la oportunidad de influir en las decisiones de la compañía. Ellos tienen mucha responsabilidad sobre sus hombros. Eso significa que necesitan hacerse cargo del trabajo que hacen. Necesitan cuestionar sus fuentes de datos, ser concisos en sus ideas, conocer su negocio y ayudar a guiar a sus líderes.

No cuestione sus hallazgos, pregunte sus datos

Un experto en datos científicos no solo confiará en sus datos después de recibirlos, también lo pincharán y lo presionarán con prejuicios, datos faltantes, datos duplicados, etc.

Los datos tienen caprichos. Para aquellos que pasan horas y horas en datos, sabes lo que estoy diciendo. Mientras se desplaza o grafica datos, se ven esos patrones extraños que lo hacen detenerse y decir "Me pregunto por qué x parece z". Los científicos de datos más jóvenes a menudo estarán demasiado enfocados en terminar el proyecto. No han aprendido cómo detenerse y realmente analizar estos patrones extraños. Estos patrones pueden ser causados ​​por sistemas que predeterminan salidas de datos específicos, como -1 o 1 o incluso datos parciales causados ​​por la compra de bots que pueden sesgar lo que los clientes realmente están comprando en un sitio de comercio electrónico y otras mil causas plausibles de información engañosa.

Estos patrones no son necesariamente datos incorrectos o malos. Incluso cuando los datos son precisos, siempre habrá caprichos operacionales. Un científico de datos con experiencia no solo buscará estos caprichos de datos, sino que los esperará.

El término fuente de la verdad se usa mucho en los equipos de datos. Se refiere a la fuente de datos original que varios equipos han decidido que es correcta. Fui muy ingenuo cuando comencé como científico de datos. En uno de mis primeros proyectos, me informaron sobre una fuente de datos que nuestro equipo había etiquetado como fuente de verdad. Durante meses trabajé en nuestra "Fuente de la Verdad" desarrollando análisis y aplicaciones para ayudar a más de 200 gerentes y directores a tener acceso a esa información. Por supuesto, no pasó mucho tiempo hasta que hubo problemas de coherencia con otras métricas. Fue entonces cuando me di cuenta de que había estado trabajando en una fuente de datos de varios ETL de la fuente de la verdad.

Hablando con los gerentes de tecnología en Seattle. Este es un problema común. Los jóvenes analistas, científicos de datos y desarrolladores confían demasiado en sus fuentes de datos. Por lo general, los empleados más jóvenes y menos experimentados estarán muy ansiosos de realizar el trabajo. Esto inadvertidamente conducirá a una menor comprensión de lo que realmente son los datos. En lugar de preguntar por qué, pasan más tiempo asegurando las "funciones" del producto. Por lo tanto, se pierden al notar las peculiaridades de los datos.

Para crecer como científico de datos, debe evitar simplemente asegurarse de que un producto o algoritmo "cumpla con los requisitos" y se haga dueño. Debe asumir la responsabilidad de comprender los datos y sus peculiaridades. De esa forma, puede comunicarle por completo a su gerente o director, todas y cada una de las suposiciones que hizo. Un científico de datos no puede crecer verdaderamente si culpa a los malos resultados de los datos.

Se capaz de indicar de manera concisa el valor de sus hallazgos

Para crecer como científico de datos, tienes que expandirte más allá de ser un programador/estadístico. Debes aprender cómo ser un comunicador y debes obtener la capacidad de expresar de forma concisa el valor de tus hallazgos y también indicar qué debe hacer tu director con la información.

Puede ser tentador proporcionar a los directores y gerentes todos los gráficos, todos los datos y toda la información técnica que se recopiló durante nuestra investigación para demostrar que en realidad estábamos trabajando. Especialmente en la ciencia de los datos, donde a veces se necesitan algunos meses para avanzar valiosamente en un solo problema (por una buena razón). Sin embargo, al final de todo, los directores no quieren un exceso de información.

Conozca su negocio

Cada vez que un científico de datos comienza un nuevo trabajo, es comprensible que no entienda todo sobre el nuevo día hábil. Hay mucho que aprender además de las fuentes de datos, bases de código y otros sistemas específicos de la compañía. Deben aprender sobre el funcionamiento diario de los datos con los que trabajarán. También necesitan comprender los problemas que enfrenta la empresa. Sin embargo, un experto en datos científicos debería ser capaz de obtener rápidamente una comprensión de un negocio.

Aprenda cómo trabajar con diferentes equipos, participe en proyectos y permítase ser un mentor diligente. Los científicos de datos pueden participar en proyectos tras proyectos en diferentes tipos de temas y deben poder adaptarse rápidamente, incluso los más experimentados necesitan enfocarse más en el porqué de sus proyectos. Si un gerente no desafía a sus miembros más experimentados del equipo de ciencia de datos para crecer y aprender el negocio, entonces es algo de lo que es culpable por la falta de crecimiento. Cada año o cada pocos meses, los gerentes deben ayudar a desafiar a los científicos de datos más experimentados para asegurarse de que realmente están creciendo. De lo contrario, una empresa está perdiendo el ROI máximo.

Alta administración

Administrar requiere que los científicos de datos (o cualquier otra persona en cualquier empresa para el caso) tomen el tiempo necesario para comprender las necesidades de los gerentes. No solo lo que la compañía necesita. ¿Qué quiere el jefe de usted y de sí mismo? Una vez que entiendes eso, entiendes lo que los impulsa. Eso permitirá que un científico de datos anticipe las necesidades de sus jefes antes de que se lo pidan. Esto ayudará a desarrollar la confianza, así como una mayor inversión de sus gerentes y directores. Este mundo no es todo acerca de tu crecimiento ¡Los administradores también quieren crecer! Como experimentado, usted sabe que ayudar a otros a crecer y alcanzar sus metas significa que usted también gana.

Resumen

Se espera que los científicos de datos hagan más que simplemente crear algoritmos y administrar grandes conjuntos de datos. El valor de los científicos de datos experimentados proviene no solo de sus habilidades técnicas, sino también de sus habilidades blandas. La información y los algoritmos que los científicos de datos crean impulsarán las decisiones de la alta gerencia. Por lo tanto, cualquier cosa que proporcionen debe ser comprensible para los directores y vicepresidentes que administran millones de dólares en personas, recursos, equipos, proyectos ... y todo lo demás en una empresa. Esto significa que para que un científico de datos crezca en valor a un negocio, debe aprender lo que el negocio encontrará valioso.



Fuente: Benjamin Rogojan. Experto en datos, marketing e IT.