Data Scientist
MADRID, ES
¿Estas interesado/a en crecer como profesional, participando activamente en las decisiones del proyecto y hacerlo de la mano de un equipo experimentado y en un entorno de trabajo cercano y colaborativo? ¡Esta es tu oportunidad!
Si quieres trabajar para conseguir un mundo más sostenible y responsable con su entorno, en CAF Digital Services creemos y trabajamos en la movilidad sostenible, uno de los principales retos a los que se enfrenta la sociedad actual. En CAF Digital Services mejoramos la disponibilidad de los trenes y el bienestar de los pasajeros a través de la analítica de datos y la digitalización. Trabajamos con las tecnologías de mantenimiento y operación más innovadoras para maximizar la calidad de servicio de los trenes.
¿Qué te ofrecemos?
Ambiente de Trabajo Positivo: Podrás ser parte de un gran equipo altamente cualificado en el que estarás rodeado/a de personas con un gran espíritu colaborativo en el que te encontrarás un ambiente cercano y muy agradable.
Conciliación: Nuestro modelo híbrido te permitirá conciliar a la perfección la vida familiar y la vida laboral.
Aprendizaje y Autonomía: Te animaremos a que trabajes de manera autónoma, con el apoyo de nuestra formación, con un producto altamente tecnológico y en un mercado internacional.
Seguridad y estabilidad: CAF lleva más de 100 años trabajando en un camino que se extiende hacia el futuro, brindándote la seguridad que necesitas.
¿Qué te hará triunfar en esta posición?
- Poseer estudios de Ingeniería superior de informática
- Dominio sólido de Machine Learning y Deep Learning: Conocimiento profundo de algoritmos supervisados y no supervisados, redes neuronales (CNN, RNN, Transformers), modelos de clasificación, regresión, clustering y arquitecturas modernas de IA.
- Experiencia práctica construyendo modelos de IA end-to-end: Desde la exploración y preparación de datos, feature engineering y entrenamiento, hasta validación, optimización, despliegue y monitorización en producción.
- Experiencia práctica con plataformas cloud y entornos de desarrollo colaborativos tales como Databricks, AWS (S3, EMR, Lambda, SageMaker u otros servicios relacionados con datos y ML).
- Competencia técnica avanzada en Python y PySpark: Capacidad para trabajar con grandes volúmenes de datos, construir pipelines distribuidos y transformar datasets complejos en entornos de Big Data.
- Capacidades teconológicas aplicada a la IA: Uso avanzado de Python y su ecosistema científico (NumPy, pandas, scikit-learn, PyTorch o TensorFlow), con código modular y orientado a objetos preparado para escalabilidad y mantenimiento.
- Rigor científico en el desarrollo de modelos: Habilidad para comparar arquitecturas, realizar experimentos controlados, ajustar hiperparámetros, evaluar métricas relevantes y documentar de forma estructurada cada iteración del modelo.
- Comprensión profunda del ciclo de vida del dato: Experiencia trabajando con pipelines de datos, integración con APIs, limpieza, transformación y manejo de grandes volúmenes de información.
- Mentalidad orientada al impacto: Más allá de la precisión del modelo, serás capaz de traducir necesidades reales en soluciones inteligentes, robustas y aplicables a los procesos y productos de la organización.
¿Cuál va a ser tu misión en la empresa?
Tu misión será diseñar, desarrollar y desplegar soluciones de Inteligencia Artificial y Analítica que impulsen el valor del negocio, permitiendo automatizar procesos, anticipar comportamientos, detectar patrones y generar insights accionables.
Serás la referencia técnica dentro del equipo, contribuyendo a la evolución del ecosistema LeadMind mediante la integración de modelos de aprendizaje automático y profundo en herramientas, productos y procesos.
Trabajarás junto a equipos técnicos, de datos, producto y negocio para transformar información en decisiones y funcionalidades inteligentes, impulsando una cultura data-driven y de innovación continua.
Responsabilidades de la posición:
- Diseñar y entrenar modelos de Machine Learning y Deep Learning, seleccionando arquitecturas, técnicas de regularización, optimizadores y estrategias de entrenamiento.
- Construir pipelines de datos y de entrenamiento, integrando fuentes diversas, asegurando calidad del dato y aplicando buenas prácticas de ingeniería.
- Desarrollar código limpio, modular y escalable en Python y Pyspark, aplicando principios de ingeniería de software (tests, control de versiones, buenas prácticas de diseño) y programación orientada a objetos para explotar el dato.
- Evaluar y validar modelos mediante experimentación, análisis estadístico, visualización de resultados, comparación de métricas y pruebas controladas.
- Integrar soluciones gráficas o analíticas que permitan al operador explotar el dato tratado.
- Colaborar con equipos multidisciplinares para transformar problemas reales en soluciones basadas en IA, analizando impacto, riesgos y viabilidad técnica.
- Monitorizar y mejorar modelos existentes, realizando retraining, análisis de drift y ajustes continuos para asegurar robustez y rendimiento.
- Documentar decisiones, experimentos, configuraciones y resultados, garantizando reproducibilidad y transferencia de conocimiento.
- Mantenerse actualizado/a en tendencias de IA, nuevas arquitecturas, bibliotecas, técnicas de optimización de modelos y mejores prácticas en datos.
Por tanto, si te interesa trabajar en una empresa digital para conseguir un mundo más sostenible y responsable con su entorno, comprometida con la igualdad de oportunidades y que cuenta con un de Igualdad no lo dudes e inscríbete en la oferta ahora.