Enviar candidatura ahora »

Data Scientist

Fecha:  2 dic 2025
Empresa:  CAF Rail Digital Services
Ubicación: 

MADRID, ES

¿Estas interesado/a en crecer como profesional, participando activamente en las decisiones del proyecto y hacerlo de la mano de un equipo experimentado y en un entorno de trabajo cercano y colaborativo? ¡Esta es tu oportunidad!

 

Si quieres trabajar para conseguir un mundo más sostenible y responsable con su entorno, en CAF Digital Services creemos y trabajamos en la movilidad sostenible, uno de los principales retos a los que se enfrenta la sociedad actual. En CAF Digital Services mejoramos la disponibilidad de los trenes y el bienestar de los pasajeros a través de  la analítica de datos y la digitalización. Trabajamos con las tecnologías de mantenimiento y operación más innovadoras para maximizar la calidad de servicio de los trenes.

 

 

 

¿Qué te ofrecemos?

 

Ambiente de Trabajo Positivo: Podrás ser parte de un gran equipo altamente cualificado en el que estarás rodeado/a de personas con un gran espíritu colaborativo en el que te encontrarás un ambiente cercano y muy agradable.

 

Conciliación: Nuestro modelo híbrido te permitirá conciliar a la perfección la vida familiar y la vida laboral.

 

Aprendizaje y Autonomía: Te animaremos a que trabajes de manera autónoma, con el apoyo de nuestra formación, con un producto altamente tecnológico y en un mercado internacional.

 

Seguridad y estabilidad: CAF lleva más de 100 años trabajando en un camino que se extiende hacia el futuro, brindándote la seguridad que necesitas.

 

 

 

¿Qué te hará triunfar en esta posición?

​​​​

  • Poseer estudios de Ingeniería superior de informática
  • Dominio sólido de Machine Learning y Deep Learning: Conocimiento profundo de algoritmos supervisados y no supervisados, redes neuronales (CNN, RNN, Transformers), modelos de clasificación, regresión, clustering y arquitecturas modernas de IA. 
  • Experiencia práctica construyendo modelos de IA end-to-end: Desde la exploración y preparación de datos, feature engineering y entrenamiento, hasta validación, optimización, despliegue y monitorización en producción. 
  • Experiencia práctica con plataformas cloud y entornos de desarrollo colaborativos tales como Databricks, AWS (S3, EMR, Lambda, SageMaker u otros servicios relacionados con datos y ML). 
  • Competencia técnica avanzada en Python y PySpark: Capacidad para trabajar con grandes volúmenes de datos, construir pipelines distribuidos y transformar datasets complejos en entornos de Big Data. 
  • Capacidades teconológicas aplicada a la IA: Uso avanzado de Python y su ecosistema científico (NumPy, pandas, scikit-learn, PyTorch o TensorFlow), con código modular y orientado a objetos preparado para escalabilidad y mantenimiento. 
  • Rigor científico en el desarrollo de modelos: Habilidad para comparar arquitecturas, realizar experimentos controlados, ajustar hiperparámetros, evaluar métricas relevantes y documentar de forma estructurada cada iteración del modelo. 
  • Comprensión profunda del ciclo de vida del dato: Experiencia trabajando con pipelines de datos, integración con APIs, limpieza, transformación y manejo de grandes volúmenes de información. 
  • Mentalidad orientada al impacto: Más allá de la precisión del modelo, serás capaz de traducir necesidades reales en soluciones inteligentes, robustas y aplicables a los procesos y productos de la organización.

 

 

 

¿Cuál va a ser tu misión en la empresa?

 

Tu misión será diseñar, desarrollar y desplegar soluciones de Inteligencia Artificial y Analítica que impulsen el valor del negocio, permitiendo automatizar procesos, anticipar comportamientos, detectar patrones y generar insights accionables.

 

Serás la referencia técnica dentro del equipo, contribuyendo a la evolución del ecosistema LeadMind mediante la integración de modelos de aprendizaje automático y profundo en herramientas, productos y procesos.

 

Trabajarás junto a equipos técnicos, de datos, producto y negocio para transformar información en decisiones y funcionalidades inteligentes, impulsando una cultura data-driven y de innovación continua.

 

 

 

 

Responsabilidades de la posición:

 

  • Diseñar y entrenar modelos de Machine Learning y Deep Learning, seleccionando arquitecturas, técnicas de regularización, optimizadores y estrategias de entrenamiento. 
  • Construir pipelines de datos y de entrenamiento, integrando fuentes diversas, asegurando calidad del dato y aplicando buenas prácticas de ingeniería. 
  • Desarrollar código limpio, modular y escalable en Python y Pyspark, aplicando principios de ingeniería de software (tests, control de versiones, buenas prácticas de diseño) y programación orientada a objetos para explotar el dato. 
  • Evaluar y validar modelos mediante experimentación, análisis estadístico, visualización de resultados, comparación de métricas y pruebas controladas. 
  • Integrar soluciones gráficas o analíticas que permitan al operador explotar el dato tratado. 
  • Colaborar con equipos multidisciplinares para transformar problemas reales en soluciones basadas en IA, analizando impacto, riesgos y viabilidad técnica. 
  • Monitorizar y mejorar modelos existentes, realizando retraining, análisis de drift y ajustes continuos para asegurar robustez y rendimiento. 
  • Documentar decisiones, experimentos, configuraciones y resultados, garantizando reproducibilidad y transferencia de conocimiento. 
  • Mantenerse actualizado/a en tendencias de IA, nuevas arquitecturas, bibliotecas, técnicas de optimización de modelos y mejores prácticas en datos.

 

 

 

Por tanto, si te interesa trabajar en una empresa digital para conseguir un mundo más sostenible y responsable con su entorno, comprometida con la igualdad de oportunidades y que cuenta con un de Igualdad no lo dudes e inscríbete en la oferta ahora.

Enviar candidatura ahora »