À propos
STEP UP est une société d'ingénierie experte en pilotage de projets industriels et informatiques (+ 250 collaborateurs sur 11 agences en France), plaçant le potentiel humain comme 1er vecteur d'excellence et de performance en entreprise.
Oubliez les sociétés d'ingénierie qui ne valorisent que vos seules compétences, chez STEP UP, nous visons également l'adéquation entre votre personnalité et la culture d'entreprise de nos clients. Cela se traduit pour vous par une différence fondamentale en termes de bien être, d'épanouissement au travail et de succès dans vos missions.
Ce que nous vous proposons :
- Un cadre de travail épanouissant, stimulant et collaboratif, nous sommes certifiés entreprise où il fait bon vivre !
- Des projets innovants et variés.
- La possibilité de se perfectionner continuellement avec des formations internes.
- Des perspectives d'évolution de carrière.
- Un accompagnement individualisé avec un programme de développement du potentiel humain.
- Un programme de cooptation.
Et bien sûr, nous prenons en charge 70% de votre mutuelle santé et encourageons financièrement la mobilité douce.
Le poste
Dans un environnement critique et fortement orienté qualité de service, nous recherchons un Ingénieur SRE / DevOps Support pour assurer le RUN, le diagnostic et le support avancé de plateformes applicatives et techniques.
Le poste s'inscrit dans un contexte industriel exigeant, où la disponibilité des systèmes, la traçabilité et la réactivité sur incidents sont essentielles.
Missions principales :
Vous intervenez en tant que support technique de niveau 2/3 sur des environnements de production et de plateformes DevOps.
Vos principales responsabilités :
- Assurer le diagnostic et l'analyse d'incidents à distance sur des environnements Linux / Cloud
- Exploiter les outils de supervision et d'observabilité (logs, métriques, traces)
- Analyser les logs applicatifs et systèmes (ELK / stack de monitoring)
- Identifier les causes racines des incidents et proposer des plans de correction (RCA)
- Suivre et traiter les incidents via outils ITSM (ServiceNow, Jira…)
- Participer au maintien en conditions opérationnelles (MCO) des plateformes
- Collaborer avec les équipes infra, DevOps et applicatives
- Documenter les incidents, solutions et bonnes pratiques
- Contribuer à l'amélioration continue de la qualité de service
Environnement Technique :
- Systèmes : Linux (principalement), Windows
- Conteneurisation : Docker, Kubernetes
- Observabilité : ELK (Elastic Stack), Grafana, Prometheus, Loki
- Cloud : AWS / Azure (selon environnements)
- Automatisation : Ansible (et notions Terraform appréciées)
- CI/CD : Bitbucket pipelines ou équivalent
- Outils ITSM : ServiceNow, Jira
- Virtualisation : VMware
Profil recherché
Techniques :
- Administration système Linux
- Analyse de logs et troubleshooting avancé
- Notions solides DevOps / Kubernetes
- Compréhension des architectures applicatives
- Supervision et monitoring (Grafana / ELK)
Fonctionnelles :
- Esprit d'analyse et de diagnostic
- Culture du RUN et de la disponibilité
- Rigueur et respect des processus qualité
- Capacité à travailler en environnement critique
- Bonne communication et reporting incident