logo

View all jobs

Bilingual DevOps Engineer

Montreal, Quebec
Responsibilities:
  • As a Site Reliability Engineer, you will have a key role within Thales Digital Solutions and you will be entrusted with the following missions:
  • Responsible for the operations of a "Kubernetes as a Service" service exposed to internal and external users.
  • Management of incidents and problems on the service.
  • Leader of service investigations by initiating analyzes and escalating to development teams if necessary.
  • Responsible for continuous improvement of the service
  • Implementation of a reporting and publication strategy for KPIs which present the quality objectives and their deviations over time (monitoring, telemetry)
  • Manage service updates.
  • Contribution to the service roadmap on resilience and operational aspects.
  • Point of contact with the Security Partner and the Enterprise Architect.
  • You will report to the engineering & operations teams of Thales Digital Solutions and you will work in close collaboration with the Thales Digital Factory and Business Lines teams.
Qualification:
 
  • Organized and able to prioritize multiple tasks
  • Managing emergency situations with pragmatism
  • Good communication, especially in English, oral and written
  • Commitment to continuous improvement
  • Understanding of DevOps concepts, continuous integration & continuous deployment (CI / CD) and container orchestration (kubernetes).
  • Understanding of IaaS, PaaS, Cloud and its security issues.
  • Support for service users (internal and customer).
  • Good expertise in service operation:
  • Ability to separate incidents from customer requests.
  • Ability to identify problems on the service.
  • Ability to conduct an investigation on the technical and application layers.
  • Ability to escalate an investigation to service developers if needed
  • Implementation of service improvement mechanisms: alerts, KPI monitoring, reporting.
  • Experiences in a public cloud context will be appreciated.
  • Certifications such as "ITIL" would be a plus
  • Knowledge of Microsoft Azure would be a plus
 
Responsibilities
 
  • En tant que Site Reliability Engineer, vous aurez un rôle clé au sein de Thales Solutions Numériques et vous vous verrez confier les missions suivantes :
  • Responsable des opérations d’un service « Kubernetes as a Service » exposé à des utilisateurs internes et externes.
  • Gestion des incidents et des problèmes sur le service.
  • Leader des investigations sur le service en initiant les analyses et escaladant aux équipes de développement si besoin.
  • Responsable de l’amélioration continue du service
  • Mise en place d’une stratégie de reporting et de publication des KPI qui présentent les objectifs de qualité et leurs écarts au fil du temps (monitoring, telemetrie)
  • Piloter les mises à jour du service.
  • Contribution à la roadmap du service sur les aspects résilience et opérationnalité.
  • Point de contact avec le Security Partner et l’Architecte d’entreprise.
  • Vous serez rattaché.e aux équipes d’engineering & opérations de Thales Solutions Numériques et vous travaillerez en étroite collaboration avec les équipes de la Digital Factory et Business Lines de Thales.
Qualification:
  • Organisé.e et capable de prioriser de multiples tâches
  • Bonne communication, notamment en anglais, à l’oral et à l’écrit
  • Volonté d’amélioration continue
  • Compréhension des concepts DevOps, d’intégration continue & déploiement continue (CI/CD) et de l’orchestration de conteneur (kubernetes).
  • Compréhension des concepts IaaS, PaaS, du Cloud et de ses enjeux en sécurité.
  • Accompagnement des utilisateurs du service (interne et client).
  • Bonne expertise en opération des services :
  • Capacité à dissocier les incidents et les demandes des clients.
  • Capacité à identifier des problèmes sur le service.
  • Capacité à mener une investigation sur les couches techniques et applicatives.
  • Capacité à escalader une investigation aux développeurs du service si besoin
  • Mise en œuvre de dispositifs d’amélioration du service : alertes, monitoring de KPI, reporting.
  • Des expériences dans un contexte de cloud public seront appréciées.
  • Des certifications telles que « ITIL » seraient un plus
  • Des connaissances dans Microsoft Azure seraient un plus

Share This Job

Powered by