Tecsys Jobs

Ingénieur fiabilité des infrastructures

Tecsys

Ingénieur fiabilité des infrastructures

Reposted 16 Days Ago

Be an Early Applicant

In-Office or Remote

Hiring Remotely in Montréal, QC, CAN

Mid level

In-Office or Remote

Hiring Remotely in Montréal, QC, CAN

Mid level

The Infrastructure Reliability Engineer will maintain and optimize AWS and Kubernetes systems, ensuring availability and performance through automation and observability, as part of an interdisciplinary team.

The summary above was generated by AI

Ayant reconnu les avantages du travail à distance sur le bien-être des employés et l'environnement, notamment le moral des employés, la productivité, la réduction des trajets domicile-travail, nous sommes fière d'être une entreprise privilégiant le travail à distance. Les technologies et les programmes dans lesquels nous avons investi ont fourni une base fantastique à cette fin. Notre environnement qui privilégie le travail à distance, ainsi que nos bureaux bien situés et nos espaces de travail collaboratifs, offrent à notre équipe la liberté et la flexibilité de travailler de la manière qui rend nos employés les plus productifs.

À propos de Tecsys

Tecsys est un innovateur à croissance rapide qui offre des solutions de chaîne d'approvisionnement aux principaux systèmes de soins de santé, aux hôpitaux, aux pharmacies, aux distributeurs, aux détaillants et aux 3PL. Nous travaillons avec les leaders du secteur pour transformer leurs chaînes d'approvisionnement grâce à la technologie. Si vous aimez relever des intéressants avec des opportunités d'apprentissage continu joignez-vous à nous!

À propos du poste

Nous recherchons un ingénieur fiabilité des infrastructures pour rejoindre notre Centre des opérations réseau et de sécurité (NOC), une équipe au cœur de la fiabilité des plateformes pour les environnements SaaS critiques. Vous aiderez à maintenir, optimiser et assurer la fiabilité et la performance des systèmes qui alimentent notre infrastructure infonuagique sur AWS et Kubernetes, avec un fort accent sur l’automatisation, l’observabilité et l’amélioration continue.

Ce poste combine l’ingénierie de la fiabilité avec la gestion des incidents, vous donnant une véritable responsabilité sur la disponibilité, la performance et l’innovation. Vous ferez partie d’une équipe hautement qualifiée qui valorise la résolution créative de problèmes, l’excellence opérationnelle et l’amélioration continue grâce à l’automatisation et à l’ingénierie de la résilience.

Vos responsabilités

Collaborer avec d’autres équipes d’ingénierie pour soutenir les services avant leur mise en service à travers des activités telles que la consultation en conception de systèmes, le développement de plateformes et de cadres logiciels, la planification des capacités et les revues de lancement.
Innover continuellement en identifiant les points faibles, en proposant des solutions créatives et en menant des initiatives qui simplifient, font évoluer et renforcent la plateforme.
Maintenir les services une fois qu’ils sont en ligne en mesurant et en surveillant la disponibilité, la latence et l’état général du système.
Assurer une observabilité optimisée : améliorer et élargir la surveillance et l’alerte à l’aide de Datadog; définir les SLO/SLI et créer des tableaux de bord exploitables qui génèrent des résultats de fiabilité.
Développer et favoriser l’automatisation : améliorer les outils internes, les cadres IaC et les pipelines (Terraform, GitLab CI/CD) afin de réduire les interventions manuelles et permettre des systèmes d’auto-réparation.
Faire évoluer les systèmes de façon durable par l’automatisation et en favorisant des changements qui améliorent la fiabilité et la rapidité.
Mettre en pratique une gestion durable des incidents et des analyses post-incident sans reproche. Diriger les examens post-incident (RCA) et identifier les correctifs à long terme qui améliorent la stabilité, la fiabilité et l’expérience des développeurs.
Mettre en œuvre la surveillance, la journalisation, l’alerte et le signalement des SLA.
Créer et maintenir une documentation technique.
Mettre en œuvre, maintenir et faire évoluer les meilleures pratiques SRE.
Agir comme commandant d’incident lors des incidents; coordonner la réponse interéquipes, gérer les communications et assurer une restauration rapide des services.

Autres exigences :

Rotation en cas d’escalade d’incidents
Voyages occasionnels (visites trimestrielles sur les lieux, conférences - moins de 10 %)

Chez Tecsys, nous nous engageons à favoriser un milieu de travail diversifié et inclusif où tous les employés se sentent valorisés, respectés et autonomes. Nous croyons que la diversité stimule l'innovation et renforce notre capacité à offrir des solutions exceptionnelles. Nous accueillons et encourageons les candidatures de personnes de tous horizons, expériences et perspectives à rejoindre notre équipe.

Tecsys est un employeur offrant l'égalité des chances. Des accommodements sont disponibles pour les candidats sélectionnés pour une entrevue. L’usage du masculin dans ce document a pour unique but d’alléger le texte.

NB: Si vous postulez, vous devez être citoyen canadien ou résident permanent du Canada, OU avoir un permis de travail canadien valide.

***

Note concernant notre processus d'embauche : Nous n’utilisons pas l’IA pour filtrer ou rejeter automatiquement les candidatures. Toutefois, nous utilisons certaines questions de présélection afin de prioriser les candidatures les plus pertinentes pour un examen humain.

Note sur l'utilisation de l'IA

Nous encourageons l’utilisation d’outils d’IA pour vous aider à préparer votre candidature, par exemple pour améliorer la clarté, organiser votre CV ou pratiquer vos réponses d’entrevue. Toutefois, nous vous demandons que toutes les informations fournies reflètent votre véritable expérience et que toute évaluation ou soumission écrite représente votre propre travail et votre façon de penser.

Lors des entrevues, nous nous attendons à ce que les candidats participent sans utiliser d’outils d’IA, de scripts ou d’assistance en temps réel. Une conversation authentique et directe nous permet de mieux comprendre votre façon de de réfléchir, de collaborer et de communiquer. L’IA peut soutenir votre préparation, mais ne devrait ni parler ni agir à votre place. C'est réellement vous qu'on veut apprendre à connaitre.

#LI-TECSYS

Montréal, Quebec, Canada

Laval, Quebec, Canada

Similar Jobs

Samsara

Operations Manager

An Hour Ago

Easy Apply

Remote or Hybrid

Canada

Easy Apply

Mid level

Artificial Intelligence • Cloud • Computer Vision • Hardware • Internet of Things • Software

Build and ship internal data and AI products to help Product and Engineering teams. Analyze large structured and unstructured datasets, convert analyses into repeatable tools and dashboards, and drive end-to-end projects from scoping to launch and iteration. Use AI-assisted development tools responsibly, translate findings into decision-ready recommendations, and embed feedback loops and documentation for long-term adoption.

Motive

Director, International Marketing

An Hour Ago

Easy Apply

Remote

Canada

Easy Apply

Expert/Leader

Artificial Intelligence • Fintech • Hardware • Information Technology • Sales • Software • Transportation

Lead Motive's strategy and execution to enter and scale Mexico, the UK, and Canada and evaluate further international expansion. Own go-to-market roadmaps, localization, demand generation, partnerships, and budget allocation. Build and manage a small regional team and agency partners, align cross-functional stakeholders, define success metrics and reporting, run test-and-learn experiments, and present commercial outcomes to executive leadership.

Block

Senior Ios Engineer

2 Hours Ago

In-Office or Remote

Senior level

Blockchain • eCommerce • Fintech • Payments • Software • Financial Services • Cryptocurrency

Lead design and implementation of Neighborhoods mobile experiences across Cash App and Square. Shape cross-team architecture, stay hands-on with iOS development (SwiftUI, Workflow), drive integrations for discovery, ordering, loyalty, and fulfillment, mentor engineers, and apply AI-assisted workflows to accelerate development and quality.

Top Skills: BazelClaude CodeCombineCursorGooseObjective-CProtocol BuffersSwiftSwift ConcurrencySwiftuiUikitWorkflow

What you need to know about the Montreal Tech Scene

With roots dating back to 1642, Montreal is often recognized for its French-inspired architecture and cobblestone streets lined with traditional shops and cafés. But what truly sets the city apart is how it blends its rich tradition with a modern edge, reflected in its evolving skyline and fast-growing tech industry. According to economic promotion agency Montréal International, the city ranks among the top in North America to invest in artificial intelligence, making it le spot idéal for job seekers who want the best of both worlds.

Key Facts About Montreal Tech

Number of Tech Workers: 255,000+ (2024, Tourisme Montréal)
Major Tech Employers: SAP, Google, Microsoft, Cisco
Key Industries: Artificial intelligence, machine learning, cybersecurity, cloud computing, web development
Funding Landscape: $1.47 billion in venture capital funding in 2024 (BetaKit)
Notable Investors: CIBC Innovation Banking, BDC Capital, Investissement Québec, Fonds de solidarité FTQ
Research Centers and Universities: McGill University, Université de Montréal, Concordia University, Mila Quebec, ÉTS Montréal

Tecsys

Ingénieur fiabilité des infrastructures

Tecsys Montréal, Québec, CAN Office

Tecsys Laval, Québec, CAN Office

Similar Jobs

Operations Manager

Director, International Marketing

Senior Ios Engineer

What you need to know about the Montreal Tech Scene

Key Facts About Montreal Tech