
Machine Learning Operations Developer - AI/ML Platform
Autodesk
The Role
Overview
Implement and manage MLOps pipelines and infrastructure for Autodesk's AI/ML platform.
Key Responsibilities
- version control
- deployment automation
- scalable infrastructure
- monitoring
- security compliance
- data pipelines
Tasks
-Version Control and Model Governance: Implement version control systems for machine learning models and contribute to model governance practices -Deployment Automation: Design and implement automated deployment pipelines for machine learning models, ensuring seamless transitions from development to production -Scalable Infrastructure: Collaborate with cross-functional teams to design, implement, and maintain scalable infrastructure for model training, inference, and data processing -Collaboration with Data Engineers: Work closely with data engineers to ensure efficient data pipelines for model training and validation -Troubleshooting and Incident Response: Play a key role in identifying and resolving operational issues, contributing to incident response and system recovery -Governance and Trust: Contribute to the implementation of robust model governance practices, version control systems, and adherence to compliance standards. Uphold data privacy and ethical considerations, fostering trust in our AI/ML solutions -Security and Compliance: Enforce security best practices and compliance standards in all aspects of MLOps, ensuring data privacy and platform security -Surveillance et journalisation: Développer et maintenir des systèmes de surveillance et de journalisation robustes pour suivre les performances des modèles, la santé du système et l'efficacité globale de la plateforme. -Collaboration avec les ingénieurs de données: travailler en étroite collaboration avec les ingénieurs de données pour garantir des pipelines de données efficaces pour l'entraînement et la validation des modèles -Monitoring and Logging: Develop and maintain robust monitoring and logging systems to track model performance, system health, and overall platform efficiency -Operational Efficiency: Drive the operational excellence of our AI/ML Platform by implementing and optimizing MLOps practices -Continuous Improvement: Identify opportunities for process automation, optimization, and implement strategies to enhance the overall MLOps lifecycle
Requirements
- python
- docker
- kubernetes
- ci/cd
- terraform
- 5+ years
What You Bring
-Scripting et automatisation: Solides compétences en scripting en Python, Bash ou dans des langages similaires pour l'automatisation des processus opérationnels -Gouvernance et confiance: contribuer à la mise en œuvre de pratiques robustes de gouvernance des modèles, de systèmes de contrôle de version et de respect des normes de conformité. Respecter la confidentialité des données et les considérations éthiques, en favorisant la confiance dans nos solutions d'IA/AA -Connaissance des bases de données: familiarité avec les bases de données et les solutions de stockage de données couramment utilisées dans les MLOps, telles que SQL, NoSQL ou les lacs de données -Méthodologie Agile: familiarité avec les méthodologies de développement Agile et le travail dans un environnement itératif et collaboratif -Conteneurisation: solide expertise des technologies de conteneurisation (Docker, Kubernetes) pour l'orchestration et la mise à l'échelle des charges de travail d'apprentissage automatique -Problem-solving Skills: Proven ability to troubleshoot and resolve complex operational issues in a timely manner -Machine Learning Frameworks: Exposure to popular machine learning frameworks (TensorFlow, PyTorch) and their integration into MLOps processes -MLOps Expérience: plus de 5 ans d'expérience pratique en DevOps et MLOps, avec un accent sur le déploiement et la gestion de modèles d'apprentissage automatique dans des environnements de production -Capacités de résolution de problèmes: capacité avérée à dépanner et à résoudre des questions opérationnelles complexes en temps utile -Infrastructure évolutive: Collaborer avec des équipes interfonctionnelles pour concevoir, mettre en œuvre et maintenir une infrastructure évolutive pour l'entraînement des modèles, l'inférence et le traitement des données. -Database Knowledge: Familiarity with databases and data storage solutions commonly used in MLOps, such as SQL, NoSQL, or data lakes -CI/CD: Expérience avérée dans la mise en place et la gestion de pipelines d'intégration et de déploiement continus (CI/CD) pour des projets d'apprentissage automatique -Sécurité et conformité: appliquer les meilleures pratiques en matière de sécurité et les normes de conformité dans tous les aspects des MLOps, en garantissant la confidentialité des données et la sécurité de la plateforme -Collaboration Tools: Previous experience with collaboration tools like Git for version control and Jira for project management -Capacités de collaboration: excellentes capacités de collaboration et de communication, capacité à travailler efficacement avec des équipes interfonctionnelles comprenant des ingénieurs de données, des développeurs de logiciels et des chercheurs -Outils de collaboration: expérience préalable des outils de collaboration tels que Git pour le contrôle de version et Jira pour la gestion de projet -CI/CD: Demonstrated experience in setting up and managing Continuous Integration and Continuous Deployment (CI/CD) pipelines for machine learning projects -Monitoring Tools: Familiarity with monitoring and logging tools (e.g., Prometheus, Grafana, ELK Stack) for tracking system and model performance -Formation: licence ou master en informatique, ou dans un domaine connexe -Dépannage et réponse aux incidents: jouer un rôle clé dans l'identification et la résolution des problèmes opérationnels, en contribuant à la réponse aux incidents et à la récupération du système -MLOps Experience: 5+ years of hands-on experience in DevOps and MLOps, with a focus on deploying and managing machine learning models in production environments -Agile Methodology: Familiarity with Agile development methodologies and working in an iterative, collaborative environment -Infrastructure as Code (IaC): Proficiency in implementing Infrastructure as Code practices using tools such as Terraform or Ansible -Outils de surveillance: Familiarité avec les outils de surveillance et de journalisation (par exemple, Prometheus, Grafana, ELK Stack) pour le suivi des performances des systèmes et des modèles -Automatisation du déploiement : Concevoir et mettre en œuvre des pipelines de déploiement automatisés pour les modèles d'apprentissage automatique, en assurant des transitions fluides du développement à la production. -Security Awareness: Understanding of security best practices in MLOps, including data encryption, access controls, and compliance standards -Scripting and Automation: Strong scripting skills in Python, Bash, or similar languages for automating operational processe -Collaboration Skills: Excellent collaboration and communication skills, working effectively with cross-functional teams including data engineers, software developers, and researchers -Infrastructure as Code (IaC): maîtrise de la mise en œuvre des pratiques d'infrastructure as code à l'aide d'outils tels que Terraform ou Ansible -Sensibilisation à la sécurité: compréhension des meilleures pratiques en matière de sécurité dans le domaine des MLOps, notamment le cryptage des données, les contrôles d'accès et les normes de conformité -Cloud Experience: Experience with cloud platforms, especially AWS or Azure, for deploying and managing machine learning infrastructure -Containerization: Strong expertise in containerization technologies (Docker, Kubernetes) for orchestrating and scaling machine learning workloads -Expérience du cloud: expérience des plateformes cloud, en particulier AWS ou Azure, pour le déploiement et la gestion d'infrastructures d'apprentissage automatique -Educational Background: BS or MS in Computer Science, or related field -Contrôle de version et gouvernance des modèles: mettre en œuvre des systèmes de contrôle de version pour les modèles d'apprentissage automatique et contribuer aux pratiques de gouvernance des modèles
People Also Searched For
Operations Administrator jobs in Laval , Quebec , CA
Data Entry jobs in Laval , Quebec , CA
Administrative Assistant jobs in Laval , Quebec , CA
Operations Administrator jobs in Quebec , CA
Data Entry jobs in Quebec , CA
Administrative Assistant jobs in Quebec , CA
Operations Administrator jobs in Laval , CA
Data Entry jobs in Laval , CA
Administrative Assistant jobs in Laval , CA
Benefits
-Cadres d'apprentissage automatique: exposition aux cadres d'apprentissage automatique populaires (TensorFlow, PyTorch) et à leur intégration dans les processus MLOps
The Company
About Autodesk
-Pioneered software for 2D and 3D design, revolutionizing industries. -Known for products like AutoCAD, it reshaped architecture, engineering, and manufacturing workflows. -Empowering creators in fields from construction to digital media, enabling more innovative designs. -Develops tools used in iconic projects, from skyscrapers to blockbuster movies. -Pushes the boundaries of design technology, leading the way in artificial intelligence and automation. -Software is a cornerstone in diverse sectors, from industrial to infrastructure, energy, and entertainment. -Cloud-based solutions streamline design processes and foster real-time collaboration across industries. -A leader in 3D design software, with solutions powering projects in every corner of the globe. -Committed to shaping the future of digital design, bringing complex visions to life.
Sector Specialisms
Building Design
Construction
Automotive
Building Product Manufacturing
3D Animation
Architecture
Engineering
Construction Professionals
Mechanical Engineering
Mechanical CAD
Thermal Simulation
Electronic Design Automation
Print Circuit Board Design
Mechanical, Electrical, and Plumbing (MEP)
HVAC
Fabrication
Estimation
Infrastructure
Civil Engineering
Genetic Engineering (Life Sciences)
