En savoir plus sur Plateformes MLOps
Qui utilise les plateformes MLOps ?
Les data scientists sont très demandés, mais il y a une pénurie de professionnels qualifiés disponibles. Le jeu de compétences est varié et vaste (par exemple, il est nécessaire de comprendre un large éventail d'algorithmes, de mathématiques avancées, de compétences en programmation, et plus encore) ; par conséquent, ces professionnels sont difficiles à trouver et commandent une rémunération élevée. Pour résoudre ce problème, les plateformes incluent de plus en plus de fonctionnalités qui facilitent le développement de solutions d'IA, telles que les capacités de glisser-déposer et les algorithmes préconstruits.
De plus, pour que les projets de science des données soient lancés, il est essentiel que l'entreprise dans son ensemble adhère à ces projets. Les plateformes les plus robustes fournissent des ressources qui permettent aux utilisateurs non techniques de comprendre les modèles, les données impliquées et les aspects de l'entreprise qui ont été impactés.
Ingénieurs de données : Avec des capacités d'intégration de données robustes, les ingénieurs de données chargés de la conception, de l'intégration et de la gestion des données utilisent ces plateformes pour collaborer avec les data scientists et d'autres parties prenantes au sein de l'organisation.
Data scientists citoyens : Surtout avec l'essor de fonctionnalités plus conviviales, les data scientists citoyens qui ne sont pas formés professionnellement mais ont développé des compétences en données se tournent de plus en plus vers MLOps pour intégrer l'IA dans leur organisation.
Data scientists professionnels : Les data scientists experts tirent parti de ces plateformes pour étendre les opérations de science des données tout au long du cycle de vie, simplifiant le processus d'expérimentation au déploiement, accélérant l'exploration et la préparation des données, ainsi que le développement et l'entraînement des modèles.
Parties prenantes commerciales : Les parties prenantes commerciales utilisent ces outils pour obtenir une clarté sur les modèles d'apprentissage automatique et mieux comprendre comment ils s'intègrent dans l'entreprise et ses opérations dans son ensemble.
Quelles sont les alternatives aux plateformes MLOps ?
Les alternatives aux plateformes MLOps peuvent remplacer ce type de logiciel, soit partiellement, soit complètement :
Plateformes de science des données et d'apprentissage automatique : Selon le cas d'utilisation, les entreprises peuvent envisager des plateformes de science des données et d'apprentissage automatique. Ce logiciel fournit une plateforme pour le développement complet de bout en bout de modèles d'apprentissage automatique et peut offrir des fonctionnalités plus robustes pour opérationnaliser ces algorithmes.
Logiciel d'apprentissage automatique : Les plateformes MLOps sont excellentes pour la surveillance et la gestion à grande échelle des modèles, que ce soit pour la vision par ordinateur, le traitement du langage naturel (NLP), et plus encore. Cependant, dans certains cas, les entreprises peuvent vouloir une solution plus facilement disponible sur étagère, qu'elles peuvent utiliser de manière plug-and-play. Dans ce cas, elles peuvent envisager un logiciel d'apprentissage automatique, qui nécessitera moins de temps de configuration et de coûts de développement.
De nombreux types d'algorithmes d'apprentissage automatique effectuent diverses tâches et fonctions. Ces algorithmes peuvent consister en des algorithmes d'apprentissage automatique plus spécifiques, tels que l'apprentissage des règles d'association, les réseaux bayésiens, le clustering, l'apprentissage des arbres de décision, les algorithmes génétiques, les systèmes de classification d'apprentissage et les machines à vecteurs de support, entre autres. Cela aide les organisations à la recherche de solutions ponctuelles.
Logiciels liés aux plateformes MLOps
Les solutions connexes qui peuvent être utilisées avec les plateformes MLOps incluent :
Logiciel de préparation des données : Le logiciel de préparation des données aide les entreprises dans la gestion de leurs données. Ces solutions permettent aux utilisateurs de découvrir, combiner, nettoyer et enrichir les données pour une analyse simple. Bien que les plateformes MLOps offrent des fonctionnalités de préparation des données, les entreprises peuvent opter pour un outil de préparation dédié.
Logiciel d'entrepôt de données : La plupart des entreprises ont un grand nombre de sources de données disparates, et pour mieux intégrer toutes leurs données, elles mettent en place un entrepôt de données. Les entrepôts de données hébergent des données provenant de plusieurs bases de données et applications commerciales, permettant aux outils de business intelligence et d'analyse de tirer toutes les données de l'entreprise à partir d'un seul référentiel.
Logiciel d'étiquetage des données : Pour lancer l'apprentissage supervisé, il est essentiel d'avoir des données étiquetées. Mettre en place un effort d'étiquetage systématique et soutenu peut être aidé par un logiciel d'étiquetage des données, qui fournit un ensemble d'outils pour que les entreprises transforment les données non étiquetées en données étiquetées et construisent des algorithmes d'IA correspondants.
Logiciel de traitement du langage naturel (NLP) : Le NLP permet aux applications d'interagir avec le langage humain en utilisant un algorithme d'apprentissage profond. Les algorithmes NLP saisissent le langage et fournissent une variété de sorties basées sur la tâche apprise. Les algorithmes NLP fournissent la reconnaissance vocale et la génération de langage naturel (NLG), qui convertit les données en langage humain compréhensible. Quelques exemples d'utilisations du NLP incluent les chatbots, les applications de traduction et les outils de surveillance des réseaux sociaux qui scannent les réseaux sociaux pour les mentions.
Mise en œuvre des plateformes MLOps
Comment les plateformes MLOps sont-elles mises en œuvre ?
La mise en œuvre diffère considérablement en fonction de la complexité et de l'échelle des données. Dans les organisations avec de vastes quantités de données provenant de sources disparates (par exemple, applications, bases de données, etc.), il est souvent judicieux d'utiliser une partie externe, qu'il s'agisse d'un spécialiste de la mise en œuvre du fournisseur ou d'un cabinet de conseil tiers. Avec une vaste expérience à leur actif, ils peuvent aider les entreprises à comprendre comment connecter et consolider leurs sources de données et comment utiliser le logiciel de manière efficace et efficiente.
Qui est responsable de la mise en œuvre des plateformes MLOps ?
Il peut être nécessaire d'avoir beaucoup de personnes, ou de nombreuses équipes, pour déployer correctement une plateforme de science des données, y compris des ingénieurs de données, des data scientists et des ingénieurs logiciels. Cela est dû au fait que, comme mentionné, les données peuvent traverser des équipes et des fonctions. En conséquence, il est rare qu'une seule personne ou même une seule équipe ait une compréhension complète de tous les actifs de données d'une entreprise. Avec une équipe interfonctionnelle en place, une entreprise peut commencer à assembler ses données et commencer le parcours de la science des données, en commençant par une préparation et une gestion appropriées des données.
À quoi ressemble le processus de mise en œuvre des plateformes MLOps ?
En termes de mise en œuvre, il est typique que le déploiement de la plateforme commence de manière limitée et soit ensuite déployé de manière plus large. Par exemple, une marque de détail pourrait décider de tester A/B l'utilisation d'un algorithme de personnalisation pour un nombre limité de visiteurs de son site afin de mieux comprendre comment il fonctionne. Si le déploiement est réussi, l'équipe de science des données peut présenter ses résultats à son équipe de direction (qui pourrait être le CTO, selon la structure de l'entreprise).
Si le déploiement n'a pas réussi, l'équipe pourrait revenir à la planche à dessin, en essayant de comprendre ce qui a mal tourné. Cela impliquera d'examiner les données d'entraînement, ainsi que les algorithmes utilisés. Si elles essaient à nouveau, mais que rien ne semble réussir (c'est-à-dire que le résultat est erroné ou qu'il n'y a pas d'amélioration des prédictions), l'entreprise pourrait avoir besoin de revenir aux bases et de revoir ses données dans leur ensemble.
Quand devriez-vous mettre en œuvre des plateformes MLOps ?
Comme mentionné précédemment, l'ingénierie des données, qui implique la préparation et la collecte des données, est une caractéristique fondamentale des projets de science des données. Par conséquent, les entreprises doivent donner la priorité à la mise en ordre de leurs données, en s'assurant qu'il n'y a pas d'enregistrements en double ou de champs mal alignés. Bien que cela semble basique, ce n'est rien de tel. Des données erronées en entrée entraîneront des données erronées en sortie.
Tendances des plateformes MLOps
AutoML
AutoML aide à automatiser de nombreuses tâches nécessaires au développement d'applications d'IA et d'apprentissage automatique. Les utilisations incluent la préparation automatique des données, l'ingénierie des caractéristiques automatisée, la fourniture d'explicabilité pour les modèles, et plus encore.
IA intégrée
Les fonctionnalités d'apprentissage machine et profond sont de plus en plus intégrées dans presque tous les types de logiciels, que l'utilisateur en soit conscient ou non. L'utilisation de l'IA intégrée dans des logiciels tels que le CRM, l'automatisation du marketing et les solutions d'analyse permet aux utilisateurs de rationaliser les processus, d'automatiser certaines tâches et d'obtenir un avantage concurrentiel avec des capacités prédictives. L'IA intégrée pourrait progressivement se développer dans les années à venir et pourrait le faire de la même manière que le déploiement cloud et les capacités mobiles l'ont fait au cours de la dernière décennie environ. Finalement, les fournisseurs pourraient ne pas avoir besoin de mettre en avant les avantages de leur produit grâce à l'apprentissage automatique, car cela pourrait simplement être supposé et attendu.
Apprentissage automatique en tant que service (MLaaS)
L'environnement logiciel est passé à une structure plus granulaire, de microservices, en particulier pour les besoins des opérations de développement. De plus, le boom des services d'infrastructure cloud publics a permis aux grandes entreprises d'offrir des services de développement et d'infrastructure à d'autres entreprises avec un modèle de paiement à l'utilisation. Le logiciel d'IA n'est pas différent, car les mêmes entreprises offrent MLaaS à d'autres entreprises.
Les développeurs profitent facilement de ces algorithmes et solutions préconstruits en leur fournissant leurs propres données pour obtenir des informations. L'utilisation de systèmes construits par des entreprises d'entreprise aide les petites entreprises à économiser du temps, des ressources et de l'argent en éliminant le besoin d'embaucher des développeurs d'apprentissage automatique qualifiés. MLaaS se développera davantage à mesure que les entreprises continueront de s'appuyer sur ces microservices et que le besoin d'IA augmentera.
Explicabilité
En ce qui concerne les algorithmes d'apprentissage automatique, en particulier l'apprentissage profond, il peut être particulièrement difficile d'expliquer comment ils sont arrivés à certaines conclusions. L'IA explicable, également connue sous le nom de XAI, est le processus par lequel le processus de prise de décision des algorithmes est rendu transparent et compréhensible pour les humains. La transparence est le principe le plus répandu dans la littérature actuelle sur l'éthique de l'IA, et donc l'explicabilité, un sous-ensemble de la transparence, devient cruciale. Les plateformes MLOps incluent de plus en plus d'outils pour l'explicabilité, aidant les utilisateurs à intégrer l'explicabilité dans leurs modèles et à répondre aux exigences d'explicabilité des données dans des législations telles que la loi sur la confidentialité de l'Union européenne, le RGPD.
Comment acheter des plateformes MLOps
Collecte des exigences (RFI/RFP) pour les plateformes MLOps
Si une entreprise débute et cherche à acheter sa première plateforme de science des données et d'apprentissage automatique, ou quel que soit l'endroit où elle se trouve dans son processus d'achat, g2.com peut aider à sélectionner la meilleure option.
La première étape du processus d'achat doit impliquer un examen attentif des données de l'entreprise. Une partie fondamentale du parcours de la science des données implique l'ingénierie des données (c'est-à-dire la collecte et l'analyse des données), les entreprises doivent s'assurer que la qualité de leurs données est élevée et que la plateforme en question peut gérer adéquatement leurs données, tant en termes de format que de volume. Si l'entreprise a accumulé beaucoup de données, elle doit rechercher une solution qui peut évoluer avec l'organisation. Les utilisateurs doivent réfléchir aux points de douleur et les noter ; ceux-ci doivent être utilisés pour aider à créer une liste de critères. De plus, l'acheteur doit déterminer le nombre d'employés qui auront besoin d'utiliser ce logiciel, car cela détermine le nombre de licences qu'ils sont susceptibles d'acheter.
Prendre une vue d'ensemble de l'entreprise et identifier les points de douleur peut aider l'équipe à se lancer dans la création d'une liste de critères. La liste sert de guide détaillé qui inclut à la fois les fonctionnalités nécessaires et souhaitables, y compris le budget, les fonctionnalités, le nombre d'utilisateurs, les intégrations, les exigences de sécurité, les solutions cloud ou sur site, et plus encore.
Selon l'étendue du déploiement, il peut être utile de produire une RFI, une liste d'une page avec quelques points décrivant ce qui est nécessaire d'une plateforme de science des données.
Comparer les plateformes MLOps
Créer une liste longue
De la satisfaction des besoins fonctionnels de l'entreprise à la mise en œuvre, les évaluations des fournisseurs sont une partie essentielle du processus d'achat de logiciels. Pour faciliter la comparaison, après que toutes les démonstrations soient terminées, il est utile de préparer une liste cohérente de questions concernant les besoins et préoccupations spécifiques à poser à chaque fournisseur.
Créer une liste courte
À partir de la liste longue des fournisseurs, il est utile de réduire la liste des fournisseurs et de proposer une liste plus courte de prétendants, de préférence pas plus de trois à cinq. Avec cette liste en main, les entreprises peuvent produire une matrice pour comparer les fonctionnalités et les prix des différentes solutions.
Réaliser des démonstrations
Pour s'assurer que la comparaison est approfondie, l'utilisateur doit démontrer chaque solution de la liste courte avec le même cas d'utilisation et les mêmes ensembles de données. Cela permettra à l'entreprise d'évaluer de manière équitable et de voir comment chaque fournisseur se compare à la concurrence.
Sélection des plateformes MLOps
Choisir une équipe de sélection
Avant de commencer, créer une équipe gagnante qui travaillera ensemble tout au long du processus, de l'identification des points de douleur à la mise en œuvre, est crucial. L'équipe de sélection de logiciels doit être composée de membres de l'organisation ayant le bon intérêt, les compétences et le temps pour participer à ce processus. Un bon point de départ est de viser trois à cinq personnes qui occupent des rôles tels que le principal décideur, le chef de projet, le propriétaire du processus, le propriétaire du système ou l'expert en la matière du personnel, ainsi qu'un responsable technique, un administrateur informatique ou un administrateur de la sécurité. Dans les petites entreprises, l'équipe de sélection des fournisseurs peut être plus petite, avec moins de participants multitâches et assumant plus de responsabilités.
Négociation
Ce n'est pas parce que quelque chose est écrit sur la page de tarification d'une entreprise que c'est fixe (bien que certaines entreprises ne bougeront pas). Il est impératif d'ouvrir une conversation concernant les prix et les licences. Par exemple, le fournisseur peut être disposé à accorder une réduction pour les contrats pluriannuels ou pour recommander le produit à d'autres.
Décision finale
Après cette étape, et avant de s'engager pleinement, il est recommandé de lancer un test ou un programme pilote pour tester l'adoption avec un petit échantillon d'utilisateurs. Si l'outil est bien utilisé et bien reçu, l'acheteur peut être confiant que la sélection était correcte. Sinon, il pourrait être temps de revenir à la planche à dessin.