Alors que les logiciels propriétaires tels que GPT et PaLM dominent le marché, de nombreux développeurs voient une valeur dans les modèles de langage open-source. Prenons l’exemple de Meta. Il a fait les gros titres en février 2023 en publiant officiellement le grand modèle linguistique LLaMA en tant que programme open-source. Sans surprise, cette décision a suscité des réactions mitigées.
Les modèles de langage en libre accès présentent de nombreux avantages et inconvénients et peuvent avoir des répercussions positives ou négatives sur l’industrie de l’intelligence artificielle.
5 impacts positifs des modèles de langage libres
Les modèles linguistiques libres favorisent une approche collaborative. Les contributions, les révisions et les cas d’utilisation des développeurs du monde entier les aident sans doute à progresser plus rapidement que les projets fermés.
1. Les développeurs d’IA économisent des ressources en utilisant des modèles open-source
Le lancement de modèles de langage propriétaires coûte des millions, voire des milliards, de ressources. Prenons l’exemple d’OpenAI. Business Insider rapporte que l’entreprise a dû lever environ 30 milliards de dollars pour faire fonctionner ChatGPT de manière efficace. Pour la plupart des entreprises, il est impossible d’obtenir un tel financement. Les startups technologiques en phase de démarrage auraient de la chance si elles atteignaient ne serait-ce qu’un montant à sept chiffres.
Compte tenu des frais généraux élevés, de nombreux développeurs utilisent des modèles de langage libres. Ils économisent des millions en utilisant l’architecture, la structure neuronale, les données d’entraînement, l’algorithme, la mise en œuvre du code et les ensembles de données d’entraînement de ces systèmes.
2. Les modèles open-source progressent sans doute plus rapidement
De nombreux leaders technologiques affirment que les modèles linguistiques open-source progressent plus rapidement que leurs homologues propriétaires. Ils apprécient les contributions de la communauté et la collaboration. Des millions de développeurs compétents travaillent sur des projets ouverts : ils pourraient théoriquement parvenir à une itération sophistiquée et sans erreur beaucoup plus rapidement.
L’IA open-source permet également de combler plus rapidement les lacunes en matière de connaissances. Au lieu de former des équipes pour trouver les bogues, tester les mises à jour et explorer les implémentations, les entreprises peuvent analyser les contributions de la communauté. Le partage des connaissances permet aux utilisateurs de travailler plus efficacement.
Les contributions de la communauté ne sont pas toujours exactes. Les développeurs doivent toujours vérifier les algorithmes et les modèles avant de les intégrer dans leurs systèmes.
3. Les développeurs repéreront plus rapidement les vulnérabilités
Les modèles de langage à code source ouvert encouragent les évaluations par les pairs et l’engagement actif au sein de la communauté de collaboration. Les développeurs peuvent accéder librement aux modifications de la base de code. Le grand nombre d’utilisateurs qui analysent les projets ouverts leur permet de repérer plus rapidement les problèmes de sécurité, les vulnérabilités et les bogues du système.
De même, la résolution des bogues est également rationalisée. Au lieu de résoudre manuellement les problèmes système, les développeurs peuvent consulter le système de contrôle des versions du projet pour trouver les corrections précédentes. Certaines entrées peuvent être obsolètes. Cependant, elles fourniront aux chercheurs et aux formateurs en IA un point de départ utile.
4. Les leaders de la technologie de l’IA s’inspirent des modèles libres
Les modèles de langage en libre accès bénéficient d’un retour d’information en boucle. Les boucles de rétroaction positive permettent de partager des algorithmes, des ensembles de données et des fonctions efficaces, ce qui encourage les développeurs à les imiter. Ce processus leur permet de gagner beaucoup de temps. Notez simplement que des erreurs peuvent survenir avec un retour d’information positif que les utilisateurs reproduisent au hasard – les erreurs ont tendance à passer inaperçues.
En revanche, le retour d’information négatif en boucle se concentre sur les domaines à améliorer. Le processus consiste à partager des idées personnelles tout en résolvant les bogues, en testant de nouvelles fonctions et en corrigeant les problèmes du système.
5. Les plateformes d’IA à code source ouvert ont la priorité sur les nouveaux systèmes
Ce n’est pas par gentillesse que les entreprises technologiques partagent des systèmes linguistiques qui valent des milliards de dollars. Si les licences open-source accordent aux utilisateurs tiers la liberté de modifier et de vendre des systèmes, elles ont aussi des limites.
Les distributeurs créent souvent des conditions qui leur permettent de conserver une certaine autorité. Vous trouverez ces règles dans les accords de licence des programmes à code source ouvert – les utilisateurs obtiennent rarement une autorité totale.
Supposons que Meta veuille contrôler les produits alimentés par LLaMA. Son équipe juridique pourrait spécifier que Meta se réserve le droit d’investir dans tout nouveau système construit sur son modèle linguistique.
Mais ne vous méprenez pas : les développeurs et les distributeurs tiers concluent toujours des accords mutuellement bénéfiques. Ces derniers fournissent des technologies et des systèmes valant des milliards de dollars. Pendant ce temps, les startups et les développeurs indépendants explorent les moyens de les mettre en œuvre dans différentes applications.
5 impacts négatifs des modèles linguistiques open-source
Les modèles linguistiques libres sont intrinsèquement impartiaux, mais les humains ne le sont pas. Les consommateurs, les développeurs et les entreprises mal intentionnés pourraient exploiter la nature ouverte de ces systèmes à des fins personnelles.
1. Les entreprises se lancent au hasard dans la course à l’IA
Les entreprises subissent actuellement une pression trop forte pour se lancer dans la course à l’IA. Avec la popularisation des systèmes d’IA, de nombreuses entreprises craignent de devenir obsolètes si elles n’adoptent pas l’IA. Par conséquent, les marques sautent dans le train au hasard. Elles intègrent des modèles linguistiques en source ouverte dans leurs produits dans le but de vendre le produit et de se maintenir au niveau de la concurrence, même si elles n’offrent rien de valable.
Oui, l’IA est un marché qui émerge rapidement. Mais la mise sur le marché inconsidérée de systèmes sophistiqués mais non sécurisés nuit à l’industrie et compromet la sécurité des consommateurs. Les développeurs devraient utiliser l’IA pour résoudre des problèmes, et non pour faire du marketing.
2. Les consommateurs ont accès à des technologies qu’ils comprennent à peine
Vous trouverez des variantes basées sur l’IA de divers outils technologiques, des éditeurs d’images en ligne aux applications de surveillance de la santé. Les marques continueront d’introduire de nouveaux systèmes au fur et à mesure de l’évolution de l’IA. Les modèles d’IA les aident à fournir des itérations plus personnalisées et axées sur l’utilisateur de leurs plateformes existantes.
Alors que l’industrie technologique accueille favorablement les innovations, l’évolution rapide de l’IA va plus vite que l’éducation des utilisateurs. Les consommateurs ont accès à des technologies qu’ils comprennent à peine. Le manque d’éducation crée d’énormes lacunes en matière de connaissances, ce qui rend le public vulnérable aux menaces de cybersécurité et aux pratiques prédatrices.
Les marques doivent accorder autant d’importance à la formation qu’au développement de produits. Elles doivent aider les utilisateurs à comprendre comment utiliser de manière sûre et responsable les puissants outils basés sur l’IA.
3. Les développeurs n’ont pas tous de bonnes intentions
Tout le monde n’utilise pas les outils d’IA aux fins prévues. Par exemple, OpenAI a développé ChatGPT pour répondre à des questions de connaissances générales sans danger pour le travail et pour reproduire le langage naturel, mais des criminels l’exploitent pour des activités illicites. Plusieurs escroqueries ont eu lieu depuis le lancement du chatbot d’IA en novembre 2022.
Même si les laboratoires d’IA appliquent des restrictions rigoureuses, les escrocs trouveront toujours des moyens de les contourner. Prenons l’exemple de ChatGPT. Les utilisateurs contournent les contraintes et effectuent des tâches interdites en utilisant les invites de ChatGPT jailbreak.
Les conversations ci-dessous illustrent ces vulnérabilités. ChatGPT dispose d’ensembles de données limités ; il ne peut donc pas faire de prédictions sur des événements instables et non garantis.
Malgré ses limites, ChatGPT a exécuté notre demande et a fourni des prédictions sans fondement après l’avoir jailbreaké.
4. Les institutions pourraient avoir du mal à réguler l’IA open-source
Les organismes de réglementation ont du mal à suivre le rythme de l’IA, et la prolifération des modèles open-source ne fait que rendre le contrôle plus difficile. Les progrès de l’IA dépassent déjà les cadres réglementaires. Même des leaders mondiaux de la technologie comme Elon Musk, Bill Gates et Sam Altman appellent à une réglementation plus stricte de l’IA.
Les secteurs privé et public doivent contrôler ces systèmes. Sinon, des individus malveillants continueront à les exploiter pour violer les lois sur la confidentialité des données, commettre des vols d’identité et escroquer les victimes, entre autres activités illicites.
5. L’abaissement des barrières à l’entrée nuit à la qualité
La prolifération des modèles linguistiques libres abaisse les barrières à l’entrée dans la course à l’IA. Vous trouverez en ligne des milliers d’outils basés sur l’IA.
Voir des entreprises adopter l’apprentissage automatique et l’apprentissage profond peut sembler impressionnant, mais peu d’entre elles apportent une réelle valeur ajoutée. La plupart se contentent de copier leurs concurrents. Avec le temps, l’accessibilité des modèles de langage sophistiqués et des ensembles de données d’entraînement pourrait banaliser les plateformes d’IA inutiles.
L’impact global des modèles de langage en libre accès sur l’industrie de l’IA
Si les modèles de langage libres rendent les technologies de l’IA plus accessibles, ils présentent également plusieurs risques pour la sécurité. Les développeurs devraient fixer des restrictions plus strictes. Sinon, les escrocs continueront à exploiter l’architecture transparente de ces systèmes.
Cela dit, les consommateurs ne sont pas totalement à l’abri des escroqueries à l’IA. Familiarisez-vous avec les méthodes couramment utilisées par les escrocs pour exploiter les outils d’IA générative et étudiez les signes avant-coureurs des attaques. Vous pouvez lutter contre la plupart des cybercrimes en restant vigilant.