Les données sont extrêmement précieuses, et leur exploitation est facilement l’une des meilleures pratiques pour la plupart des organisations aujourd’hui. Mais connaître les normes de l’industrie à ce sujet est nécessaire pour que les data scientists ne se trompent pas avec les données à mesure que les gens en apprennent davantage sur leur valeur.
Les scientifiques des données doivent donc adopter des pratiques sûres et éthiques, ainsi que des pratiques normalisées. Au lieu de considérer uniquement la valeur des données, il est judicieux de remettre en question les méthodes d’obtention et de traitement des données, quel que soit le but recherché. Voici donc neuf codes de conduite que tout scientifique des données devrait respecter.
1. Respecter les réglementations
Les scientifiques des données doivent connaître les réglementations relatives à la protection des données qui s’appliquent à certains emplois. Dans le cas contraire, ils risquent d’enfreindre la loi sans le savoir et de mettre leur vie et celle des autres en danger. Ces connaissances sont donc essentielles pour garantir un travail éthique et éviter des dommages involontaires.
Par conséquent, vérifiez les lois pertinentes avant de vous engager dans toute activité. En outre, ne vous contentez pas d’observer les règlements pour suivre les règles ; cherchez également à les comprendre en profondeur. Pour respecter correctement les règlements, vous devez savoir pourquoi ils ont été mis en place et contre quoi ils protègent.
Le règlement général sur la protection des données (RGPD) de l’UE et la loi californienne sur la protection de la vie privée des consommateurs (CCPA) sont des exemples de lois sur la protection de la vie privée dignes d’intérêt. On peut également citer HIIPA, DPA, PIPEDA, LGPD, ainsi que de nombreuses réglementations spécifiques à l’industrie.
2. Respecter la vie privée
Les adresses, les courriels et les identifiants sont des éléments d’identification qui ne devraient pas être rendus publics, car ils présentent des risques réels pour les personnes. Veillez donc à rendre ces informations aussi privées que possible.
En cas d’exposition, les victimes peuvent être victimes d’une usurpation d’identité ou d’une fraude. Elles peuvent également faire l’objet d’un chantage de la part de personnes menaçant de divulguer leurs informations confidentielles. En outre, les professionnels peuvent subir une atteinte à leur réputation et un harcèlement en ligne lorsque leurs préférences personnelles sont rendues publiques. Cela peut nuire à leurs relations, à leurs perspectives de carrière et à leur statut social.
Dans cette optique, recherchez et sélectionnez des moyens efficaces de mieux sécuriser les identités en ligne et de dépersonnaliser les données. Par exemple, vous pouvez remplacer des caractères, supprimer des identifiants directs ou généraliser. Vous protégez ainsi les données sensibles des cybercriminels tout en aidant les organisations grâce à vos conclusions.
3. Éliminer les préjugés
Les scientifiques des données s’appuient sur les statistiques pour être aussi objectifs que possible. Pourtant, malgré ces efforts, les préjugés persistent, car l’idée que les données plus importantes sont plus précises est l’un des mythes les plus répandus dans le domaine de la science des données.
Il y a une part de vérité, mais malheureusement, les données volumineuses contiennent parfois des éléments et des statistiques inutiles ou erronés. Ainsi, plutôt que de vous concentrer sur les seuls chiffres, assurez-vous que vos données sont propres et représentatives.
Le nettoyage ou le filtrage des données avant leur utilisation sont d’excellentes méthodes pour lutter contre les biais. Par exemple, vous pouvez vérifier s’il y a des erreurs ou utiliser un échantillonnage stratifié pour garantir la représentativité des données.
4. Ne pas fabriquer ou inventer des résultats
La fabrication est une forme d’inconduite en matière de données et de fraude en matière de recherche qui consiste à inventer des résultats et à les présenter comme vrais.
Par exemple, un scientifique des données peut déclarer qu’un médicament n’a pas d’effets secondaires pour la plupart des membres d’un certain groupe d’âge. Ces résultats seraient fabriqués s’il n’y avait pas d’expériences médicales initiales et de données collectées pour les étayer.
La fabrication a des conséquences graves et négatives pour les scientifiques des données et ceux qui s’appuient sur leur travail. Elle peut détruire votre crédibilité, entacher la réputation de votre organisation, nuire au public ou vous exposer à des risques juridiques.
5. Ne pas falsifier ou manipuler les preuves
La falsification est la manipulation de la réalité, des données collectées pour répondre à un agenda. Alors que les fabricants inventent des résultats à partir de données inexistantes pour étayer leurs affirmations, les falsificateurs s’efforcent de réfuter des données réelles et existantes pour des raisons personnelles. Pour ce faire, ils peuvent trafiquer le matériel de recherche, modifier ou omettre complètement des données.
La falsification peut nuire au public en fournissant de fausses informations qui affectent la prise de décision dans divers secteurs. Par exemple, la falsification d’une étude sur un médicament peut exposer les gens à des risques inutiles, à des traitements inefficaces ou à des effets secondaires nocifs. Elle peut également entraîner une perte d’argent, de temps ou de matériel qui aurait pu être utilisé à d’autres fins.
La fabrication et la falsification sont des pratiques peu scrupuleuses qui ont des effets néfastes et entraînent de nombreuses sanctions. Celles-ci peuvent inclure des amendes, la révocation de l’accréditation, la perte du financement de la recherche ou l’incarcération.
6. Faire preuve de transparence
La transparence pour les scientifiques des données signifie être honnête sur les méthodes appliquées pour collecter, analyser et présenter les données. Les scientifiques des données doivent être ouverts et prêts à partager leurs pratiques avec d’autres scientifiques des données et les participants à l’étude.
En outre, vous devez obtenir le consentement des participants à l’étude, car la publication de résultats sans consentement éclairé peut manquer de respect ou nuire aux participants de diverses manières. Ils peuvent porter atteinte à leur dignité, à leur vie privée et à leur autonomie ou les exposer à des risques nocifs et inutiles résultant de l’étude.
La transparence permet d’instaurer un climat de confiance avec les personnes qui s’appuient sur vos données pour obtenir des informations. Elle garantit également la qualité des données en permettant à d’autres personnes d’examiner vos résultats.
En outre, l’ouverture entre les scientifiques des données favorise la collaboration et l’apprentissage. Vous pouvez favoriser l’innovation en partageant votre processus et en communiquant les meilleures méthodes de visualisation des données et les techniques de science des données à vos pairs tout en apprenant d’eux.
7. Collecter des données en toute sécurité
Les scientifiques des données doivent confirmer la sécurité des méthodes utilisées pour collecter, analyser et stocker les données. Cela permet d’éviter d’éventuelles violations de données susceptibles d’affecter les scientifiques et les participants à l’étude.
Les violations de données mettent en péril la sécurité des personnes, sapent la confiance du public et révèlent l’incompétence de l’organisation, ce qui entraîne des pertes financières considérables pour l’entreprise. Ces pertes peuvent prendre la forme de poursuites judiciaires intentées par les victimes de la violation de données, d’une diminution de la clientèle, etc.
Dans ce contexte, vous devez mener des recherches pour trouver les solutions les plus efficaces en matière de sécurité des données et les appliquer. Par exemple, vous pouvez sécuriser les connexions avec le cryptage TLS/SSL ou utiliser des proxys rotatifs. Vous pouvez également appliquer des mesures de contrôle d’accès et créer des sauvegardes en cas d’attaque. Lorsque vous aurez trouvé des solutions, n’oubliez pas de les partager avec d’autres personnes afin de garantir une sécurité maximale.
8. Utiliser les algorithmes de manière responsable
Les algorithmes ne sont pas seulement des outils d’analyse de données. Ils ont une influence considérable sur la vie, les comportements et les opportunités des gens. Cependant, bien qu’ils aident à résoudre des problèmes et à faire des prédictions innovantes, ils sont également imparfaits.
S’ils ne sont pas conçus, testés ou déployés avec soin, les algorithmes ont des répercussions sociales et éthiques qui peuvent nuire à certains groupes de personnes. Ils introduisent également des biais s’ils sont formés sur des données qui reflètent des préjugés existants et peuvent être imprévisibles. Les scientifiques des données doivent donc les concevoir et les utiliser de manière responsable.
Choisissez toujours des algorithmes appropriés, testez leurs performances et expliquez leur fonctionnement. Veillez également à identifier les sources potentielles de biais et à mettre en œuvre des mécanismes de mise à jour ou de correction si nécessaire.
9. Considérez les implications à long terme de votre travail
Votre travail en tant que scientifique des données aura un impact significatif sur de nombreux aspects de la société. Pensez donc toujours à l’impact de vos modèles sur les gens.
Par exemple, efforcez-vous de vous demander si votre travail peut perpétuer les préjugés et les inégalités ou mettre en péril la vie privée à l’avenir. Ensuite, répondez de manière adéquate à ces préoccupations.
Notez qu’une perspective orientée vers l’avenir est plus importante que n’importe quelle méthode corrective, et que la réflexion sur les jours à venir est l’un des moyens les plus efficaces de prendre des décisions éthiques.
Vous devez faire preuve d’éthique en tant que scientifique des données
En tant que data scientist, vous recevez un pouvoir qui s’accompagne d’une responsabilité proportionnelle. Vos compétences sont rares, vous êtes donc à la pointe de la prise de décision au sein de l’organisation.
Vos décisions ont une incidence sur tout, des plans d’affaires des entreprises aux systèmes de justice pénale. Vous ne devez donc pas les prendre à la légère. Soyez toujours honnête, éthique et méticuleux dans votre travail pour protéger les gens des dilemmes éthiques existants dans votre secteur et dans d’autres domaines technologiques.
