La pratique du data scraping consiste à « aspirer » les données d’un site internet par le biais, ou non, d’un logiciel d’extraction. Connue également sous le nom de web scraping, web data mining ou encore web harvesting, elle permet d’analyser les sites de ses concurrents, de surveiller la réputation d’une marque, d’obtenir des informations rendues publiques par une personne (sur les réseaux sociaux, par exemple), etc. Mais alors, est-ce bien légal ? Tout dépend de la manière de faire et de l’utilisation des données collectées ! Voici un récapitulatif des précautions à prendre avant de s’essayer à cette technique.
Avant de récolter les données d’un site, il faut s’assurer que l’on n’enfreint pas les CGU de ce dernier. Par exemple, LinkedIn interdit la collecte automatisée de données d’utilisateurs et leur réutilisation à des fins commerciales. C’est d’ailleurs pour cette raison que la plateforme a récemment intenté un procès à hiQ Labs suite à la mise en vente des données de millions de profils.
Ce n’est pas parce que des informations sont disponibles publiquement sur Internet qu’elles sont librement réutilisables. En particulier s’il s’agit de données personnelles, à savoir toute information personnelle identifiable qui peut servir à identifier une personne physique. Dans ce cas, il faut faire attention au règlement général sur la protection des données et celui-ci diffère selon les zones géographiques.Dans l’Espace Économique Européen, par exemple, le RGPD autorise le data scraping du moment que :
En plus de ces précautions, la Commission nationale de l’informatique et des libertés recommande l’adoption de quelques réflexes avant de recourir à un logiciel d’extraction de données. Après avoir vérifié les CGU, il est conseillé d’effectuer une analyse d’impact relative à la protection des données (AIPD). Celle-ci n’est pas obligatoire, mais elle permet de s’assurer que le traitement des données collectées respecte bien le RGPD.Enfin, les données destinées au démarchage téléphonique doivent être réduites au strict minimum. Les entreprises doivent faire le nécessaire pour éviter de récolter des données excessives ou non pertinentes (informations sur la santé, la religion, la sexualité…).En résumé, le data scraping n’est pas illégal, mais demande la mise en œuvre d’un certain nombre de mesures et de vérifications. Négliger ces précautions peut induire un risque en matière de protection des données, mais aussi au niveau du droit de la concurrence, de la propriété intellectuelle, voire même du droit pénal si l’on considère l’intention comme frauduleuse. Le bénéfice tiré de cette technique en vaut-il vraiment la peine ? À vous d’en juger.
Vous souhaitez bénéficier d’un regard juridique et technique professionnel sur vos pratiques digitales ? Data Need Advice peut vous accompagner ! DPO certifiés AFNOR et Délégués à l’éthique numérique nous mettons tout notre savoir-faire à votre service. Alors, n’attendez plus, contactez-nous.