data scraping

Juridique

Le data scraping, sérieusement ? Voilà ce dont vous devez vous assurer

Publié il y a 2 ans
La pratique du data scraping n'est pas illégale mais doit être très encadrée.
scraping

Juridique

Le data scraping, sérieusement ? Voilà ce dont vous devez vous assurer

Publié il y a 2 ans

Les points principaux

Définition Obligations Recommandations
La pratique du data scraping n'est pas illégale mais doit être très encadrée.

La pratique du data scraping consiste à « aspirer » les données d’un site internet par le biais, ou non, d’un logiciel d’extraction. Connue également sous le nom de web scraping, web data mining ou encore web harvesting, elle permet d’analyser les sites de ses concurrents, de surveiller la réputation d’une marque, d’obtenir des informations rendues publiques par une personne (sur les réseaux sociaux, par exemple), etc. Mais alors, est-ce bien légal ? Tout dépend de la manière de faire et de l’utilisation des données collectées ! Voici un récapitulatif des précautions à prendre avant de s’essayer à cette technique.

Lire les Conditions Générales d’Utilisation du site aspiré

Avant de récolter les données d’un site, il faut s’assurer que l’on n’enfreint pas les CGU de ce dernier. Par exemple, LinkedIn interdit la collecte automatisée de données d’utilisateurs et leur réutilisation à des fins commerciales. C’est d’ailleurs pour cette raison que la plateforme a récemment intenté un procès à hiQ Labs suite à la mise en vente des données de millions de profils.

Respecter plusieurs points du RGPD en vigueur

Ce n’est pas parce que des informations sont disponibles publiquement sur Internet qu’elles sont librement réutilisables. En particulier s’il s’agit de données personnelles, à savoir toute information personnelle identifiable qui peut servir à identifier une personne physique. Dans ce cas, il faut faire attention au règlement général sur la protection des données et celui-ci diffère selon les zones géographiques.Dans l’Espace Économique Européen, par exemple, le RGPD autorise le data scraping du moment que :

  • les données sont publiques et accessibles en ligne ;
  • les données personnelles sont stockées selon les recommandations de sécurité ;
  • les données ne sont pas vendues ou partagées sans le consentement explicite des personnes concernées ;
  • le droit d’opposition des individus est respecté.

Data scraping : les recommandations de la CNIL

En plus de ces précautions, la Commission nationale de l’informatique et des libertés recommande l’adoption de quelques réflexes avant de recourir à un logiciel d’extraction de données. Après avoir vérifié les CGU, il est conseillé d’effectuer une analyse d’impact relative à la protection des données (AIPD). Celle-ci n’est pas obligatoire, mais elle permet de s’assurer que le traitement des données collectées respecte bien le RGPD.Enfin, les données destinées au démarchage téléphonique doivent être réduites au strict minimum. Les entreprises doivent faire le nécessaire pour éviter de récolter des données excessives ou non pertinentes (informations sur la santé, la religion, la sexualité…).En résumé, le data scraping n’est pas illégal, mais demande la mise en œuvre d’un certain nombre de mesures et de vérifications. Négliger ces précautions peut induire un risque en matière de protection des données, mais aussi au niveau du droit de la concurrence, de la propriété intellectuelle, voire même du droit pénal si l’on considère l’intention comme frauduleuse. Le bénéfice tiré de cette technique en vaut-il vraiment la peine ? À vous d’en juger.

Vous souhaitez bénéficier d’un regard juridique et technique professionnel sur vos pratiques digitales ? Data Need Advice peut vous accompagner ! DPO certifiés AFNOR et Délégués à l’éthique numérique nous mettons tout notre savoir-faire à votre service. Alors, n’attendez plus, contactez-nous.

Du même thème

Nous utilisons
des cookies.

Il s'agit de petits fichiers déposés sur votre machine pour un temps défini (et pas plus). Certains sont techniquement nécessaires, les autres sont utiles au bon fonctionnement de notre site ("statistiques").

En savoir plus

Ce site web,
comme la plupart,
utilise des cookies.

Vous pouvez les accepter ou vous y opposer, à vous de voir. Mais laissez-nous vous expliquer le pourquoi du comment, afin d'éclairer votre choix :

Sur internet, la collecte et le traitement des données sont omniprésents, et peuvent résulter d'une simple navigation sur un site web.....grâce à ces petites choses que l'on appelle les "Cookies". Il s'agit de petits fichiers déposés sur votre machine pour un temps défini (et pas plus), permettant de conserver des données relatives à votre navigation.
Comme notre site n'échappe pas à la règle, nous utilisons des Cookies.
Certains sont techniquements nécessaires. D'autres sont des outils pour analyser notre trafic (en prenant soin de ne pas vous identifier), utiles au bon fonctionnement de notre site et à sa sécurité. Vous pouvez accepter ou vous opposer à leur dépôt.

Les cookies nécessaires

Les cookies nécessaires contribuent à rendre un site Web utilisable en activant des fonctions de base comme la navigation de page et l'accès aux zones sécurisées du site Web. Le site Web ne peut pas fonctionner correctement sans ces cookies. C'est la raison pour laquelle votre consentement n'est pas requis.

Nom Fournisseur Expiration Type
dna_consent DNA 13 mois HTML
Stocke l'autorisation d'utilisation de cookies pour le domaine actuel par l'utilisateur.
dna_type DNA 10 minutes HTML
Ce cookie est utilisé pour distinguer les humains des robots.
dna_contact DNA 10 minutes JSON
Ce cookie est utilisé pour préremplir le formulaire de la page contact en fonction des actions de l'utilisateur.
SERVERID OVH Session HTML
Un cookie technique utilisé par notre hébergeur pour faire de la répartition de charge serveur.

Les cookies comme outils pour nos statistiques

Ces traceurs de mesure d'audience ont pour seul but l'élaboration de statistiques de fréquentation et de performance dans un souci de bon fonctionnement et d'amélioration de notre Site. Nous sommes les seuls à les utiliser, ils ne nous permettent pas un suivi global de votre navigation, et les statistiques émises sont strictement anonymes (réalisées par le biais de Matomo). Votre consentement n'est pas requis, mais vous pouvez vous opposer à leur utilisation en décochant la case correspondante. Cette opposition n'aura aucune incidence technique sur votre navigation.

Nom Fournisseur Expiration Type
_pk.id DNA - MATOMO 13 mois html
Utilisé pour stocker quelques détails à propos de l'utilisateur tel que son identifiant unique.
_pk.ses DNA - MATOMO 30 minutes HTML
Cookie à courte vie utilisé pour stocker temporaire des données sur la visite.
mtm_cookie_consent DNA - MATOMO 12 mois HTML
Est créé pour se souvenir du consementement de l'utilisateur pour stocker et utiliser des cookies statistiques.