La généralisation des assistants IA dans notre quotidien numérique soulève une question fondamentale, trop souvent reléguée au second plan : quelles données collectent-ils et dans quels buts?
Une étude menée par Surfshark sur les dix chatbots les plus téléchargés de l’App Store d’Apple apporte des éléments de réponse — et invite à la vigilance…
Les assistants IA aiment vos données
Principal enseignement de cette étude : toutes les applications d’IA analysées collectent des données utilisateurs.
Sans exception, chacune des applications recueille au minimum une catégorie d’informations personnelles — et la moyenne grimpe à 14 types de données sur les 35 répertoriées.

Parmi les informations les plus convoitées, la géolocalisation trône en tête : près de sept applications sur dix y ont recours.
Mais ce n’est pas tout. Les coordonnées de contact, les contenus produits par les utilisateurs, ainsi que les historiques de recherche et de navigation figurent eux aussi parmi les données les plus couramment aspirées.
Ce qui interpelle davantage, c’est l’usage qui en est fait.
Ces informations ne servent pas uniquement à faire tourner les services : une part significative alimente des logiques d’analyse comportementale, de personnalisation ciblée, voire de prospection commerciale.
Une exposition aussi étendue ne va pas sans risques — une fuite ou une intrusion suffisant à transformer ces précieux gisements de données en véritable bombe à retardement pour la vie privée des utilisateurs…
Meta AI (très) loin devant
Meta AI s’impose comme le champion toutes catégories de la collecte de données, en aspirant 33 types de données sur 35 possibles — soit 95 % du spectre disponible.
L’application est la seule à s’aventurer dans la catégorie des informations financières, et collecte aux côtés de Google Gemini des données sensibles au sens strict du terme : origines ethniques, orientation sexuelle, convictions religieuses, opinions politiques ou encore données biométriques.
Cette omniprésence de Meta dans la collecte n’est pas sans rappeler le modèle économique historique du groupe, fondé sur la monétisation publicitaire de profils utilisateurs détaillés.
Pour les marques qui envisagent Meta AI comme un levier marketing, la question de la réciprocité des données mérite d’être posée explicitement…
ChatGPT : une appétit en forte croissance
OpenAI ne ménage pas ses efforts en matière de collecte. Selon les déclarations des développeurs sur l’App Store, ChatGPT recueille désormais 17 types de données, contre 10 lors de la dernière revue annuelle — une hausse de 70 % en un an.
Parmi les nouveaux points d’entrée : la localisation approximative, des données de santé et fitness, l’historique de recherche, les données audio, ainsi que des informations à visée publicitaire.
Si la majorité de ces collectes est justifiée par des impératifs fonctionnels, plusieurs usages secondaires sont clairement identifiés : analyse comportementale, personnalisation produit, marketing du développeur, et jusqu’à la publicité tierce. Des finalités qui dépassent le strict cadre de l’assistance conversationnelle.
Claude : une approche plus fonctionnelle…
De son côté, Claude affiche une certaine stabilité : 13 types de données collectés, tous nécessaires au fonctionnement (sécurité, performance, support, etc.)
Cependant, ces données peuvent aussi être exploitées pour l’Analytics (10 types) ou le Marketing (7 types).
Contrairement à ChatGPT, Claude ne mentionne pas explicitement d’usage pour la publicité tierce ou la personnalisation avancée, ce qui traduit une approche légèrement plus conservatrice.
Le cas DeepSeek : une opacité géopolitique
DeepSeek, l’outsider chinois qui a bousculé l’écosystème IA début 2025, collecte 13 types de données — dont la localisation approximative et l’historique de recherche.
Mais c’est moins le volume qui inquiète que la destination : les données sont stockées sur des serveurs situés en Chine, pour une durée indéterminée.
Une fuite de données confirmée, portant sur plus d’un million d’enregistrements incluant des historiques de conversation et des clés API, a déjà illustré concrètement les risques inhérents à ce type de stockage.
Pour les entreprises manipulant des informations sensibles, l’utilisation de DeepSeek doit être soumise à une analyse de risque sérieuse.
Ce que cela change pour les professionnels du marketing
L’enjeu dépasse le simple cadre de la vie privée individuelle.
Pour les équipes marketing, les directions juridiques et les DPO, le choix d’un chatbot IA intégré aux workflows internes n’est pas anodin.
Les données saisies dans ces outils — briefs, données clients, orientations stratégiques — peuvent nourrir des pipelines d’analyse, de personnalisation ou de ciblage publicitaire selon les conditions d’utilisation acceptées.
À l’heure où la conformité RGPD s’intensifie et où les transferts de données hors UE font l’objet d’une surveillance renforcée, connaître précisément ce que collecte son assistant IA n’est plus optionnel, c’est désormais une obligation.
Méthodologie :
Analyse des fiches de confidentialité de l’App Store Apple pour les dix principaux chatbots IA, complétée par la lecture des politiques de confidentialité de DeepSeek et ChatGPT, réalisée au 20 mai 2025. Les données de collecte sont déclaratives — elles reflètent ce que les développeurs indiquent, et non un audit technique indépendant.
