Comment générér 1000 leads qualifiés gratuitement grâce à DataGouv

Comment générér 1000 leads qualifiés gratuitement grâce à DataGouv
(Oui, l’État met déjà tout à disposition… et personne n’en parle.)

L’autre jour, je me suis retrouvé face à une problématique simple : comment créer une base de prospection massive, ciblée et fiable… sans payer 99 € ou 149 €/mois pour Apollo, Clay ou Apify ?
Je savais que la donnée publique existait, mais je n’avais jamais exploité correctement l’API SIRENE. Puis j’ai découvert que l’État offrait non seulement la base complète, mais aussi un quota très large et totalement gratuit. À partir de là, tout a changé.

J’ai monté un système qui tourne seul, sans intervention humaine, et qui génère des milliers de contacts enrichis. Dans cet article, je vous partage les scénarios les plus utiles, les gains réels et le fonctionnement concret.

1) +150 % de volume de leads grâce à l’API SIRENE

J’ai d’abord commencé par un simple constat : la base SIRENE contient tout ce que j’achète habituellement ailleurs.
On y trouve : le SIREN, l’adresse, les dirigeants, le code APE, la date de création et parfois les effectifs. Et surtout, le tout est mis à jour quotidiennement.

Comment j’ai procédé
J’ai configuré n8n pour interroger automatiquement les pages de l’API, secteur par secteur. Le filtre APE fait presque tout le travail. En 40 minutes, j’avais parcouru plus de 30 000 fiches d’entreprises.

Exemple concret
Je voulais cibler les agences marketing en région Auvergne–Rhône-Alpes.
→ Je lance n8n avec le code APE 7311Z + zone géographique.
→ Le workflow récupère les entreprises, page après page, sans aucune limite.
→ La base se remplit seule, sans clics.

Résultat : une liste brute mais fiable de quelques milliers d’entreprises. Coût : 0 €.

2) 10 à 20 minutes gagnées par prospect grâce à un enrichissement automatique

La donnée brute est utile, mais incomplète. Pour que les leads soient actionnables, j’avais besoin du site web, du bon email, du numéro du dirigeant et de quelques signaux d’intention.

J’ai donc relié Perplexity à n8n pour enrichir chaque entreprise en temps réel.
Le modèle cherche :

  • le site web officiel,
  • l’email du contact clé,
  • le numéro de téléphone,
  • le rôle exact du dirigeant,
  • parfois une info utile (derniers recrutements, spécialisation réelle).

Exemple précis
Une agence affichée comme “communication” dans SIRENE était en réalité une structure 100 % brand content, avec seulement deux employés mais un portfolio solide. Perplexity m’a renvoyé :
→ le site,
→ l’email direct de la fondatrice,
→ un extrait de leur positionnement,
→ une estimation de l’équipe.

Ce sont exactement les informations que je passais mon temps à chercher à la main.

3) +40 % de qualité lead grâce à la préqualification automatique post-R1

Lors d’un premier échange, je n’ai jamais toutes les informations pour juger si un prospect vaut la peine d’aller en R2.
J’ai donc connecté mon CRM à un second workflow : dès qu’un call se termine, le nom de l’entreprise part dans n8n.

Le système :
→ récupère la fiche SIRENE,
→ analyse le dirigeant,
→ vérifie la taille réelle de la société,
→ enrichit avec Perplexity (site, mentions publiques, crédibilité).

Exemple concret
Une entreprise se présentait comme une agence “tech”. SIRENE révélait une activité immobilière. Perplexity confirmait qu’aucune présence digitale n’existait. J’ai stoppé l’effort commercial immédiatement.

C’est une économie directe de temps et d’énergie.

4) + de pertinence sur mes campagnes outbound grâce à un ciblage précis

Avant chaque séquence outbound, je reconstitue une base précise. Je filtre :
→ secteur,
→ zone,
→ taille,
→ spécialisation réelle.

L’API SIRENE me donne le socle. Perplexity apporte le contexte. Airtable (ou autre BDD) organise le tout.
Je sais exactement quelles entreprises appartiennent à mon marché, et dans quel sous-segment les placer.

Exemple réel
Pour cibler uniquement les agences SEO de plus de 3 employés, j’ai :

  • extrait toutes les agences APE 6202A,
  • filtré celles avec un effectif affiché,
  • enrichi les autres avec Perplexity pour détecter leur équipe réelle,
  • segmenté automatiquement dans Airtable.

La base obtenue était plus propre que n’importe quelle base vendue sur abonnement.

5) Un système totalement autonome : 10 000 contacts exploitables en quelques heures

Quand j’ai assemblé tous les blocs (DataGouv → n8n → Perplexity → Airtable), j’ai compris que j’avais construit un moteur autonome.
Il travaille pendant que je fais autre chose.

Dans la pratique :
→ n8n parcourt automatiquement les pages de l’API,
→ Perplexity enrichit chaque fiche,
→ Airtable s’occupe d’empiler, nettoyer et dédupliquer.

Aucun travail manuel.
Aucun abonnement payant.
Aucune limite sérieuse (400 appels/minute, largement suffisant).

Exemple final
Ma base dans Airtable contient aujourd’hui plus de 10 000 entreprises qualifiées dans des niches variées.
Toutes sont actionnables immédiatement.
Aucune ne m’a coûté un centime.


Pourquoi c’est un vrai changement dans ma manière de prospecter

Je n’ai plus besoin de payer pour des bases intermédiaires.
Je ne dépends plus d’outils qui bloquent l’export.
Je ne passe plus mes soirées à chercher les coordonnées des dirigeants.

L’État fournit la donnée brute.
Les modèles d’enrichissement font le reste.
Les outils d’automatisation orchestrent tout.

Ce système me donne un avantage opérationnel réel, sans surcoût mensuel.

Ci-dessous un blueprint d'enrichissement n8n via API Sirene / Pappers.

Blueprint - workflow n8n

Contient le workflow n8n variabilisé et prêt à être collé dans votre instance.

Descend pour télécharger ton blueprint n8n

Read more