Scraper légal SERP : SerpAPI, Google CSE, Perplexity (2025)

Evaluez cet article !
[Total: 0 Moyenne : 0]

Scraper « légal » de SERP & veille : SerpAPI, Google CSE, Perplexity API — coûts & limites (2025)

TL;DR : Scraper directement Google viole ses conditions d’utilisation — la voie « légale » passe par l’API Programmable Search (CSE) ou par des agrégateurs conformes côté fournisseur. Pour la veille SEO/SEA à volume, SerpAPI simplifie l’accès aux SERP (coût au 1 000 de 5,50 à 15 $ selon le palier), tandis que Google CSE facture officiellement 5 $ / 1 000 requêtes (jusqu’à 10 k/jour). Perplexity API n’est pas une API de SERP : c’est une API de recherche + LLM facturée aux tokens et « request fees » — idéale pour la veille assistée par IA et les rapports.

Équipe analysant un tableau de bord de recherche et d’analytics
Image à la une : choisir la bonne voie d’accès aux SERP, entre conformité, coûts et scalabilité.

Cadre « légal » & définitions

Dans la mesure où Google interdit l’accès automatisé non autorisé à ses résultats, l’alternative conforme consiste à utiliser les offres officielles (Programmable Search Engine — CSE — et son Custom Search JSON API) ou à sous-traiter la collecte à un fournisseur tiers qui respecte ses propres cadres juridiques (ex. SerpAPI, qui fournit de la donnée de résultats). Important : les éléments ci-dessous sont informatifs et ne constituent pas un avis juridique ; en cas de doute, consultez votre juriste ou la CNIL.Terminologie : dans l’article, on appelle « scraper » tout outil qui renvoie la donnée de SERP ; « veille » recouvre le suivi périodique de mots-clés, concurrents, auteurs, produits et actualités.

Panorama des options : SerpAPI, Google CSE, Perplexity API

1) SerpAPI (agrégateur de SERP)

Ce que c’est : un service qui fournit des résultats Google (et autres moteurs) au format JSON, via des endpoints (Google Search, Images, News, Maps, etc.). L’intérêt est de déporter la complexité anti-bot et l’infrastructure. Les plans 2025 vont de 250 requêtes gratuites/mois à des paliers 5k, 15k, 30k et 100k–500k/mois ; la FAQ précise qu’une recherche facturée = une requête réussie (peu importe le nombre de résultats retournés).

  • Atouts : simplicité, large couverture d’API (News, Local, Images…), U.S. Legal Shield sur certains plans, haute tolérance de débit.
  • Limites : coût par 1 000 supérieur au CSE officiel à bas volume ; dépendance à un tiers ; aspects juridiques à valider selon vos usages.
Lire aussi  Comparatif des outils de netlinking : pour quels besoins choisir Ahrefs, SEMrush ou Moz ?

2) Google Programmable Search (CSE) & Custom Search JSON API

Ce que c’est : la voie officielle pour afficher/obtenir des résultats issus de votre moteur Programmable Search. L’API JSON fournit 100 requêtes/jour gratuites, puis 5 $ / 1 000 jusqu’à 10 000 requêtes/jour. Techniquement, l’endpoint cse.list renvoie 10 résultats par page et 100 résultats maximum par requête (pagination par start et num).

  • Atouts : conformité Google, coût faible et prévisible, intégration simple côté serveur ou client.
  • Limites : quota/jour plafonné à 10k (Google n’augmente plus au-delà), et 100 résultats max par requête. La variante « Site Restricted JSON API » a cessé de répondre au 8 janvier 2025 (migration vers Vertex AI Search recommandée).

3) Perplexity API (recherche + LLM, pas une API de SERP)

Ce que c’est : une API d’AI-search qui interroge le web et génère une synthèse sourcée via différents modèles (Sonar, Sonar Pro, Sonar Reasoning, Deep Research). La facturation est hybride : tokens (de 1 $ à 15 $ / 1 M selon le modèle) + « request fee » liée au contexte de recherche. Deep Research facture aussi les recherches web internes (~5 $ / 1 000 requêtes de recherche), avec des exemples de coût fournis (p. ex. 0,153 $ pour un run à 30 recherches).

  • Atouts : réponses contextualisées avec sources, idéal pour la veille éditoriale, les résumés d’actualité, les comparatifs et les rapports.
  • Limites : ce n’est pas une API de SERP « brute » ; rate limits par palier (Tier 0 : 50 RPM sur sonar, 5 RPM sur deep-research), coûts variables selon le volume de recherches internes.
Développeur intégrant des APIs de recherche dans un projet
Intégration : JSON simple chez SerpAPI & CSE ; SDK/REST compatible OpenAI chez Perplexity.

Tarifs, quotas & limites — tableau comparatif

SolutionTypeGratuitPrix indicatifsCoût ≈ / 1 000Quotas & limites clés
SerpAPIAgrégateur SERP250/moisDev 5 k → 75 $/mo • Prod 15 k → 150 $/mo • Big Data 30 k → 275 $/mo • High Volume 100 k → 725 $/mo, 250 k → 1 475 $/mo, 500 k → 2 750 $/mo15 $ → 5,50 $« 1 recherche réussie = 1 crédit » ; nombreuses verticales (News, Local, Images…).
Google CSE (Custom Search JSON API)Officiel Google100/jour5 $ / 1 000 requêtes (jusqu’à 10 000/jour)5 $10 résultats/page, 100 max/requête ; au-delà de 10k/jour : non extensible ; « Site Restricted » arrêté le 08/01/2025.
Perplexity APIAI + rechercheTokens (1–15 $ / 1 M) + request fee (p.ex. 0,005 $ pour Sonar web search) ; Deep Research facture en plus les « search queries » (~5 $ / 1 000)≈ 5,7 $ / 1 000 (ex. Sonar 500 in + 200 out)Rate limits par « Tier » (Tier 0 : 50 RPM Sonar, 5 RPM Deep Research) ; pas une API de SERP brute.

Lecture de coût : pour Perplexity, le coût varie selon les tokens et le nombre de recherches effectuées par le modèle (Deep Research). Pour SerpAPI, le coût est linéaire par requête réussie. Pour CSE, il est linéaire par requête facturable et plafonné par jour.

Lire aussi  Mise à jour des métriques sur eReferer : fréquences réelles, décalages et bonnes pratiques (2025)

Cas d’usage de veille (SEO, médias, produits)

SEO/SEA — suivi Top 10 & featured snippets

  • Volume modéré (≤ 10 k/j) : CSE convient si votre PSE « cherche sur tout le web ». Pensez au sampling (un jour sur deux) pour rester sous le plafond.
  • Volume élevé (> 10 k/j, multi-pays, images/news) : SerpAPI est plus simple à opérer (quotas élevés, endpoints dédiés News/Images/Local).

Veille éditoriale & concurrence

Perplexity API brille pour résumer et sourcer les tendances (communiqués, blogs, docs techniques, presse) en fournissant une réponse + les liens. Idéal pour des briefs de marché, newsletters ou tableaux de bord executive.

Veille locale/avis

Pour surveiller Google Maps/Local (avis, positions, heures), la voie la plus pragmatique passe par les endpoints dédiés d’un agrégateur (SerpAPI) plutôt que CSE.

Clavier, écran et smartphone illustrant la surveillance et l’automatisation
Veille moderne : combiner données brutes (SERP) et synthèses IA pour décider plus vite.

Mise en place : pas à pas et snippets

A) Google CSE (Custom Search JSON API)

  1. Créez un Programmable Search Engine (PSE) et récupérez cx (Search Engine ID) + key API.
  2. Activez la facturation si vous dépassez 100/jour ; fixez un quota quotidien dans Google Cloud pour maîtriser la dépense.
  3. Implémentez l’appel serveur :
curl "https://www.googleapis.com/customsearch/v1?key=VOTRE_CLE&cx=VOTRE_CX&q=mot+cle&num=10&start=1"

Rappels : num ≤ 10 ; 100 résultats max par recherche (paginez via start).

B) SerpAPI

  1. Créez une clé, choisissez l’endpoint (Search, News, Images…)
  2. Testez au Playground puis passez en prod :
curl "https://serpapi.com/search.json?q=mot+cle&engine=google&api_key=VOTRE_CLE&hl=fr&gl=fr&num=10&start=0"

Comptage : 1 réponse réussie = 1 crédit (peu importe le nombre de résultats).

C) Perplexity API

  1. Créez un groupe d’API, consultez votre Tier (détermine les RPM).
  2. Choisissez le modèle (p. ex. sonar pour Q/R rapides, sonar-deep-research pour rapports).
curl https://api.perplexity.ai/chat/completions \
 -H "Authorization: Bearer $PPLX_KEY" -H "Content-Type: application/json" \
 -d '{"model":"sonar","messages":[{"role":"user","content":"Fais un résumé sourcé des nouveautés SEO du mois"}]}'

Coût = tokens + request fee ; Deep Research ajoute des « search queries » internes.

Lire aussi  8 algorithmes de marketing automation pour booster vos conversions

Combien prévoir ? Scénarios budgétaires

ScénarioHypothèsesEstimation mensuelleCommentaire
Suivi 1 000 mots-clés hebdo (Top 10)4 passages/mois × 1 000 requêtes = 4 000CSE ≈ 20 $ ; SerpAPI ≈ 60–75 $ ; Perplexity (sonar) ≈ 23 $**sonar ~0,0057 $/requête (hyp. 500 in + 200 out + request fee)
Veille multi-pays intensive100 k requêtes/mois (SERP + News)SerpAPI plan 100k : 725 $Avantage : endpoints spécialisés (News, Local), débit élevé.
Rapports mensuels « Deep Research »1 000 runs × 30 recherches internes/run≈ 153 $ (recherches) + tokensBasé sur l’exemple de coût Deep Research.
Salle serveurs et réseau illustrant la montée en charge
Au-delà de 10 k/jour, CSE atteint son plafond : prévoyez une architecture hybride ou un agrégateur.

Risques, conformité & bonnes pratiques

  • Respecter les ToS : n’automatisez pas d’appels directs à google.com ; préférez CSE (officiel) ou un fournisseur tiers.
  • Limiter les données personnelles (RGPD/CNIL) : anonymisez les logs, minimisez les champs conservés, définissez une base légale de traitement.
  • Maîtriser la dépense : sur CSE, fixez un quota/jour dans GCP ; sur SerpAPI, surveillez le compteur de crédits ; sur Perplexity, monitorez tokens et request fees.
  • Transparence interne : documentez vos sources et licéité d’accès aux données (notamment pour la presse).

Règle d’or : si la donnée est stratégique et sensible (médias protégés, paywalls), privilégiez des licences et/ou des APIs officielles de ces éditeurs.

Tendances 2025

  • Fin du « Site Restricted JSON API » (8 janvier 2025) et poussée vers Vertex AI Search.
  • AI + Search : montée des workflows de veille augmentée (requêtes → synthèses sourcées → dashboard).
  • Durcissement anti-bot : CAPTCHAs, rendu JS, signaux comportementaux → intérêt d’agrégateurs spécialisés.

FAQ — Scraper « légal » de SERP & veille

Scraper Google est-il légal ? Automatiser des requêtes directement vers google.com enfreint ses conditions d’utilisation. La voie recommandée : Programmable Search (CSE) via l’API officielle, ou un fournisseur tiers (ex. SerpAPI) qui opère l’infrastructure de collecte et vous livre les résultats. Google CSE suffit-il pour un suivi SEO à grande échelle ? Oui jusqu’à 10 000 requêtes/jour (100 gratuites), avec 10 résultats/page et 100 max par requête. Au-delà, basculez vers un agrégateur ou distribuez la charge sur plusieurs projets/moteurs (dans le cadre des règles). SerpAPI vs CSE : que choisir ? CSE si vous restez ≤ 10 k/j et cherchez le coût minimal (5 $ / 1 000). SerpAPI si vous avez besoins multi-verticaux (News, Local, Images), un gros volume mensuel (jusqu’à 500k+) et un débit élevé. Perplexity API peut-elle remplacer une API de SERP ? Non. Elle complète l’accès aux SERP par de la veille augmentée (synthèses sourcées). Pour des tableaux de classement bruts, utilisez CSE/SerpAPI ; pour des briefs et rapports, Perplexity est pertinente. Combien coûte Perplexity API pour la veille quotidienne ? En mode sonar, comptez environ 0,0057 $ / requête pour 500 tokens d’entrée + 200 de sortie + « request fee » indicative. Deep Research ajoute ~0,005 $ par recherche web interne (ex. 30 recherches ≈ 0,15 $ / run) + tokens. Peut-on dépasser 10 k/jour sur CSE ? Non, Google n’accorde plus d’extensions au-delà du plafond de 10 k/j. Prévoyez une architecture hybride (CSE + agrégateur) si nécessaire.

Sources fiables



Evaluez cet article !
[Total: 0 Moyenne : 0]
Julie - auteure Com-Strategie.fr

Julie – Auteure & Fondatrice

Étudiante en journalisme et passionnée de technologie, Julie partage ses découvertes autour de l’IA, du SEO et du marketing digital. Sa mission : rendre la veille technologique accessible et proposer des tutoriels pratiques pour le quotidien numérique.

Laisser un commentaire