Raspador legal de SERP: SerpAPI, Google CSE, Perplexity (2025)

Evaluez cet article !
[Total: 0 Moyenne : 0]

Scraper « legal » de SERP & vigilancia: SerpAPI, Google CSE, Perplexity API — costos & límites (2025)

TL;DR : Raspar directamente Google viola sus términos de uso — la vía « legal » pasa por la API Programmable Search (CSE) o por agregadores conformes del lado del proveedor. Para la vigilancia SEO/SEA a volumen, SerpAPI simplifica el acceso a las SERP (costo por 1 000 de 5,50 a 15 $ según el nivel), mientras que Google CSE cobra oficialmente 5 $ / 1 000 consultas (hasta 10 k/día). Perplexity API no es una API de SERP: es una API de búsqueda + LLM facturada por tokens y « request fees » — ideal para la vigilancia asistida por IA y los informes.

Equipo analizando un panel de búsqueda y analítica
Imagen destacada: elegir la vía correcta de acceso a las SERP, entre conformidad, costos y escalabilidad.

Marco « legal » & definiciones

En la medida en que Google prohíbe el acceso automatizado no autorizado a sus resultados, la alternativa conforme consiste en usar las ofertas oficiales (Programmable Search Engine — CSE — y su Custom Search JSON API) o subcontratar la recopilación a un proveedor tercero que respete sus propios marcos legales (ej. SerpAPI, que proporciona datos de resultados). Importante: los elementos a continuación son informativos y no constituyen un asesoramiento legal; en caso de duda, consulte a su abogado o a la CNIL.Terminología: en el artículo, se llama « scraper » a toda herramienta que devuelve datos de SERP; « vigilancia » cubre el seguimiento periódico de palabras clave, competidores, autores, productos y noticias.

Panorama de opciones: SerpAPI, Google CSE, Perplexity API

1) SerpAPI (agregador de SERP)

Qué es: un servicio que proporciona resultados de Google (y otros motores) en formato JSON, mediante endpoints (Google Search, Imágenes, Noticias, Maps, etc.). El interés es desplazar la complejidad anti-bot y la infraestructura. Los planes 2025 van desde 250 consultas gratuitas/mes hasta niveles de 5k, 15k, 30k y 100k–500k/mes; la FAQ precisa que una búsqueda facturada = una consulta exitosa (sin importar la cantidad de resultados devueltos).

  • Ventajas: simplicidad, amplia cobertura de API (Noticias, Local, Imágenes…), U.S. Legal Shield en algunos planes, alta tolerancia de tasa.
  • Límites: costo por 1 000 superior al CSE oficial en bajo volumen; dependencia de un tercero; aspectos legales a validar según sus usos.
Lire aussi  Tutorial: configurar Ryte Starter como una alternativa ligera a las plataformas SEO complejas

2) Google Programmable Search (CSE) & Custom Search JSON API

Qué es: la vía oficial para mostrar/obtener resultados de su motor Programmable Search. La API JSON ofrece 100 consultas/día gratuitas, luego 5 $ / 1 000 hasta 10 000 consultas/día. Técnicamente, el endpoint cse.list devuelve 10 resultados por página y 100 resultados máximo por consulta (paginación por start y num).

  • Ventajas: conformidad con Google, costo bajo y previsible, integración sencilla del lado servidor o cliente.
  • Límites: cuota/día limitada a 10k (Google no aumenta más allá), y 100 resultados máximo por consulta. La variante « Site Restricted JSON API » dejó de responder el 8 de enero de 2025 (se recomienda migrar a Vertex AI Search).

3) API Perplexity (búsqueda + LLM, no una API de SERP)

Qué es : una API de AI-search que consulta la web y genera una síntesis con fuentes mediante diferentes modelos (Sonar, Sonar Pro, Sonar Reasoning, Deep Research). La facturación es híbrida: tokens (de 1 $ a 15 $ / 1 M según el modelo) + « request fee » vinculada al contexto de búsqueda. Deep Research también cobra las búsquedas web internas (~5 $ / 1 000 consultas de búsqueda), con ejemplos de coste proporcionados (p. ej. 0,153 $ para una ejecución con 30 búsquedas).

  • Fortalezas : respuestas contextualizadas con fuentes, ideal para la vigilancia editorial, resúmenes de actualidad, comparativas e informes.
  • Límites : no es una API de SERP «bruta»; límites de tasa por nivel (Tier 0: 50 RPM en sonar, 5 RPM en deep-research), costes variables según el volumen de búsquedas internas.
Desarrollador integrando APIs de búsqueda en un proyecto
Integración: JSON simple en SerpAPI & CSE; SDK/REST compatible con OpenAI en Perplexity.

Tarifas, cuotas y límites — tabla comparativa

SoluciónTipoGratisPrecios indicativosCosto ≈ / 1 000Cuotas y límites clave
SerpAPIAgregador SERP250/mesDev 5 k → 75 $/mes • Prod 15 k → 150 $/mes • Big Data 30 k → 275 $/mes • High Volume 100 k → 725 $/mes, 250 k → 1 475 $/mes, 500 k → 2 750 $/mes15 $ → 5,50 $« 1 búsqueda exitosa = 1 crédito »; numerosas verticales (Noticias, Local, Imágenes…).
Google CSE (Custom Search JSON API)Oficial Google100/día5 $ / 1 000 consultas (hasta 10 000/día)5 $10 resultados/página, 100 máx/consulta; más de 10k/día: no ampliable; « Site Restricted » finalizado el 08/01/2025.
Perplexity APIAI + búsquedaTokens (1–15 $ / 1 M) + request fee (p. ej. 0,005 $ para búsqueda web Sonar); Deep Research cobra además las « search queries » (~5 $ / 1 000)≈ 5,7 $ / 1 000 (ej. Sonar 500 in + 200 out)Límites de tasa por « Tier » (Tier 0: 50 RPM Sonar, 5 RPM Deep Research); no es una API de SERP bruta.

Interpretación del coste: para Perplexity, el coste varía según los tokens y el número de búsquedas realizadas por el modelo (Deep Research). Para SerpAPI, el coste es lineal por consulta exitosa. Para CSE, es lineal por consulta facturable y limitado por día.

Lire aussi  Tutorial paso a paso: usar Keyword Surfer como solución SEO de bajo costo

Casos de uso de vigilancia (SEO, medios, productos)

SEO/SEA — seguimiento Top 10 y fragmentos destacados

  • Volumen moderado (≤ 10 k/día): CSE es adecuado si su PSE « busca en toda la web ». Considere el muestreo (un día sí, un día no) para mantenerse bajo el límite.
  • Volumen alto (> 10 k/día, multi-país, imágenes/noticias): SerpAPI es más sencillo de operar (cuotas altas, endpoints dedicados a Noticias/Imágenes/Local).

Vigilancia editorial y competencia

La API Perplexity destaca para resumir y referenciar tendencias (comunicados, blogs, documentos técnicos, prensa) proporcionando una respuesta + los enlaces. Ideal para briefings de mercado, boletines o paneles de control ejecutivos.

Vigilancia local/opiniones

Para monitorear Google Maps/Local (reseñas, posiciones, horarios), la vía más pragmática pasa por los endpoints dedicados de un agregador (SerpAPI) en lugar de CSE.

Teclado, pantalla y smartphone ilustrando la vigilancia y automatización
Vigilancia moderna: combinar datos en bruto (SERP) y resúmenes IA para decidir más rápido.

Implementación: paso a paso y fragmentos

A) Google CSE (Custom Search JSON API)

  1. Creen un Motor de Búsqueda Programable (PSE) y obtengan cx (ID del Motor de Búsqueda) + key API.
  2. Activen la facturación si superan 100/día; establezcan un cuota diaria en Google Cloud para controlar el gasto.
  3. Implementen la llamada al servidor:
curl "https://www.googleapis.com/customsearch/v1?key=VOTRE_CLE&cx=VOTRE_CX&q=mot+cle&num=10&start=1"

Recordatorios: num ≤ 10; 100 resultados máximo por búsqueda (pagine mediante start).

B) SerpAPI

  1. Creen una clave, elijan el endpoint (Search, News, Images…)
  2. Prueben en el Playground y luego pasen a producción:
curl "https://serpapi.com/search.json?q=mot+cle&engine=google&api_key=VOTRE_CLE&hl=fr&gl=fr&num=10&start=0"

Conteo: 1 respuesta exitosa = 1 crédito (sin importar la cantidad de resultados).

C) Perplexity API

  1. Creen un grupo de API, consulten su Tier (determina las RPM).
  2. Elijan el modelo (p. ej. sonar para preguntas/respuestas rápidas, sonar-deep-research para reportes).
curl https://api.perplexity.ai/chat/completions 
 -H "Authorization: Bearer $PPLX_KEY" -H "Content-Type: application/json" 
 -d '{"model":"sonar","messages":[{"role":"user","content":"Fais un résumé sourcé des nouveautés SEO du mois"}]}'

Costo = tokens + tarifa por solicitud; Deep Research añade « consultas de búsqueda » internas.

Lire aussi  Solución Cemantix: ¿revolución SEO o simple efecto de moda?

¿Cuánto prever? Escenarios presupuestarios

EscenarioHipótesisEstimación mensualComentario
Seguimiento de 1,000 palabras clave semanales (Top 10)4 pasadas/mes × 1,000 consultas = 4,000CSE ≈ 20 $; SerpAPI ≈ 60–75 $; Perplexity (sonar) ≈ 23 $**sonar ~0,0057 $/consulta (hip. 500 in + 200 out + tarifa por solicitud)
Vigilancia intensiva multi-país100k consultas/mes (SERP + Noticias)Plan SerpAPI 100k: 725 $Ventaja: endpoints especializados (Noticias, Local), alto rendimiento.
Reportes mensuales « Deep Research »1,000 ejecuciones × 30 búsquedas internas/ejecución≈ 153 $ (búsquedas) + tokensBasado en el ejemplo de costo Deep Research.
Sala de servidores y red ilustrando la escalada de carga
Más de 10k/día, CSE alcanza su límite: prevean una arquitectura híbrida o un agregador.

Riesgos, conformidad y buenas prácticas

  • Respetar los ToS: no automatice llamadas directas a google.com; prefiera CSE (oficial) o un proveedor tercero.
  • Limitar los datos personales (RGPD/CNIL): anonimice los registros, minimice los campos conservados, defina una base legal para el tratamiento.
  • Controlar el gasto: en CSE, establezca una cuota diaria en GCP; en SerpAPI, supervise el contador de créditos; en Perplexity, monitoree tokens y tarifas de solicitud.
  • Transparencia interna: documente sus fuentes y la legalidad del acceso a los datos (especialmente para la prensa).

Regla de oro: si el dato es estratégico y sensible (medios protegidos, paywalls), privilegie licencias y/o APIs oficiales de estos editores.

Tendencias 2025

  • Fin del « Site Restricted JSON API » (8 de enero de 2025) y impulso hacia Vertex AI Search.
  • IA + Búsqueda: aumento de los flujos de trabajo de vigilancia aumentada (consultas → síntesis con fuentes → panel de control).
  • Endurecimiento anti-bot: CAPTCHAs, renderizado JS, señales de comportamiento → interés en agregadores especializados.

FAQ — Scraper « legal » de SERP y vigilancia

¿Es legal hacer scraping en Google? Automatizar consultas directamente a google.com infringe sus condiciones de uso. La vía recomendada: Programmable Search (CSE) vía la API oficial, o un proveedor tercero (ej. SerpAPI) que opera la infraestructura de recopilación y le entrega los resultados. ¿Es suficiente Google CSE para un seguimiento SEO a gran escala? Sí, hasta 10 000 consultas/día (100 gratuitas), con 10 resultados/página y 100 máximo por consulta. Más allá, cambie a un agregador o distribuya la carga en varios proyectos/motores (dentro de las reglas). SerpAPI vs CSE: ¿qué elegir? CSE si se mantiene ≤ 10 k/día y busca el costo mínimo (5 $ / 1 000). SerpAPI si necesita multi-verticales (Noticias, Local, Imágenes), un gran volumen mensual (hasta 500k+) y alta tasa. ¿Puede la API de Perplexity reemplazar una API de SERP? No. Ella complementa el acceso a SERP con vigilancia aumentada (síntesis con fuentes). Para tablas de clasificación brutas, use CSE/SerpAPI; para informes y reportes, Perplexity es pertinente. ¿Cuánto cuesta la API de Perplexity para vigilancia diaria? En modo sonar, cuente aproximadamente 0,0057 $ / consulta para 500 tokens de entrada + 200 de salida + tarifa indicativa de solicitud. Deep Research añade ~0,005 $ por búsqueda web interna (ej. 30 búsquedas ≈ 0,15 $ / ejecución) + tokens. ¿Se puede superar 10 k/día en CSE? No, Google ya no concede extensiones más allá del límite de 10 k/día. Planifique una arquitectura híbrida (CSE + agregador) si es necesario.

Fuentes confiables



Evaluez cet article !
[Total: 0 Moyenne : 0]
Julie - auteure Com-Strategie.fr

Julie – Auteure & Fondatrice

Étudiante en journalisme et passionnée de technologie, Julie partage ses découvertes autour de l’IA, du SEO et du marketing digital. Sa mission : rendre la veille technologique accessible et proposer des tutoriels pratiques pour le quotidien numérique.

Deja un comentario