Legalny scraper SERP: SerpAPI, Google CSE, Perplexity (2025)

Evaluez cet article !
[Total: 0 Moyenne : 0]

„Legalny” scraper SERP i monitoringu: SerpAPI, Google CSE, Perplexity API — koszty i ograniczenia (2025)

TL;DR : Bezpośrednie scrapowanie Google narusza jego warunki użytkowania — „legalna” droga prowadzi przez API Programmable Search (CSE) lub przez zgodnych z prawem dostawców agregujących dane. Dla monitoringu SEO/SEA na dużą skalę SerpAPI ułatwia dostęp do SERP (koszt za 1 000 od 5,50 do 15 $ w zależności od poziomu), podczas gdy Google CSE oficjalnie pobiera 5 $ / 1 000 zapytań (do 10 tys. dziennie). Perplexity API nie jest API SERP: to API wyszukiwania + LLM rozliczane według tokenów i opłat za zapytania — idealne do monitoringu wspomaganego AI i raportów.

Zespół analizujący pulpit wyszukiwania i analityki
Zdjęcie na okładkę: wybór właściwej drogi dostępu do SERP, między zgodnością, kosztami i skalowalnością.

Ramowy „legalny” kontekst i definicje

W związku z tym, że Google zabrania nieautoryzowanego automatycznego dostępu do swoich wyników, zgodną alternatywą jest korzystanie z oficjalnych ofert (Programmable Search Engine — CSE — i jego Custom Search JSON API) lub outsourcing zbierania danych do zewnętrznego dostawcy, który przestrzega własnych ram prawnych (np. SerpAPI, dostarczający dane wyników). Ważne: poniższe informacje mają charakter informacyjny i nie stanowią porady prawnej; w razie wątpliwości skonsultuj się z prawnikiem lub z GIODO.Terminologia: w artykule „scraper” oznacza każde narzędzie zwracające dane SERP; „monitoring” obejmuje okresowe śledzenie słów kluczowych, konkurentów, autorów, produktów i aktualności.

Przegląd opcji: SerpAPI, Google CSE, Perplexity API

1) SerpAPI (agregator SERP)

Co to jest: usługa dostarczająca wyniki Google (i innych wyszukiwarek) w formacie JSON, przez endpointy (Google Search, Images, News, Maps itd.). Zaleta to przeniesienie złożoności antybotowej i infrastruktury. Plany na 2025 obejmują 250 darmowych zapytań/miesiąc oraz poziomy 5k, 15k, 30k i 100k–500k/miesiąc; FAQ precyzuje, że płatne wyszukiwanie = udane zapytanie (niezależnie od liczby zwróconych wyników).

  • Zalety: prostota, szeroki zakres API (News, Local, Images…), U.S. Legal Shield w niektórych planach, wysoka tolerancja na przepustowość.
  • Ograniczenia: koszt za 1 000 wyższy niż oficjalny CSE przy niskim wolumenie; zależność od podmiotu trzeciego; kwestie prawne do weryfikacji w zależności od zastosowań.
Lire aussi  Netlinking 2025: miks white/grey, inteligentne anchor texty, czyszczenie profilu

2) Google Programmable Search (CSE) i Custom Search JSON API

Co to jest: oficjalna droga do wyświetlania/uzyskiwania wyników z własnej wyszukiwarki Programmable Search. API JSON oferuje 100 darmowych zapytań/dzień, następnie 5 $ / 1 000 do 10 000 zapytań/dzień. Technicznie endpoint cse.list zwraca 10 wyników na stronę i maksymalnie 100 wyników na zapytanie (paginacja przez start i num).

  • Zalety: zgodność z Google, niski i przewidywalny koszt, prosta integracja po stronie serwera lub klienta.
  • Ograniczenia: limit dzienny 10 tys. (Google nie zwiększa go dalej) oraz maksymalnie 100 wyników na zapytanie. Wariant „Site Restricted JSON API” przestał działać 8 stycznia 2025 (zalecana migracja do Vertex AI Search).

3) Perplexity API (wyszukiwanie + LLM, nie jest to API SERP)

Co to jest : API AI-search, które przeszukuje internet i generuje syntetyczne podsumowanie z podaniem źródeł za pomocą różnych modeli (Sonar, Sonar Pro, Sonar Reasoning, Deep Research). Rozliczenie jest hybrydowe : tokeny (od 1 $ do 15 $ / 1 mln w zależności od modelu) + „opłata za zapytanie” związana z kontekstem wyszukiwania. Deep Research dodatkowo nalicza opłaty za wewnętrzne wyszukiwania w sieci (~5 $ / 1 000 zapytań), z podanymi przykładami kosztów (np. 0,153 $ za wykonanie 30 wyszukiwań).

  • Zalety : odpowiedzi kontekstowe z podaniem źródeł, idealne do monitoringu redakcyjnego, streszczeń wiadomości, porównań i raportów.
  • Ograniczenia : to nie jest surowe API SERP; limity szybkości według poziomów (Tier 0: 50 RPM dla Sonar, 5 RPM dla Deep Research), koszty zmienne w zależności od liczby wewnętrznych wyszukiwań.
Développeur intégrant des APIs de recherche dans un projet
Integracja: prosty JSON w SerpAPI i CSE; SDK/REST kompatybilny z OpenAI w Perplexity.

Cennik, limity i kwoty — tabela porównawcza

RozwiązanieTypDarmoweOrientacyjne cenyKoszt ≈ / 1 000Kluczowe limity i kwoty
SerpAPIAgregator SERP250/miesiącDev 5 k → 75 $/mies. • Prod 15 k → 150 $/mies. • Big Data 30 k → 275 $/mies. • High Volume 100 k → 725 $/mies., 250 k → 1 475 $/mies., 500 k → 2 750 $/mies.15 $ → 5,50 $„1 udane wyszukiwanie = 1 kredyt”; wiele branż (Wiadomości, Lokalizacja, Obrazy…).
Google CSE (Custom Search JSON API)Oficjalne Google100/dzień5 $ / 1 000 zapytań (do 10 000/dzień)5 $10 wyników/strona, max 100 na zapytanie; powyżej 10k/dzień: brak rozszerzenia; „Site Restricted” zakończone 08/01/2025.
Perplexity APIAI + wyszukiwanieTokeny (1–15 $ / 1 mln) + opłata za zapytanie (np. 0,005 $ za wyszukiwanie Sonar w sieci); Deep Research dodatkowo nalicza „zapytania wyszukiwania” (~5 $ / 1 000)≈ 5,7 $ / 1 000 (np. Sonar 500 wejść + 200 wyjść)Limity szybkości według „Tier” (Tier 0: 50 RPM Sonar, 5 RPM Deep Research); nie jest to surowe API SERP.

Interpretacja kosztów : w Perplexity koszt zależy od tokenów i liczby wyszukiwań wykonanych przez model (Deep Research). W SerpAPI koszt jest liniowy za udane zapytanie. W CSE koszt jest liniowy za rozliczalne zapytanie i ograniczony dziennym limitem.

Lire aussi  Lista kontrolna SEO dla artykułów opinii: 12 często pomijanych punktów

Przypadki użycia monitoringu (SEO, media, produkty)

SEO/SEA — śledzenie Top 10 i wyróżnionych fragmentów

  • Umiarkowany wolumen (≤ 10 k/dzień): CSE jest odpowiednie, jeśli Twój PSE „szuka w całym internecie”. Rozważ sampling (co drugi dzień), aby nie przekroczyć limitu.
  • Wysoki wolumen (> 10 k/dzień, wiele krajów, obrazy/wiadomości): SerpAPI jest łatwiejsze w obsłudze (wysokie limity, dedykowane endpointy dla Wiadomości/Obrazów/Lokalizacji).

Monitoring redakcyjny i konkurencja

Perplexity API wyróżnia się w streszczaniu i podawaniu źródeł trendów (komunikaty, blogi, dokumenty techniczne, prasa), dostarczając odpowiedź wraz z linkami. Idealne do briefów rynkowych, newsletterów lub pulpitów executive.

Monitoring lokalny/opinie

Aby monitorować Google Maps/Local (opinie, pozycje, godziny), najbardziej pragmatyczną drogą jest korzystanie z dedykowanych endpointów agregatora (SerpAPI) zamiast CSE.

Klawiatura, ekran i smartfon ilustrujące monitorowanie i automatyzację
Nowoczesny monitoring: łączenie surowych danych (SERP) i podsumowań AI, aby szybciej podejmować decyzje.

Wdrożenie: krok po kroku i fragmenty kodu

A) Google CSE (Custom Search JSON API)

  1. Utwórz Programmowalną wyszukiwarkę (PSE) i pobierz cx (ID wyszukiwarki) + key API.
  2. Włącz rozliczenia, jeśli przekroczysz 100 dziennie; ustaw dzienny limit w Google Cloud, aby kontrolować wydatki.
  3. Zaimplementuj wywołanie serwera:
curl "https://www.googleapis.com/customsearch/v1?key=VOTRE_CLE&cx=VOTRE_CX&q=mot+cle&num=10&start=1"

Przypomnienia: num ≤ 10; maksymalnie 100 wyników na wyszukiwanie (stronicuj za pomocą start).

B) SerpAPI

  1. Utwórz klucz, wybierz endpoint (Search, News, Images…)
  2. Przetestuj na Playground, a następnie przejdź do produkcji:
curl "https://serpapi.com/search.json?q=mot+cle&engine=google&api_key=VOTRE_CLE&hl=fr&gl=fr&num=10&start=0"

Liczenie: 1 udana odpowiedź = 1 kredyt (niezależnie od liczby wyników).

C) Perplexity API

  1. Utwórz grupę API, sprawdź swój Tier (określa RPM).
  2. Wybierz model (np. sonar do szybkich pytań/odpowiedzi, sonar-deep-research do raportów).
curl https://api.perplexity.ai/chat/completions 
 -H "Authorization: Bearer $PPLX_KEY" -H "Content-Type: application/json" 
 -d '{"model":"sonar","messages":[{"role":"user","content":"Fais un résumé sourcé des nouveautés SEO du mois"}]}'

Koszt = tokeny + opłata za zapytanie; Deep Research dodaje wewnętrzne „zapytania wyszukiwania”.

Ile przewidzieć? Scenariusze budżetowe

ScenariuszZałożeniaMiesięczna estymacjaKomentarz
Monitorowanie 1 000 słów kluczowych tygodniowo (Top 10)4 przejścia/miesiąc × 1 000 zapytań = 4 000CSE ≈ 20 $; SerpAPI ≈ 60–75 $; Perplexity (sonar) ≈ 23 $**sonar ~0,0057 $/zapytanie (założenie 500 in + 200 out + opłata za zapytanie)
Intensywny monitoring wielokrajowy100 tys. zapytań/miesiąc (SERP + News)Plan SerpAPI 100k: 725 $Zaleta: wyspecjalizowane endpointy (News, Local), wysoka przepustowość.
Miesięczne raporty „Deep Research”1 000 uruchomień × 30 wewnętrznych wyszukiwań/uruchomienie≈ 153 $ (wyszukiwania) + tokenyOparte na przykładzie kosztów Deep Research.
Serwerownia i sieć ilustrujące skalowanie obciążenia
Powyżej 10 tys. dziennie, CSE osiąga swój limit: zaplanuj architekturę hybrydową lub agregatora.

Ryzyka, zgodność i dobre praktyki

  • Przestrzegaj ToS : nie automatyzuj bezpośrednich wywołań do google.com; preferuj CSE (oficjalny) lub dostawcę zewnętrznego.
  • Ogranicz dane osobowe (RODO/CNIL): anonimizuj logi, minimalizuj przechowywane pola, określ podstawę prawną przetwarzania.
  • Kontroluj wydatki : w CSE ustaw dzienny limit w GCP; w SerpAPI monitoruj licznik kredytów; w Perplexity kontroluj tokeny i opłaty za zapytania.
  • Przejrzystość wewnętrzna : dokumentuj swoje źródła i legalność dostępu do danych (szczególnie dla prasy).

Złota zasada : jeśli dane są strategiczne i wrażliwe (media chronione, paywalle), preferuj licencje i/lub oficjalne API tych wydawców.

Trendy 2025

  • Koniec „Site Restricted JSON API” (8 stycznia 2025) i nacisk na Vertex AI Search.
  • AI + Wyszukiwanie : wzrost workflowów rozszerzonego monitoringu (zapytania → syntezy z źródłami → dashboard).
  • Zaostrzenie antybotowe : CAPTCHA, renderowanie JS, sygnały behawioralne → rosnące znaczenie wyspecjalizowanych agregatorów.
Lire aussi  Digimood kontra tradycyjne agencje: kto wygrywa bitwę SEO?

FAQ — „legalny” scraper SERP i monitoringu

Czy scraper Google jest legalny? Automatyzowanie zapytań bezpośrednio do google.com narusza jego warunki użytkowania. Zalecana droga: Programmable Search (CSE) przez oficjalne API lub dostawca zewnętrzny (np. SerpAPI), który obsługuje infrastrukturę zbierania i dostarcza wyniki. Czy Google CSE wystarczy do szeroko zakrojonego monitoringu SEO? Tak, do 10 000 zapytań/dzień (100 darmowych), z 10 wynikami/strona i maksymalnie 100 na zapytanie. Powyżej tego limitu przejdź na agregator lub rozdziel obciążenie na kilka projektów/silników (zgodnie z zasadami). SerpAPI czy CSE: co wybrać? CSE, jeśli pozostajesz ≤ 10 tys./dzień i szukasz minimalnych kosztów (5 $ / 1 000). SerpAPI, jeśli potrzebujesz wielu pionów (News, Lokalizacja, Obrazy), dużych miesięcznych wolumenów (do 500k+) i wysokiej przepustowości. Czy Perplexity API może zastąpić API SERP? Nie. Ona uzupełnia dostęp do SERP o rozszerzony monitoring (syntezy z źródłami). Do surowych tabel rankingowych używaj CSE/SerpAPI; do briefów i raportów Perplexity jest odpowiednia. Ile kosztuje Perplexity API do codziennego monitoringu? W trybie sonar około 0,0057 $ / zapytanie za 500 tokenów wejściowych + 200 wyjściowych + orientacyjną „opłatę za zapytanie”. Deep Research dodaje ~0,005 $ za wewnętrzne wyszukiwanie w sieci (np. 30 wyszukiwań ≈ 0,15 $ / uruchomienie) + tokeny. Czy można przekroczyć 10 tys./dzień w CSE? Nie, Google nie przyznaje już rozszerzeń ponad limit 10 tys./dzień. Zaplanuj architekturę hybrydową (CSE + agregator) w razie potrzeby.

Wiarygodne źródła



Evaluez cet article !
[Total: 0 Moyenne : 0]
Julie - auteure Com-Strategie.fr

Julie – Auteure & Fondatrice

Étudiante en journalisme et passionnée de technologie, Julie partage ses découvertes autour de l’IA, du SEO et du marketing digital. Sa mission : rendre la veille technologique accessible et proposer des tutoriels pratiques pour le quotidien numérique.

Dodaj komentarz