Klasyczny audyt SEO ma sześć etapów: technical, on-page, content, links, E-E-A-T, performance. W 2026 każdy z nich można wzbogacić o LLM — ale tylko niektóre da się sensownie zautomatyzować w 100%. Poniżej praktyczny workflow z narzędziami, który większe agencje stosują dla audytów dużych serwisów (10 000+ podstron). Z konkretami: koszty, decyzje, gdzie przerwać i sprawdzić ręcznie.
Założenia metodologiczne
Audyt z AI nie jest „raportem wygenerowanym przez ChatGPT”. Aleyda Solis na SEO Week 2025 i w Sitebulb webinar SEO for LLMs 2026 powtarza zasadę, która porządkuje temat: AI automatyzuje wykonanie, decyzje pozostają u SEO-wca. Pipeline poniżej jest tego konsekwencją — LLM klasyfikuje, tagguje, sugeruje. Człowiek priorytetyzuje, decyduje o budżecie czasu na fix, komunikuje się z klientem.
Drugie założenie: technical SEO jest fundamentem dla GEO. Bez crawlowania, bez prawidłowego indexowania, bez Core Web Vitals AI search też nie zacytuje strony. Audyt techniczny nie znika — staje się warunkiem koniecznym dla wszystkiego, co dalej.
Etap 1: Technical (automatyzacja 100%)
Narzędzia: Screaming Frog 21+, Sitebulb Cloud, Lumar.
Screaming Frog 21 (i nowsze) ma natywną integrację z OpenAI, Anthropic, Gemini i lokalnymi modelami przez Ollama. W panelu Config → API Access → AI podpinasz klucz, w panelu Custom → Custom JavaScript odpalasz prompty per URL — do 100 promptów na crawl. To zmienia ekonomię: crawl 30 000 stron z LLM-em (klasyfikacja typu strony, intent, generowanie meta) przy GPT-4o-mini kosztuje poniżej 30 USD. Dla porównania: w 2023 ta sama operacja w Sufer/Frase kosztowałaby kilkukrotnie więcej i była limitowana planem.
Sitebulb Cloud (2025) dorzucił scheduled audits i CLI — audyty wchodzą w pipeline’y CI/CD, co jest praktyczne dla in-house teamów. Crawler renderuje JavaScript przez Evergreen Chromium (jak Googlebot) i sprawdza 300+ hintów out-of-the-box.
Lumar (były Deepcrawl) w 2025 wprowadził AI Dev Ticket Writer — moduł generujący gotowe ticket-y do Jiry z opisu issue technicznego. Plus drugi nowy moduł, GEO Toolkit, do śledzenia widoczności w AI search. Crawl prędkość: 450 stron/sekundę.
Co warto zautomatyzować: crawling, klasyfikacja status codes, indexability check, structured data validation, hreflang errors, sitemap audit. To jest ścieżka 100% automatu — wynik to lista issues z priorytetami.
Czego nie: decyzja, które issues fixuje się w pierwszym tygodniu, a które za pół roku. To rozmowa z klientem o kosztach inżynieryjnych i ROI — nie temat dla LLM.
Etap 2: On-page (LLM klasyfikuje, człowiek QA)
Narzędzia: Screaming Frog + Custom JS, ChatGPT/Claude API.
Custom JS w Screaming Frog odpala prompt na każdej crawlowanej stronie — np. „Przeczytaj tytuł i meta description, oceń czy jest spójna z H1 i pierwszym akapitem, zaproponuj alternatywę jeśli nie”. Output trafia do kolumny w eksporcie CSV.
Klasyczny on-page audit dla 5 000 podstron: typowo 3–5 dni pracy juniora. Z LLM-em: pół dnia, plus pół dnia QA seniora. Edit ratio (procent sugestii LLM, które senior modyfikuje) waha się 25–35% — większy oznacza, że prompt jest źle skonfigurowany.
Co warto zautomatyzować: title/meta consistency check, H1 uniqueness, duplicate content detection, keyword stuffing flags.
Czego nie: strategiczne decyzje o restrukturyzacji nawigacji, kanibalizacji kluczowych KW (LLM klasyfikuje, ale nie podejmuje decyzji), mapowanie URL-i przy migracji.
Etap 3: Content (LLM + embeddings, decyzja człowieka)
Narzędzia: Surfer SEO, Frase, Ahrefs AI Content Helper, custom skrypty z embeddings.
Tu LLM-y wreszcie pokazują wartość strategiczną. Ahrefs AI Content Helper (uruchomiony w 2024, rozbudowany w 2025) używa cosine similarity + fan-out queries — czyli dokładnie tej samej matematyki, co AI search engines — i dla każdego topica daje content roadmap zamiast keyword list. To zmienia format briefu (więcej w tekście o briefach SEO generowanych przez AI).
Detekcja kanibalizacji: skrypt z OpenAI embeddings + cosine similarity wyłapuje pary stron > 0,85 podobieństwa semantycznego. Lista 200 par to typowy output dla średniego serwisu. Decyzja, czy mergować, redirect, czy zostawiać — należy do SEO-wca z biznesowym kontekstem.
Content gaps: Surfer Content Editor i Frase pokazują brakujące entities względem top SERP. AI generuje brakujące sekcje na bazie outline — człowiek waliduje merytorycznie.
Czego nie automatyzować: ostateczna kolejność klastrów do publikacji (zależy od priorytetów biznesowych klienta), decyzja o usuwaniu starego contentu, ton komunikacji w wrażliwych branżach.
Etap 4: Links (graph + LLM klasyfikacja anchorów)
Narzędzia: Ahrefs, Semrush, Majestic, custom Python.
Internal linking analysis: graf wewnętrznego linkowania + klasyfikacja anchorów przez LLM (transactional/informational/branded/generic). Sugestie nowych internal linków robi dziś Link Whisper, Ahrefs Internal Link Opportunities lub Semrush internal linking module — wszystkie dorzuciły LLM-warstwę w 2024–2025.
Backlink audit: tu uważamy szczególnie. Ahrefs w studium 16 mln URL z 2025 pokazał, że ChatGPT halucynuje URL-e jako 404 około 6,7× częściej niż klasyczny Google search (1,01% vs 0,15%). Konsekwencja: nigdy nie pytaj LLM-a o listę backlinków — pytaj o klasyfikację już wyeksportowanej listy. Workflow: Ahrefs export CSV → Claude/GPT z file upload → ekstrakcja, nie generacja. Więcej o tym w tekście o analizie konkurencji bez halucynacji.
Etap 5: E-E-A-T (manualnie, LLM tylko sprawdza spójność)
To najmniej automatyzowalny etap. Doświadczenie, autorytet, wiarygodność — sygnały, których LLM nie wygeneruje.
Glenn Gabe w 2025 podkreślał, że AI references są spójne tylko jeśli detale brandu powtarzasz konsekwentnie: na stronie, w social media i u third-party. To jest mierzalne — Brand Radar od Ahrefs (sierpień 2025) śledzi wzmianki marki w 6 platformach AI z 320+ mln promptów. Spójność komunikacji bezpośrednio przekłada się na cytowania.
Co weryfikuje się w E-E-A-T:
- Strony „o autorze” z merytorycznym opisem doświadczenia
- Schema
PersonzsameAs(LinkedIn, ORCID, własny blog) - Linki wychodzące do autorytatywnych źródeł
- Nazwa firmy, NIP, adres widoczne i spójne (NAP consistency)
- Recenzje, certyfikaty, członkostwa branżowe
LLM tylko sprawdza, czy te elementy istnieją i są spójne. Nie zastępuje budowania ich.
Etap 6: Performance + AI search visibility
Narzędzia: Lumar GEO Toolkit, Ahrefs Brand Radar, Semrush AIO, AthenaHQ, Otterly.ai, Profound.
Klasyczne mierniki: Core Web Vitals, INP, CLS, LCP. Tu nic nowego — Google PageSpeed Insights, Lighthouse, web.dev/measure. Plus log files analysis (Screaming Frog Log Analyzer, Splunk dla większych).
Nowe mierniki 2026: AI search visibility. Ile razy marka cytowana w ChatGPT, Perplexity, Gemini, Copilot, AI Overviews. Brand Radar wskazuje konkretne prompty, w których pojawia się marka. Custom queries (grudzień 2025) pozwalają trackować własne, niestandardowe prompty — np. „top SEO agencies in Krakow”.
Dashboarding: Looker Studio + GSC API + Brand Radar API jako warstwa miesięczna w raporcie do klienta. Najnowsze podejście: pokazujemy klientowi nie tylko spadek CTR organic (który będzie spadał wraz z rozszerzaniem AIO), ale też wzrost cytowań w AI — to nowa, bardziej reprezentatywna metryka widoczności.
Pipeline w skali
Pipeline tej skali (10 000+ podstron, 6 etapów, regularne audyty kwartalne) zwykle warto wdrażać z partnerem technologicznym, który zna integrację narzędzi i potrafi zaprojektować custom skrypty. U nas zrobiliśmy to z Midero, gdzie część automatyzacji audytu — szczególnie warstwa custom JS dla Screaming Frog i klasyfikacja issues w Lumar — powstała wspólnie. Setup, w którym klient oprócz raportu dostaje gotowy ticket w Jirze, zmienia ekonomię wdrożeń SEO znacznie bardziej niż sam fakt użycia AI.
Czego unikać
- „AI zrobi cały audyt” — Lily Ray na Tech SEO Connect 2025 przypomniała: AI search jako „manufactured visibility” jest wykrywalne, technical SEO pozostaje fundamentem.
- Wysyłka raportu wygenerowanego przez LLM bez review seniora — najszybsza droga do bullshit raportu, którego klient nie zaakceptuje, a domena nie zyska.
- Pytanie ChatGPT o listę linków zewnętrznych — patrz halucynacje, wyżej.
- Stare workflows (Screaming Frog ≤ 18, bez Custom JS i Direct AI API) — w 2026 niewykorzystany potencjał.
Decyzja: kiedy zacząć
Jeśli prowadzisz audyt < 1000 stron raz na pół roku — klasyczny workflow + ChatGPT do paru zadań klasyfikacyjnych wystarczy. Jeśli audytujesz regularnie 5 000+ stron lub masz kilka klientów na podobnym etapie — inwestycja w setup (Screaming Frog z AI API + Sitebulb Cloud + Lumar lub własny custom JS) zwraca się w 2–3 miesiącach. Spadek czasu pracy w typowym audycie: 40–60%, edit ratio: 25–35%, jakość finalnego raportu: zwykle wyższa niż klasyczna, bo LLM łapie inkonsystencje, które ludzkie oko pomija.