Audyt SEO z LLM. Workflow w 6 etapach, który skraca pracę o 60%

Klasyczny audyt SEO ma sześć etapów: technical, on-page, content, links, E-E-A-T, performance. W 2026 każdy z nich można wzbogacić o LLM — ale tylko niektóre da się sensownie zautomatyzować w 100%. Poniżej praktyczny workflow z narzędziami, który większe agencje stosują dla audytów dużych serwisów (10 000+ podstron). Z konkretami: koszty, decyzje, gdzie przerwać i sprawdzić ręcznie.

Założenia metodologiczne

Audyt z AI nie jest „raportem wygenerowanym przez ChatGPT”. Aleyda Solis na SEO Week 2025 i w Sitebulb webinar SEO for LLMs 2026 powtarza zasadę, która porządkuje temat: AI automatyzuje wykonanie, decyzje pozostają u SEO-wca. Pipeline poniżej jest tego konsekwencją — LLM klasyfikuje, tagguje, sugeruje. Człowiek priorytetyzuje, decyduje o budżecie czasu na fix, komunikuje się z klientem.

Drugie założenie: technical SEO jest fundamentem dla GEO. Bez crawlowania, bez prawidłowego indexowania, bez Core Web Vitals AI search też nie zacytuje strony. Audyt techniczny nie znika — staje się warunkiem koniecznym dla wszystkiego, co dalej.

Etap 1: Technical (automatyzacja 100%)

Narzędzia: Screaming Frog 21+, Sitebulb Cloud, Lumar.

Screaming Frog 21 (i nowsze) ma natywną integrację z OpenAI, Anthropic, Gemini i lokalnymi modelami przez Ollama. W panelu Config → API Access → AI podpinasz klucz, w panelu Custom → Custom JavaScript odpalasz prompty per URL — do 100 promptów na crawl. To zmienia ekonomię: crawl 30 000 stron z LLM-em (klasyfikacja typu strony, intent, generowanie meta) przy GPT-4o-mini kosztuje poniżej 30 USD. Dla porównania: w 2023 ta sama operacja w Sufer/Frase kosztowałaby kilkukrotnie więcej i była limitowana planem.

Sitebulb Cloud (2025) dorzucił scheduled audits i CLI — audyty wchodzą w pipeline’y CI/CD, co jest praktyczne dla in-house teamów. Crawler renderuje JavaScript przez Evergreen Chromium (jak Googlebot) i sprawdza 300+ hintów out-of-the-box.

Lumar (były Deepcrawl) w 2025 wprowadził AI Dev Ticket Writer — moduł generujący gotowe ticket-y do Jiry z opisu issue technicznego. Plus drugi nowy moduł, GEO Toolkit, do śledzenia widoczności w AI search. Crawl prędkość: 450 stron/sekundę.

Co warto zautomatyzować: crawling, klasyfikacja status codes, indexability check, structured data validation, hreflang errors, sitemap audit. To jest ścieżka 100% automatu — wynik to lista issues z priorytetami.

Czego nie: decyzja, które issues fixuje się w pierwszym tygodniu, a które za pół roku. To rozmowa z klientem o kosztach inżynieryjnych i ROI — nie temat dla LLM.

Etap 2: On-page (LLM klasyfikuje, człowiek QA)

Narzędzia: Screaming Frog + Custom JS, ChatGPT/Claude API.

Custom JS w Screaming Frog odpala prompt na każdej crawlowanej stronie — np. „Przeczytaj tytuł i meta description, oceń czy jest spójna z H1 i pierwszym akapitem, zaproponuj alternatywę jeśli nie”. Output trafia do kolumny w eksporcie CSV.

Klasyczny on-page audit dla 5 000 podstron: typowo 3–5 dni pracy juniora. Z LLM-em: pół dnia, plus pół dnia QA seniora. Edit ratio (procent sugestii LLM, które senior modyfikuje) waha się 25–35% — większy oznacza, że prompt jest źle skonfigurowany.

Co warto zautomatyzować: title/meta consistency check, H1 uniqueness, duplicate content detection, keyword stuffing flags.

Czego nie: strategiczne decyzje o restrukturyzacji nawigacji, kanibalizacji kluczowych KW (LLM klasyfikuje, ale nie podejmuje decyzji), mapowanie URL-i przy migracji.

Etap 3: Content (LLM + embeddings, decyzja człowieka)

Narzędzia: Surfer SEO, Frase, Ahrefs AI Content Helper, custom skrypty z embeddings.

Tu LLM-y wreszcie pokazują wartość strategiczną. Ahrefs AI Content Helper (uruchomiony w 2024, rozbudowany w 2025) używa cosine similarity + fan-out queries — czyli dokładnie tej samej matematyki, co AI search engines — i dla każdego topica daje content roadmap zamiast keyword list. To zmienia format briefu (więcej w tekście o briefach SEO generowanych przez AI).

Detekcja kanibalizacji: skrypt z OpenAI embeddings + cosine similarity wyłapuje pary stron > 0,85 podobieństwa semantycznego. Lista 200 par to typowy output dla średniego serwisu. Decyzja, czy mergować, redirect, czy zostawiać — należy do SEO-wca z biznesowym kontekstem.

Content gaps: Surfer Content Editor i Frase pokazują brakujące entities względem top SERP. AI generuje brakujące sekcje na bazie outline — człowiek waliduje merytorycznie.

Czego nie automatyzować: ostateczna kolejność klastrów do publikacji (zależy od priorytetów biznesowych klienta), decyzja o usuwaniu starego contentu, ton komunikacji w wrażliwych branżach.

Etap 4: Links (graph + LLM klasyfikacja anchorów)

Narzędzia: Ahrefs, Semrush, Majestic, custom Python.

Internal linking analysis: graf wewnętrznego linkowania + klasyfikacja anchorów przez LLM (transactional/informational/branded/generic). Sugestie nowych internal linków robi dziś Link Whisper, Ahrefs Internal Link Opportunities lub Semrush internal linking module — wszystkie dorzuciły LLM-warstwę w 2024–2025.

Backlink audit: tu uważamy szczególnie. Ahrefs w studium 16 mln URL z 2025 pokazał, że ChatGPT halucynuje URL-e jako 404 około 6,7× częściej niż klasyczny Google search (1,01% vs 0,15%). Konsekwencja: nigdy nie pytaj LLM-a o listę backlinków — pytaj o klasyfikację już wyeksportowanej listy. Workflow: Ahrefs export CSV → Claude/GPT z file upload → ekstrakcja, nie generacja. Więcej o tym w tekście o analizie konkurencji bez halucynacji.

Etap 5: E-E-A-T (manualnie, LLM tylko sprawdza spójność)

To najmniej automatyzowalny etap. Doświadczenie, autorytet, wiarygodność — sygnały, których LLM nie wygeneruje.

Glenn Gabe w 2025 podkreślał, że AI references są spójne tylko jeśli detale brandu powtarzasz konsekwentnie: na stronie, w social media i u third-party. To jest mierzalne — Brand Radar od Ahrefs (sierpień 2025) śledzi wzmianki marki w 6 platformach AI z 320+ mln promptów. Spójność komunikacji bezpośrednio przekłada się na cytowania.

Co weryfikuje się w E-E-A-T:

Strony „o autorze” z merytorycznym opisem doświadczenia
Schema Person z sameAs (LinkedIn, ORCID, własny blog)
Linki wychodzące do autorytatywnych źródeł
Nazwa firmy, NIP, adres widoczne i spójne (NAP consistency)
Recenzje, certyfikaty, członkostwa branżowe

LLM tylko sprawdza, czy te elementy istnieją i są spójne. Nie zastępuje budowania ich.

Etap 6: Performance + AI search visibility

Narzędzia: Lumar GEO Toolkit, Ahrefs Brand Radar, Semrush AIO, AthenaHQ, Otterly.ai, Profound.

Klasyczne mierniki: Core Web Vitals, INP, CLS, LCP. Tu nic nowego — Google PageSpeed Insights, Lighthouse, web.dev/measure. Plus log files analysis (Screaming Frog Log Analyzer, Splunk dla większych).

Nowe mierniki 2026: AI search visibility. Ile razy marka cytowana w ChatGPT, Perplexity, Gemini, Copilot, AI Overviews. Brand Radar wskazuje konkretne prompty, w których pojawia się marka. Custom queries (grudzień 2025) pozwalają trackować własne, niestandardowe prompty — np. „top SEO agencies in Krakow”.

Dashboarding: Looker Studio + GSC API + Brand Radar API jako warstwa miesięczna w raporcie do klienta. Najnowsze podejście: pokazujemy klientowi nie tylko spadek CTR organic (który będzie spadał wraz z rozszerzaniem AIO), ale też wzrost cytowań w AI — to nowa, bardziej reprezentatywna metryka widoczności.

Pipeline w skali

Pipeline tej skali (10 000+ podstron, 6 etapów, regularne audyty kwartalne) zwykle warto wdrażać z partnerem technologicznym, który zna integrację narzędzi i potrafi zaprojektować custom skrypty. U nas zrobiliśmy to z Midero, gdzie część automatyzacji audytu — szczególnie warstwa custom JS dla Screaming Frog i klasyfikacja issues w Lumar — powstała wspólnie. Setup, w którym klient oprócz raportu dostaje gotowy ticket w Jirze, zmienia ekonomię wdrożeń SEO znacznie bardziej niż sam fakt użycia AI.

Czego unikać

„AI zrobi cały audyt” — Lily Ray na Tech SEO Connect 2025 przypomniała: AI search jako „manufactured visibility” jest wykrywalne, technical SEO pozostaje fundamentem.
Wysyłka raportu wygenerowanego przez LLM bez review seniora — najszybsza droga do bullshit raportu, którego klient nie zaakceptuje, a domena nie zyska.
Pytanie ChatGPT o listę linków zewnętrznych — patrz halucynacje, wyżej.
Stare workflows (Screaming Frog ≤ 18, bez Custom JS i Direct AI API) — w 2026 niewykorzystany potencjał.

Decyzja: kiedy zacząć

Jeśli prowadzisz audyt < 1000 stron raz na pół roku — klasyczny workflow + ChatGPT do paru zadań klasyfikacyjnych wystarczy. Jeśli audytujesz regularnie 5 000+ stron lub masz kilka klientów na podobnym etapie — inwestycja w setup (Screaming Frog z AI API + Sitebulb Cloud + Lumar lub własny custom JS) zwraca się w 2–3 miesiącach. Spadek czasu pracy w typowym audycie: 40–60%, edit ratio: 25–35%, jakość finalnego raportu: zwykle wyższa niż klasyczna, bo LLM łapie inkonsystencje, które ludzkie oko pomija.