AI w analizie konkurencji — czego nauczyć GPT, żeby nie halucynował

Każdy SEO-wiec próbował kiedyś zapytać ChatGPT: „pokaż mi top 10 konkurentów w branży X w Polsce”. I dostał listę — pewną siebie, ze szczegółami, czasem z nieistniejącymi domenami. To nie jest niefortunny wypadek. To systemowa cecha LLM-ów: gdy nie mają twardych danych w kontekście, ekstrapolują z wzorców. W analizie konkurencji to recipe na decyzje oparte o fikcję. Da się to obejść, ale wymaga zrozumienia mechaniki.

Skala problemu — trzy liczby

Ahrefs w 2025 zrobił analizę 16 milionów URL-i klikniętych z różnych źródeł. Wynik: ChatGPT prowadzi do nieistniejących URL-i (404) w 1,01% kliknięć i 2,38% wszystkich cytowanych URL-i. Google search jako baseline: 0,15% i 0,84%. Czyli ChatGPT zmyśla URL-e około 6,7× częściej niż klasyczna wyszukiwarka.

SE Ranking case study (3 miesiące monitorowania, 2025): ChatGPT wysłał ruch do około 70 nieistniejących URL-i, niektóre z 20+ sesjami każda. Z 18 000 wizyt z ChatGPT — 3,35% trafiło na 404. Realny ruch tracony, nie tylko teoria.

Enterprise chatbots (różne raporty 2025): hallucination rate około 18% w live interactions. Szacunki strat firm na undetected LLM failures: 1,9 mld USD rocznie.

W kontekście SEO halucynacje przyjmują kilka stałych form:

Halucynowane URL-e — fake /blog/X na realnym domain konkurenta, „logicznie pasujące” do struktury
Halucynowane statystyki — „Brand X ma 2,3 mln visits miesięcznie” — wymyślone, brzmiące wiarygodnie
Halucynowane backlinki — case z 2025: AI tworzył fikcyjne BL do strony SaaS Capital, które nigdy nie istniały
Halucynowane keywords — KW, których konkurent nie ma w żadnym narzędziu KW-research
Mieszanie konkurentów — context drift po długim kontekście, gdzie LLM przypisuje dane firmy A do firmy B

RAG to dziś standard, nie ekstra

Retrieval-Augmented Generation — wzorzec, w którym LLM ma dostęp do twardych danych przed wygenerowaniem odpowiedzi — przestał być w 2026 ekstrawaganckim setupem. Stał się higieną pracy. Bez RAG każda odpowiedź AI o konkurencji to ekstrapolacja na wzorcach, niezależnie od pewności tonu modelu.

Trzy poziomy RAG, w kolejności od najtańszego:

Poziom 1: file upload do ChatGPT/Claude. Eksportujesz CSV z Ahrefs lub Semrush, wgrywasz do konwersacji, prosisz o ekstrakcję ze strukturyzowanym outputem („zwróć dla każdego rzędu CSV pole intent z wartością ‘informational’/’commercial’/’transactional’/’navigational'”). Działa, ograniczeniem jest rozmiar pliku (~512MB w ChatGPT, ~30MB w Claude). Halucynacje spadają do minimum, bo model ma w kontekście realny dataset.

Poziom 2: web search w narzędziu. ChatGPT Search, Claude with web access, Perplexity API. Pytanie o konkurencję trafia w internet, nie w pamięć modelu. Lepsze niż file upload do świeżych zapytań („jakie kampanie odpalił competitor X w marcu 2026?”), bo dane miesięczne nie weszły do treningu. Plus minus: jakość zależy od jakości web search, halucynacje URL-i wciąż się zdarzają (1% zwrotów).

Poziom 3: custom RAG z embeddings. pgvector lub Pinecone + dokumentacja konkurenta jako source. Stosowane w agencjach prowadzących długoterminowe analizy konkurencji dla enterprise. Setup czasowy: 2–5 dni. Wartość: każda odpowiedź jest bezpośrednio cytowana z konkretnego źródła, halucynacje praktycznie zerowe. Dla MSP zwykle overkill. Dla agencji obsługującej fortune-500 — niezbędne.

Workflow, który działa

Konkretny pipeline na pojedynczą analizę konkurencji w 2026:

Eksport twardych danych z Ahrefs (Top Pages, Top Keywords, Backlinks) i Semrush (.Trends, Domain Overview) — CSV lub Excel
Załadowanie do Claude/ChatGPT z file upload
Prompt ekstrakcyjny (nie generacyjny) — „Z załączonego CSV wybierz 20 najczęściej rankujących stron konkurenta, dla każdej zwróć: tytuł, główne KW, intent, oceń typ contentu (lista/poradnik/case study/landing)”
Cross-check w drugim narzędziu — to, co LLM wybrał jako top, sprawdzasz w Semrush jako alternatywne źródło
Manualna walidacja 5–10 pozycji — sprawdzasz, czy strony rzeczywiście istnieją i mają strukturę, którą LLM opisał

Edit ratio (procent decyzji LLM, które zmienisz po cross-check) zwykle 10–20%. Jeśli > 30% — prompt jest źle ustawiony albo dane wejściowe niejasne.

Co nowego w narzędziach 2025–2026

Ahrefs Brand Radar 2.0 (sierpień 2025) — śledzi wzmianki marki w sześciu platformach (ChatGPT, Perplexity, Gemini, Copilot, AI Overviews, Grok) na bazie 320+ milionów search-backed promptów. Custom queries (od grudnia 2025) pozwalają trackować konkretne, niestandardowe prompty — np. „top SEO agencies in Krakow” — i widzieć, kiedy AI cytuje kogoś konkretnie. Game-changer dla competitive intelligence w erze AI search.

Ahrefs AI Content Helper używa cosine similarity + fan-out queries (dokładnie tej samej matematyki, co AI search engines) i daje content roadmap zamiast keyword list. Dla analizy konkurencji oznacza to, że sprawdzasz nie „jakich KW używa konkurent”, ale „jakie content gaps zostawia w klastrze tematycznym”.

Semrush AI Optimization (AIO) — moduł enterprise (od 2025) do monitoringu marki w ChatGPT, Gemini, Copilot, Perplexity. Copilot daje proaktywne insights o konkurencji bez zapytania.

SparkToro — w sierpniu 2025 dorzucił Conversational Queries (AI audience descriptions). W marcu 2026 ogłosił AI Prompt Topic Discovery — pokazuje, jakich promptów audience używa w ChatGPT, Google AI Mode, Claude. Dla niszowych branż B2B to często jedyne źródło tej informacji.

Czego absolutnie nie robić

Nie pytaj ChatGPT o listę top 10 konkurentów bez kontekstu. Bez RAG to fantasy generation. Lista będzie wyglądała wiarygodnie, ale 30–40% pozycji będzie zmyślonych lub błędnie przypisanych.

Nie używaj surowych SERP screenshotów jako inputu. Multimodal LLM-y halucynują na danych liczbowych w obrazach — tytuł skopiują, ale liczby pozycji lub volume mylą.

Nie ufaj klasycznym 2023 promptom typu „act as senior SEO expert”. Role-play prefix bez konkretnej ramy jest ignorowany przez nowsze modele. Liczy się structured input + extraction prompt.

Nie pytaj LLM-a o backlinki klienta lub konkurenta. Niezależnie jak dobrze zaprojektujesz prompt — odpowiedź będzie w 10–30% halucynacją. Ahrefs i Semrush mają realne dane, LLM nie.

Wniosek operacyjny

Analiza konkurencji w 2026 to nie pytanie LLM-a, kim są konkurenci. To pytanie LLM-a, jak interpretować dane, które już mam. Granica jest cienka, ale konsekwencje są wyraźne — pierwsza praktyka generuje raporty oparte o fikcję, druga skraca pracę analityczną o 50–70% bez utraty rzetelności.

Dla zespołu, który dotąd pracował klasycznie: zacznij od najtańszego setupu (file upload), opanuj prompty ekstrakcyjne, zbuduj 5–10 SOP-ów do najczęstszych analiz. Jeśli prowadzisz konkurencyjną intelligence dla 5+ klientów — rozważ Brand Radar i Semrush AIO, ROI zwraca się w pierwszym kwartale. Zespół, któremu szczególnie zależy na ułożeniu tego procesu od strony promptów ekstrakcyjnych i RAG, czasem wybiera ścieżkę warsztatową — np. szkolenia z AI dla biznesu Midero zawierają moduł o pracy z LLM-em na własnych danych konkurencyjnych — ale to opcja, nie warunek; samodzielna nauka też wystarczy, jeśli czas na to jest.

Powiązane tematy: audyt SEO z LLM w 6 etapach, gdzie analiza konkurencji jest częścią etapu content i links; oraz „Co AI w SEO robi szybciej”, gdzie pokazujemy ekonomię czasu w innych zadaniach.