Agent AI a poprzednie podejście do „inteligentnej” automatyzacji
W poprzednim poście zarysowałem ogólną wizję Agentic CRM, wg której przestaniemy używać systemów do przechowywania wiedzy o Klientach wspartej rekomendacjami, a zaczniemy widzieć w CRM „dodatkowego pomocnika”. Ale zanim zaufamy takiemu pracownikowi i damy mu dostęp do bazy klientów warto zrozumieć jak to wszystko działa – co dokładnie robi Agent AI, czym różni się od workflowu i czemu wszyscy, którzy tak promowali RPA (Robotic Process Automation) sami teraz mówią, że to było za mało, zbyt ograniczone itd.
Ciekawe, bo nie raz spierałem się z kimś na LinkedIn, że automatyzacja dekretowania faktur, kiedy ktoś zbudował (dosłownie, realny przykład) 168 modeli OCR faktur, bo Klient miał na moment projektu akurat 168 wzorów faktur od dostawców (a jak będzie nowa, to zrobimy nowy model), to nie żadne intelligent automation, tylko IF this THEN that, wsparty OCR’em.
Teraz nadzieja w agentach i na wchodzi cała na biało ich najważniejsza cecha – specyficznie zapętlony proces, który różni się od „poprzednich” automatyzacji jedną kluczą cechą: autonomią w podejmowaniu decyzji.
Agenci AI to pierwsza technologia, która zmienia zasady gry, bo przestajemy być operatorami systemu, a stajemy się „architektami zachowań”.
Prompt vs. Reasoning Loop: dlaczego LLM to nie Agent
Zacznijmy od fundamentalnego rozróżnienia, które w 2026 roku nadal myli wielu managerów IT. Tradycyjny model LLM (Large Language Model) działa w trybie „strzał -> odpowiedź”. Użytkownik pisze prompt „Napisz maila do klienta X z przeprosinami za opóźnienie”, a model generuje tekst. Koniec. Prawdziwy Agent AI działa inaczej. On nie tylko generuje tekst – on w specyficzny sposób rozumuje.
Na potrzeby bloga i spójności dyskursu nie będę sam ze sobą walczył, że "myśli", "rozumuje" tylko człowiek, a AI w żadnej postaci nie (jak zacznę mówić, że "AI ma świadomość" jak mnóstwo ignorantów teraz na świecie, możecie mnie zbluzgać w komentarzach) - używam słów przyjętych w publicznej dyskusji, niezależnie od tego, że sam jestem promotorem zupełnie innego rozumienia czym jest inteligencja i oddzielam AI od biologicznej świadomości i subiektywnego doświadczania.
W AI nazywamy to Reasoning Loop (pętlą rozumowania) lub wzorcem ReAct (Reason + Act).
Kiedy poprosisz Agenta w CRM „Obsłuż reklamację klienta X”, on nie powinien zacząć od pisania maila. Uruchamia wewnętrzny monolog (chain of thought), który powinien wyglądać mniej więcej tak:
- Sprawdzam, kim jest klient X (percepcja)
- Wywołuję API Dataverse, żeby pobrać historię zamówień (działanie)
- Widzę, że zamówienie nr 123 ma status „Zaginione” (obserwacja)
- Widzę, że to klient VIP (obserwacja)
- Sprawdzam, po co mi ta informacja (działanie)
- Zgodnie z polityką firmy, należy mu się zwrot gotówki + rabat 10% (rozumowanie / planowanie)
- Dopiero teraz generuję i wysyłam maila (działanie)
To właśnie ta zdolność do zatrzymania się i „pomyślenia” przed działaniem odróżnia chatbota, workflow, skrypt i RPA od agentów AI.
Swoją drogą to właśnie dobrze zrobiony łańcuch myśli (chain of thought) odróżnia też większość dem od realnych wdrożeń – na demie wystarczy prompt, na PRODzie już nie. Dlatego też tak dużo wdrożeń nie wychodzi poza fazę PoC (ok. 95%), bo mało kto umie zrobić dobrze powyższe rzeczy.
Sposób działania Agenta AI: Percepcja -> Rozumowanie -> Działanie -> Refleksja
Wdrożenie agenta to pewnie maksymalnie w połowie praca technologiczna, swoją drogą trudna i wymagająca kodu, wbrew powszechnemu zachwytowi low-code’m do tworzenia agentów (patrz wyżej rozróżnienie demo vs produkcja), a w połowie zaplanowanie cyklu decyzji, bramek, myślenia, logowanie, mnóstwo IF’ów i człowiek w pętli do podjęcia kluczowych decyzji. Nie wiedziałem, że kiedykolwiek przyda mi się tzw. OODA (Observe-Orient-Decide-Act), ale w świecie agentów AI warto ją rozumieć i zaadaptować:
1. Percepcja (zbieranie danych)
Agent nie ma oczu i niczrego sam nie rozumie. Jego „oczami” są API i hooki w innych systemach (w tym w CRM). Percepcja to nie tylko przeczytanie i analiza maila od klienta. To aktywne odpytanie systemu: „Jaki jest stan magazynowy?”, „Czy ten klient ma otwarte tickety na supporcie?”, „Jaki jest jego SLA?”. Bez dostępu do danych (Dataverse / SQL / dane nieustrukturyzowane, pliki), agent jest ślepy i może tylko halucynować uprzejmości.
2. Rozumowanie (planowanie)
To tutaj dzieje się magia modeli GPT nowszych generacji. Agent bierze dane z etapu percepcji i buduje plan. Rozbija zadanie na podzadania:
„Najpierw zaktualizuję status sprawy, potem wyślę notatkę do użytkownika, jeśli trzeba to poczekam na akceptację, a na końcu odpowiem klientowi”.
To jest krytyczny moment dla bezpieczeństwa, bo tutaj wchodzą w grę instrukcje systemowe (System Prompts) i Guardrails, które mówią agentowi: „Nigdy nie dawaj rabatu powyżej 20% bez zgody człowieka”. O tym kiedy indziej.
3. Działanie (użycie zaprogramowanych i wskazanych narzędzi)
Wiemy, że Agent AI nie ma oczu, ale powinien mieć chociaż ręce, a w zasadzie musi mieć ręce, żeby móc być nazywanym agentem. „Rękami” agenta AI są narzędzia, pluginy, predefiniowane akcje i konektory. Agent wykonuje realną operację: zmienia status rekordu w CRM, wysyła żądanie do ERP, albo rezerwuje spotkanie w Outlooku. To już nie jest czat – to jest działanie na żywych systemach firmy.
To w tym etapie trzeba na początku wdrożyć i zaplanować działanie człowieka, czyli Human in the Loop.
4. Refleksja (uczenie się i korekta)
To już cecha zaawansowanych agentów autonomicznych i na razie 10 na 10 komercyjnie wdrażanych tego nie ma, niezależnie od tego, co mówi BIG4 na swoich slajdach.
Po wykonaniu akcji agent sprawdza wynik – Czy API zwróciło błąd? Czy klient odpisał „to nie o to mi chodziło”? Wzorce takie jak Reflection pozwalają agentowi poprawić się w kolejnym kroku bez udziału człowieka.
Pamięć: Dlaczego Twój Agent musi pamiętać, co robił wczoraj
Największą bolączką wczesnych botów była amnezja. Każda rozmowa zaczynała się od zera. W Agentic AI wyróżniamy dwa rodzaje pamięci, które są niezbędne do prawidłowego działania agenta, a w CRM do budowania relacji:
1. Pamięć krótkoterminowa (short-term context)
To pamięć robocza agenta. To, co dzieje się w bieżącej sesji, w otwartym oknie czatu lub w trakcie rozwiązywania konkretnego case’a. Kiedy agent przetwarza zgłoszenie, musi pamiętać, o co pytał 3 minuty temu, żeby nie kręcić się w kółko.
2. Pamięć długoterminowa (long-term / Vector memory)
To jest Święty Graal Agentów, a szczególnie Agentów w CRM. Agent musi pamiętać:
- że ten konkretny dyrektor finansowy klienta nienawidzi, gdy dzwoni się do niego w piątki po 14:00
- że ten Klient miał już podobny problem
- że ostatnim razem rozwiązanie X zadziałało najlepiej
A problemem jest to, że Agent… niczego nie pamięta, bo nie przechowuje wspomnień (pamiętacie dlaczego ciągle podkreślam różnice między inteligencją ludzką a AI? 😉 ). Agent wyszukuje we wskazanym miejscach podobne sytuacje z przeszłości: „Ostatnio, gdy ten klient zgłosił ten błąd, rozwiązaliśmy go sposobem Y”.
Technicznie realizuje się to zazwyczaj przez tzw. RAG (Retrieval-Augmented Generation), embeddings (jak sami chcemy działać z modelem), albo bazy wektorowe (Vector Databases).
Bezpieczeństwo i governance
Governance zajmę się kiedy indziej, ale jak już uda Wam się zbudować rozsądnego agenta, to Wasz piękny świat może przestać być piękny właśnie przez brak governance’u. Minimum przy agentach to audyt działań, RBAC, least privilege, human in the loop, wersjonowanie, labelling, DLP, zabezpieczenia przed pętlami i wszystkie inne skróty, które obce są każdemu, kto „robi agenty, klikając”.
Podsumowanie
Agent AI to coś znacznie więcej niż RPA i workflow, najpierw dzięki wykorzystaniu LLM (o tym pisałem tu: Agentic CRM – czym jest CRM Agentowy?), a później wszystkich punktów z tego artykułu.
Najważniejsze w projektowaniu i tworzeniu agentów nie jest technologia (nie dajcie się nabrać), tylko zrozumienie procesu i zadanie sobie pytania:
Jaki proces myślowy wykonałby najlepszy człowiek na tym stanowisku?
A potem zmapowanie tego procesu na pętlę:
Dostęp i zebranie danych razem z analizą kontekstu (perception) ->
Analiza danych i planowanie podzadań (reasoning) ->
Użycie narzędzi / akcji (tool use) ->
Analiza wyników, audyt logów, weryfikacja błędów i aktualizacja (reflection)
A Agentic CRM to po prostu wiele agentów AI wspierających ludzi w strategii CRM, połączonych odpowiednimi sposobami. Ale o tym później.
