Modi ki un Ajenti di IA Konversasional ta Funsiona pa Dentu

Engenharia

12 min de leitura

2 de junho de 2026

Modi ki un Ajenti di IA Konversasional ta Funsiona pa Dentu

6 fazi di un turnu di konversa na OpenClaw — ku latênsia real, kustu pa konversa y 4 linha di difeza kontra alusinason.

Equipe OpenClaw · Time de Engenharia & Produto

A Equipe OpenClaw é formada por engenheiros, designers e especialistas em IA dedicados a construir a melhor plataforma de agentes conversacionais para negócios brasileiros. Combinamos expertise…

Modi ki un Ajenti di IA Konversasional ta Funsiona pa Drento (Arkitetura OpenClaw)

Modi ki un ajenti di IA konversasional ta funsiona na prátika, turnu pa turnu? Es post ta abri kaxa preta di OpenClaw: des momentu ki mensaji di kliente ta txiga na WhatsApp té textu ki ajenti ta skrebe di volta. Ta ser tékniku. Ta vale pena si bo ta disidi arkitetura di produtu, si bo ta bai kumpra un solusãu i bo ke avalia fundu, o si bo gosta sabe kel ki ta kontese pa trás di konversa.

TL;DR: kada turnu ta pasa pa 6 estájiu — ingest, resolve kontextu, seleta skills, disidi prósimu asãu, ezekuta ku guard-rails, persiste memória. Tudu siklu ta roda na <2 segundus na edge di Cloudflare, sen servidor fixu.

Pamodi arkitetura ta importa

Ajenti konversasional ki ta parsi funsiona nun demo mas ta keba na produsãu jeralmenti ten un des 4 problema li:

Laténsia altu — kliente ta spera 8 segundus pa risposta, konversa ta mori.
Alusinasãu nãu kontroladu — ajenti ta inventa presu, orário, polítika.
Kontextu perdidu — kliente ta volta dipois di 2 dia i ajenti ta "skese" tudu.
Kustu deskontruladu — kada konversa longu ta txe prompt i bo ta paga fortuna na token.

Es 4 é sколha di arkitetura, nãu limitasãu di modelu. OpenClaw foi konstruidu pa evita es 4 — i kaminhu pa intende é odja siklu di un turnu.

Siklu di un turnu (6 estájiu)

Imajina ki kliente kaba di manda mensaji "n kre marka pa sábadu di manhã". Kel ki ta kontese entri "received" i risposta di ajenti?

Estájiu 1 — Ingest (edge worker, <50ms)

Mensaji di WhatsApp ta txiga via webhook di Meta diretu nun Cloudflare Worker na pontu di prezensa (PoP) más perti jeografikamenti. Na Brazil, isu ta sinifika São Paulo o Rio, laténsia di redi < 20ms.

Worker ta fazi tres kusa:

Valida asinatura di webhook (HMAC kontra sigredu di WABA).
Identifika tenant pa númer di telefoni di resetor (multi-tenant pa to_number).
Normaliza payload — áudiu ta vira transкrisãu, imaji ta vira diskrisãu, lokalizasãu ta vira {lat,lng}, textu ta fika modi sta.

Na fin di estájiu 1 bo ten un objetu {tenant_id, conversation_id, user_message} prontu pa prósimu pasu.

Estájiu 2 — Resolve kontextu (D1 + KV, ~80ms)

Ajenti ta prisize di 3 pedasu di kontextu antis di disidi:

Istóriku risenti di konversa (últimus N turnus relevanti).
Memória di longu prazu di klenti (preferénsia, istóriku di kompra, anotason).
Stadu di ajenti (persona, skills abilitadu, regra).

Tudu ben di D1 (SQLite distribuídu di Cloudflare). D1 substitui Postgres/Mongo tradisional — sen servidor di banku pa mantén, asesu na poku ms a partir di worker, multi-tenant pur tenant_id.

Pontu-xavi: nós ka ta karrega konversa sanu na prompt. Memory Manager v2 di OpenClaw (diskritu na nós dokumentason intérna) ta silisjona só turnus relevanti pa turnu atual (últimus N + N di alta relevánsia semántika). Isu ta mantén kustu di token privisível méxmu na konversa di 100+ turnus.

Estájiu 3 — Silisjón di skills (policy engine, ~20ms)

Kada ajenti ten un konjuntu di skills disponível — funson ki el podi invoka. Exenplu: consultar_calendario, criar_evento, gerar_link_pagamento, consultar_pedido, chamar_humano.

Dadu mensaji "N kre marka pa sábadu di manha", policy engine ta filtra:

Skills konpatível ku intenson detetadu (ajendamentu).
Skills permitidu pa ês fazi di konversa (nen tudu skill sta disponível tudu tenpu).
Skills ki ês tenant abilitó (calendar só ta parsi si tenant integró).

Na fin bu ten un subkonjuntu pekenu di skills pasadu pa modelu — ka 50 posível, só 4 ki ta fazi sentidu li. Isu ta reduzí drastikamenti xansi di modelu invoka skill eradu.

Estájiu 4 — Disizón (LLM call, 400-1200ms)

Agora modelu ta entra. OpenClaw ta fazi un xamada úniku a un LLM di fronteira (Anthropic Claude, OpenAI GPT, Google Gemini — konfigurável pur tenant) ku:

System prompt = persona di ajenti + regra + skills disponível.
History = turnus silisjionadu na estájiu 2.
User message = mensaji di turnu atual.

Modelu ta risponde un di dos kóza:

Risposta final (testu diretu pa klenti).
Tool call (pididu pa ezekuta un skill ispesífiku ku parámetru).

Na exenplu "N kre marka pa sábadu di manha", modelu tipikamenti ta retorna:

{
  "tool": "consultar_calendario",
  "args": { "date_range": "2026-04-19 06:00 to 12:00" }
}

Estájiu 5 — Ezekuson ku guard-rails (variável, ~100-500ms)

Skill ka ta roda na modelu. El ta roda na un kódigu nós, ki:

Valida parâmetrus (date_range ten formatu koretu? sta dretu di regra di tenant?).
Tcheka permison (es agenti ten diretu di konsulta es kalendáriu?).
Exekuta txamada (Google Calendar API nês kazu).
Retorna resultadu struturadu pa modelu.

Pamodi ki isu importa? Pamodi ki modelu nunka fabrika resultadu. Si kalendáriu retorna [10h, 11h], é ezatamenti isu ki bai pa prósimu txamada. Si skill falha, modelu sabi ki falha. Zero risku di agenti "inventa" ki ten oráriu na 9h kuandu ka ten.

Pa kazu ki ta involvê informason sensível (presu, prazu, nomi di klenti), pipeline ta forsa tool call — ka ta dexa modelu risponde di própi "konximentu". Isu elimina klasi di alusinason más komun na agenti komersial.

Estájiu 6 — Risposta i persistênsia (~50ms)

Ku resultadu di skill na mon, modelu ta fazi segunda txamada — agora pa forma risposta final pa klenti. Ex:

"N ten sábadu na 10h i 11h. Kal ki bu prefere?"

Paralelamenti, worker:

Manda mensaji di volta pél API di WhatsApp.
Persisti turnu kompletu (user + assistant + tool calls + durason) na D1.
Atualiza memória di longu prazu si turnu produzi fatu nobu (ex: "klenti prefere sábadu").
Emiti eventu di observabilidadi (métrika di latênsia, kustu di token, taxa di eskalason).

Tudu isu ta korre na paralelu. Persistênsia ka ta blokia enviu di mensaji — klenti ka ta spera D1.

Undi ki sta defeza kontra alusinason

Agenti ki ta alusina na produson ta perde konfiansa rápidu. OpenClaw ten 4 linha di defeza:

Source-of-truth forsadu. Dadus faktual (presu, oráriu, nomi) sempri ta ben di skill, nunka di modelu sozinhu.
Verifikason dupla na dadus sensível. Ajendamentu é konfirmadu ku klenti antis di persisti. Pagamentu é konfirmadu antis di libera asesu.
Regra negativa esplísita. Persona di kada agenti ta inklui "nunka inventa X, Y, Z" — modelu ta obedese.
Fallback pa umanu. Kuandu ninhun skill ka ta kubri pergunta, agenti ta fala "dexa-m txeka ku ekipa" i ta abri un ticket — ka ta xuta.

Na auditoria ki nu fazi na últimu 6 mês (konversa real revista manualmente), taxa di alusinason faktual fika baxu di 0,3% di turnu — i kuaze tudu kazu foi pa config (tenant skese di abilita skill relevanti), ka éru di modelu.

Kustu pa konversa

Arkitetura bon é invizível até bo odja fatura. Dadu ki kada turnu ta fazi 1-2 chamada di LLM + lookups na D1, kustu típiku pa konversa kompletu (10-15 turnus) ta fika na:

Equipe OpenClaw

Publicado em 2 de junho de 2026