Nota não é monitoria
Dar nota para atendimento é fácil.
Difícil é responder:
- por que a nota caiu?
- o erro veio da pessoa, da IA, da base, da regra ou do sistema?
- qual conversa precisa virar treinamento?
- qual prompt precisa mudar?
- qual integração falhou?
- qual política está confusa?
Monitoria existe para mudar rotina. Se não muda nada, é só relatório.
Por que IA entrou nessa conversa
Atendimento gera volume demais para revisar tudo manualmente. Com IA, fica possível classificar mais conversas, encontrar padrões e apontar risco mais rápido.
Mas os relatórios atuais carregam um aviso. A Salesforce mostra IA indo para o centro da operação de serviço. A Zendesk fala em experiências com IA mais humanas e personalizadas. A Intercom separa implantação superficial de transformação real. A Twilio mostra distância entre a confiança das empresas e a percepção dos consumidores sobre IA conversacional.
Ou seja: revisar mais conversa não basta. O critério precisa prestar.
Onde IA ajuda na monitoria
IA pode ajudar em:
- classificar motivo de contato;
- detectar sentimento ou frustração;
- encontrar ausência de saudação, confirmação ou encerramento;
- verificar se a resposta seguiu política;
- resumir conversa;
- apontar falha de handoff;
- identificar recontato;
- comparar promessa feita com próximo passo registrado;
- priorizar amostras ruins para revisão humana.
Isso é útil porque tira monitoria do sorteio de amostras pequenas.
Onde humano ainda precisa entrar
Humano precisa revisar quando existe:
- ambiguidade;
- exceção comercial;
- risco jurídico;
- cliente vulnerável;
- conflito entre política e bom senso;
- reclamação séria;
- avaliação que pode punir atendente;
- mudança de processo.
IA pode apontar. O dono da operação precisa decidir.
Scorecard mínimo
Um scorecard útil tem poucos critérios e evidência por critério.
| Critério | Pergunta | Evidência esperada |
|---|---|---|
| Entendeu intenção | O motivo real foi identificado? | Trecho da conversa e categoria aplicada. |
| Coletou dados mínimos | Pediu o necessário sem repetir? | Campos coletados ou ausentes. |
| Seguiu política | Respondeu dentro da regra? | Regra usada ou exceção marcada. |
| Não inventou | Admitiu limite quando não sabia? | Trecho de incerteza ou consulta. |
| Fez handoff correto | Passou para humano quando precisava? | Motivo, resumo e próxima ação. |
| Registrou no CRM | Deixou histórico útil? | Status, dono e próximo passo. |
| Resolveu ou encaminhou | O cliente saiu com caminho claro? | Encerramento e prazo. |
Evite scorecard de 40 itens. Ninguém corrige 40 coisas por semana.
O erro do score zero
Algumas operações zeram a nota inteira quando um critério crítico falha. Pode fazer sentido para risco grave. Mas, no dia a dia, isso também pode esconder aprendizado.
Se a conversa zerou porque faltou handoff, você ainda precisa saber se a intenção foi entendida, se o CRM foi atualizado, se a política estava clara e se a ferramenta falhou.
QA bom mostra o erro crítico sem apagar o resto da evidência.
Como fechar o ciclo
Toda semana, a monitoria deveria gerar três saídas:
- Correção de base ou roteiro — algo que a IA ou o humano estava respondendo errado.
- Correção de processo — handoff, CRM, fila, SLA ou dono.
- Correção de treinamento — o que precisa ser explicado para pessoas ou agentes.
Se o QA não gera essas três saídas, ele está incompleto.
O que fazer agora
Comece com 20 conversas reais.
Avalie manualmente com o scorecard acima. Depois use IA para pré-classificar as próximas 100. Compare onde ela acerta, onde erra e onde precisa de revisão humana.
Para medir sem autoengano, leia Medir atendimento automatizado sem engano. Para testar antes do go-live, leia O teste da IA não é a demo. É a fila cheia..