Atención al cliente 24/7 con IA: guía práctica 2026

AgentesNexo
··6 min lectura

Para implementar atención al cliente 24/7 con inteligencia artificial, necesitas tres componentes: un agente de IA entrenado con tu base de conocimiento, uno o más canales de entrada (voz, WhatsApp, web), y un flujo de escalación para casos que requieran intervención humana.

El problema que resuelve

Tu equipo atiende de 9am a 6pm. El cliente compra, tiene dudas y te escribe a las 11pm. Sin respuesta automatizada, perdiste esa venta o generaste fricción. Un agente de IA con atención 24/7 responde en segundos, califica la intención y escala cuando corresponde.

Esta guía es para equipos de 1 a 50 personas que quieren cubrir soporte, ventas y calificación de leads fuera del horario comercial sin contratar personal adicional.

Requisitos previos

  • Cuenta en n8n (self-hosted o cloud) para orquestación de flujos
  • Cuenta en Retell AI o Vapi para el canal de voz en español
  • WhatsApp Business API (Evolution API o BSP oficial) para el canal de mensajes
  • Base de conocimiento del negocio: preguntas frecuentes, catálogo, precios, procesos de compra
  • Tiempo estimado de configuración inicial: 4-8 horas

Paso 1: Construir la base de conocimiento del agente

El agente sabe exactamente lo que tú le das. Una base de conocimiento mal armada produce respuestas vagas o incorrectas. Empieza con un archivo de texto estructurado:

markdown
## Quiénes somos
Tu empresa ofrece [producto/servicio] para [segmento].
Horario de atención humana: lunes a viernes, 9am-6pm (UTC-4).

## Preguntas frecuentes
P: ¿Cuánto demora la entrega?
R: Entre 3 y 5 días hábiles. Express disponible en 24h con costo adicional.

P: ¿Aceptan devoluciones?
R: Sí, hasta 30 días con el producto en condiciones originales.

## Cuándo escalar a humano:
- El cliente menciona queja o reclamo formal
- La consulta involucra montos mayores a 500 USD
- El cliente lleva más de 3 mensajes sin resolución

Este archivo se carga como system prompt del agente. Para mayor volumen de información, se indexa en un vector store (Supabase + pgvector o Pinecone) y el agente lo consulta dinámicamente.

Paso 2: Configurar el agente de IA por canal

Canal de voz (Retell AI en español):

bash
curl -X POST https://api.retellai.com/create-agent \
  -H #43a047">"Authorization: Bearer RETELL_API_KEY" \
  -H #43a047">"Content-Type: application/json" \
  -d '{
    #43a047">"agent_name": "Soporte 24/7",
    #43a047">"voice_id": "es-MX-DaliaNeural",
    #43a047">"language": "es",
    #43a047">"response_engine": {
      #43a047">"type": "retell-llm",
      #43a047">"llm_id": "TU_LLM_ID"
    },
    #43a047">"begin_message": "Hola, soy el asistente de tu empresa. ¿En qué te puedo ayudar?"
  }'

Canal de WhatsApp (Evolution API + n8n):

El webhook de n8n recibe cada mensaje entrante, lo pasa al LLM con el historial de conversación, y devuelve la respuesta al número del cliente vía Evolution API:

javascript
// n8n HTTP Request node — enviar respuesta
{
  #43a047">"method": "POST",
  #43a047">"url": "http://evolution-api:8080/message/sendText/{{instance}}",
  #43a047">"body": {
    #43a047">"number": "{{$json.key.remoteJid}}",
    #43a047">"text": "{{$json.llm_response}}"
  }
}

Paso 3: Implementar el flujo de escalación

El agente no debe intentar resolver todo. Un flujo claro evita que el cliente quede atrapado en un loop sin solución.

typescript
// Function node en n8n — detector de escalación
const mensaje = $input.item.json.message.toLowerCase();
const keywords = [#43a047">"queja", "reclamo", "fraude", "hablar con humano", "gerente"];

const requiereEscalacion = keywords.some(k => mensaje.includes(k));

if (requiereEscalacion) {
  return [{
    json: {
      ...$ input.item.json,
      escalate: true,
      reason: #43a047">"keyword_detected",
      notifyAgent: true
    }
  }];
}
return [{ json: { ...$input.item.json, escalate: false } }];

Cuando escalate: true, el flujo notifica al agente humano por Telegram o email y responde al cliente: "Entiendo tu situación. Te estoy conectando con alguien de nuestro equipo. Te responderán antes de las 9am."

Paso 4: Monitorear y ajustar en las primeras dos semanas

Las primeras dos semanas son de calibración. Los indicadores clave:

  • Tasa de resolución sin escalación: objetivo mayor a 70% para la semana 2
  • Tiempo de primera respuesta: menos de 5 segundos en WhatsApp, menos de 1.5 segundos en voz
  • Mensajes donde el agente respondió que no sabe: cada uno indica un gap en la base de conocimiento
javascript
// Loggear conversaciones para análisis posterior
const log = {
  timestamp: new Date().toISOString(),
  channel: $(#43a047">"Webhook").item.json.channel,
  resolved: !$(#43a047">"Escalacion").item.json.escalate,
  turns: $(#43a047">"Counter").item.json.count,
  intent: $(#43a047">"Classifier").item.json.intent
};
// Append a Google Sheets via API para revisión semanal

Arquitectura del sistema

Cliente (WhatsApp / voz / web chat)
        ↓
  Canal de entrada (Evolution API / Retell AI / widget)
        ↓
  n8n — Orquestador central
   ├─ Contexto conversacional (Redis o PostgreSQL)
   ├─ LLM con base de conocimiento (Claude Sonnet 4.5)
   ├─ Clasificador de intención (consulta / compra / queja)
   └─ Decisor de escalación
        ↓
  Respuesta al canal  |  Notificación a agente humano

El orquestador en n8n mantiene el historial de cada conversación, clasifica la intención del mensaje y decide si responde el agente autónomo o escala al equipo. Redis almacena el contexto conversacional con TTL de 24 horas.

Lo que aprendimos en producción

  1. El primer mensaje define el tono: un saludo genérico hace que el 40% abandone antes de escribir. Mencionar el servicio específico duplica el engagement inicial.
  2. Voz y texto son canales distintos: el agente de voz necesita frases cortas y confirmaciones frecuentes. El mismo prompt de WhatsApp en voz suena artificial.
  3. La base de conocimiento se desactualiza rápido: cada cambio de precio o política debe replicarse en el agente. Recomendamos revisión quincenal.
  4. Escalación bien comunicada no genera fricción: el cliente acepta ser derivado a un humano si se le da un tiempo claro de respuesta y no se siente ignorado.
  5. El pico nocturno es real: más del 60% de las consultas fuera de horario comercial ocurren entre las 8pm y las 11pm en clientes de LATAM.

En resumen

  • Define tus canales de entrada: WhatsApp, voz y/o web chat
  • Construye una base de conocimiento estructurada con preguntas frecuentes y reglas de escalación
  • Configura el agente con Retell AI para voz o Evolution API + n8n para WhatsApp
  • Implementa un flujo de escalación con notificación al equipo humano y mensaje claro al cliente
  • Monitorea la tasa de resolución y ajusta la base de conocimiento cada dos semanas

Si quieres implementar esto en tu negocio sin construirlo desde cero, en AgentesNexo lo hacemos por ti. Escríbenos en agentesnexo.com o por WhatsApp al +591 67564218.

Implementa atención al cliente 24/7 con IA en tu negocio. Escríbenos en agentesnexo.com o por WhatsApp al +591 67564218.

Articulos relacionados