RM
Volver a casos

Sistemas de IA / Flujo de auditoría

Website Audit Agent

Un flujo de auditoría web basado en evidencia que convierte sitios públicos en informes estructurados de UX, SEO, rendimiento, contenido e inteligencia comercial.

El objetivo era convertir la revisión web —normalmente subjetiva— en un flujo repetible basado en evidencia, manteniendo la IA útil pero acotada.

Motor rule-firstCaptura browser-firstSíntesis LLM acotadaHerramienta interna privada
Website Audit AgentCompleto
Capture: Navegador renderizadoEvidence confidence: Alta
UX82
SEO74
Rendimiento68
Contenido79
Accesibilidad71
Hallazgo principal

El CTA principal es visible, pero no está reforzado de forma consistente above the fold.

Etiqueta de evidencia: Observed
Vista representativa. No es un resultado de auditoría en vivo.

Problema

El problema de las auditorías con IA es la confianza.

Muchas herramientas de auditoría web con IA mezclan observación, scoring e interpretación en una sola respuesta opaca del modelo. El resultado puede ser rápido, pero difícil de confiar.

Website Audit Agent se diseñó alrededor del principio contrario: antes de que el modelo diga nada, el sistema debe capturar evidencia, clasificar confianza y definir qué se sabe realmente.

Resumen

La verdad de auditoría es determinista. La IA interpreta.

No es un chatbot de auditoría de forma libre. El modelo no crea hallazgos, no puntúa categorías, no inventa métricas y no convierte señales débiles en hechos medidos. La capa LLM solo sintetiza evidencia aceptada, lo que hace el flujo más creíble para prospección interna.

Primero captura evidencia

El flujo parte de evidencia pública del sitio, no de especulación del modelo. Primero intenta captura renderizada y usa evidencia pública estática como fallback.

Puntúa con reglas

Los hallazgos y scores de categoría se producen de forma determinista desde la evidencia capturada antes de cualquier síntesis.

Interpreta después

Gemini y el Prospect Audit Agent reciben solo hallazgos aceptados y los traducen en inteligencia interna de adquisición.

Flujo

Pipeline controlado desde URL pública hasta informe privado

La arquitectura separa captura, persistencia, scoring, síntesis y ensamblaje del informe para que cada etapa tenga un dueño y un modo de fallo claro.

URL IntakeCaptura browser / estáticaEvidence StoreScoring deterministaSíntesis IA acotadaInforme interno

URL Intake

El usuario envía la URL de un sitio público.

Captura browser / estática

Primero se captura evidencia renderizada y, si falla o está bloqueada, se usa evidencia pública estática.

Evidence Store

Los snapshots y la evidencia de página se persisten para la ejecución.

Scoring determinista

Las reglas generan hallazgos y scores de categoría.

Síntesis IA acotada

Gemini y el Prospect Audit Agent resumen solo hallazgos aceptados.

Informe interno

El output se convierte en inteligencia privada de adquisición.

Modelo de evidencia

Cada afirmación necesita un estado de evidencia

El sistema puede interpretar, pero no debe presentar una inferencia como medición. Las etiquetas de evidencia hacen visible ese límite dentro del informe.

Measured

Measured

Capturado o calculado directamente.

Observed

Observed

Visible en la evidencia capturada de la página.

Inferred

Inferred

Interpretación a partir de señales disponibles; nunca se presenta como verdad medida.

Capa agéntica

La IA está aguas abajo por diseño.

Es un sistema híbrido workflow-agent. El shell determinista controla captura, scoring, persistencia, estado y ensamblaje del informe. La capa LLM controla resumen, priorización, explicación e inteligencia comercial. El Prospect Audit Agent no navega libremente, no reescribe hallazgos y no crea scores.

Motor determinista de auditoríaHallazgos aceptadosProspect Audit AgentInteligencia interna

Qué puede y qué no puede hacer el LLM

Permitido

  • Sintetizar hallazgos aceptados.
  • Priorizar recomendaciones.
  • Traducir evidencia de auditoría en inteligencia comercial interna.
  • Explicar por qué un hallazgo importa comercialmente.

Bloqueado

  • Crear hallazgos de auditoría.
  • Modificar scores de categoría.
  • Inventar métricas.
  • Presentar inferencias como verdad medida.
  • Hacer afirmaciones de ingresos sin soporte.

Informe

Un informe privado construido desde evidencia aceptada

La superficie de informe es deliberadamente interna. Presenta scores, confianza, etiquetas de evidencia y hallazgos principales sin exponer el despliegue privado de Vercel como demo pública.

ObservedEstado de síntesis
Hallazgo

El CTA principal es visible, pero está débilmente reforzado above the fold.

Categoría
UX / Conversión
Evidencia
Observed
Fuente
Captura renderizada en navegador
Permitida — basada solo en evidencia aceptada.
Tarjeta representativa de hallazgo. No es un resultado de auditoría en vivo.

Seguridad / Límite de acceso

Repositorio público. Superficie operativa privada.

El proyecto es público para portfolio y referencia, mientras que la superficie operativa permanece privada detrás de login interno y endpoint de trabajo protegido.

Despliegue privado en VercelLogin interno y access gateEndpoint de job protegido con worker secretSolo evidencia pública del sitioSin bypass anti-botSin demo pública en vivo

Resultado

Un sistema de IA útil porque se mantiene dentro de sus límites.

El resultado es un flujo privado de adquisición capaz de convertir una URL pública en un informe interno estructurado con etiquetas de evidencia, scores por categoría y hallazgos priorizados.

Pipeline repetible

Una URL pública pasa por captura, almacenamiento de evidencia, scoring, síntesis e informe con fronteras explícitas.

Síntesis IA controlada

El LLM resume hallazgos aceptados y contexto comercial sin crear verdad de auditoría.

Disciplina de evidencia

Las afirmaciones medidas, observadas e inferidas se mantienen separadas durante todo el informe.

Arquitectura segura para portfolio

El repositorio puede mostrarse públicamente mientras la superficie operativa y los informes generados siguen privados.

Stack

Construido como prototipo orientado a producción

El stack es práctico: Next.js para la superficie de app, Postgres y pg-boss para ejecuciones durables, Playwright para captura, Gemini para síntesis acotada y un endpoint worker protegido de forma separada.

Next.jsTypeScriptPostgrespg-bossPlaywrightGeminiVercelScoring deterministaEtiquetas de evidenciaEndpoint worker privado

Límites / Mejoras futuras

Son límites de diseño, no excusas.

El alcance actual es deliberadamente estrecho para que el caso de estudio no sobreprometa lo que hace el sistema.

  • No es un SaaS público.
  • No hay demo pública en vivo.
  • Prospect Intelligence es guía interna, no verdad de auditoría.
  • Los informes static-only excluyen intencionalmente scoring visual/mobile/above-the-fold.
  • La síntesis IA depende de hallazgos aceptados.
  • El trabajo futuro incluye evals, comparación de modelos, observabilidad y ejemplos reales de auditoría.