Sistemas de IA / Flujo de auditoría

Website Audit Agent

Un flujo de auditoría web basado en evidencia que convierte sitios públicos en informes estructurados de UX, SEO, rendimiento, contenido e inteligencia comercial.

El objetivo era convertir la revisión web —normalmente subjetiva— en un flujo repetible basado en evidencia, manteniendo la IA útil pero acotada.

Ver GitHub →Cómo funciona

Motor basado en reglasCaptura con navegadorSíntesis LLM acotadaHerramienta interna privada

Website Audit AgentCompleto

Capture: Navegador renderizadoEvidence confidence: Alta

UX82

SEO74

Rendimiento68

Contenido79

Accesibilidad71

Hallazgo principal

El CTA principal es visible, pero no está reforzado de forma consistente en el primer tramo de pantalla.

Etiqueta de evidencia: Observed

Vista representativa. No es un resultado de auditoría en vivo.

Resumen del caso

El brief estratégico

El problema, la respuesta del sistema, la prueba disponible, el valor estratégico y el límite intencional.

01Problema: Las auditorías web con IA suelen mezclar observación, puntuación e inferencia en una respuesta opaca.
02Sistema: Un pipeline de captura de URL pública con almacenamiento de evidencia, scoring determinista, síntesis acotada e informe privado.
03Prueba: Repositorio público, vista de informe anonimizada, etiquetas de evidencia, diagramas y límites documentados.
04Valor: Crea diagnósticos web más rápidos y repetibles preservando la diferencia entre medición, observación e inferencia.
05Límite: Audita solo evidencia web pública y no accede a analítica privada, conversiones ni sistemas propietarios.

Ver GitHub

Contexto de negocio

El problema de flujo del proyecto

Las revisiones web tienen mucha fricción porque los equipos necesitan evidencia, prioridad e interpretación comercial, no feedback genérico de IA. Este proyecto explora cómo la IA puede acelerar diagnósticos manteniendo separadas medición, observación e inferencia.

Sistema / Solución

Cómo se acota el flujo

El sistema recibe una URL pública, captura evidencia renderizada o estática, guarda la ejecución, aplica puntuación determinista y solo después pasa los hallazgos aceptados a una capa de síntesis con IA. El informe mantiene visibles las etiquetas de evidencia para que las recomendaciones se puedan revisar, no aceptar a ciegas.

Inputs

URLs públicas y evidencia de página capturada mediante navegador o colección estática.

Flujo

Entrada de URL, captura, almacenamiento de evidencia, puntuación determinista, síntesis acotada y ensamblaje del informe interno.

Lógica de proceso

Las reglas generan hallazgos y puntuaciones antes de que el modelo resuma la evidencia aceptada.

Resultado

Informe privado con scores, confianza, etiquetas de evidencia, hallazgos principales y recomendaciones priorizadas.

Límites

El LLM no puede crear hallazgos, cambiar puntuaciones, inventar métricas ni presentar inferencias como verdad medida.

Problema

El problema de las auditorías con IA es la confianza.

Muchas herramientas de auditoría web con IA mezclan observación, puntuación e interpretación en una sola respuesta opaca del modelo. El resultado puede ser rápido, pero cuesta confiar en él.

Website Audit Agent se diseñó alrededor del principio contrario: antes de que el modelo diga nada, el sistema debe capturar evidencia, clasificar confianza y definir qué se sabe realmente.

Resumen

La verdad de auditoría es determinista. La IA interpreta.

No es un chatbot de auditoría de forma libre. El modelo no crea hallazgos, no puntúa categorías, no inventa métricas y no convierte señales débiles en hechos medidos. La capa LLM solo sintetiza evidencia aceptada, lo que hace el flujo más creíble para prospección interna.

Primero captura evidencia

El flujo parte de evidencia pública del sitio, no de especulación del modelo. Primero intenta captura renderizada y usa evidencia pública estática como respaldo.

Puntúa con reglas

Los hallazgos y scores de categoría se producen de forma determinista desde la evidencia capturada antes de cualquier síntesis.

Interpreta después

Gemini y el Prospect Audit Agent reciben solo hallazgos aceptados y los traducen en inteligencia interna de adquisición.

Flujo

Pipeline controlado desde URL pública hasta informe privado

La arquitectura separa captura, persistencia, puntuación, síntesis y ensamblaje del informe para que cada etapa tenga un dueño y un modo de fallo claro.

URL IntakeCaptura con navegador / estáticaAlmacén de evidenciaPuntuación deterministaSíntesis IA acotadaInforme interno

URL Intake

El usuario envía la URL de un sitio público.

Captura con navegador / estática

Primero se captura evidencia renderizada y, si falla o está bloqueada, se usa evidencia pública estática.

Almacén de evidencia

Los snapshots y la evidencia de página se persisten para la ejecución.

Puntuación determinista

Las reglas generan hallazgos y scores de categoría.

Síntesis IA acotada

Gemini y el Prospect Audit Agent resumen solo hallazgos aceptados.

Informe interno

El resultado se convierte en inteligencia privada de adquisición.

Modelo de evidencia

Cada afirmación necesita un estado de evidencia

El sistema puede interpretar, pero no debe presentar una inferencia como medición. Las etiquetas de evidencia hacen visible ese límite dentro del informe.

Measured

Capturado o calculado directamente.

Observed

Visible en la evidencia capturada de la página.

Inferred

Interpretación a partir de señales disponibles; nunca se presenta como verdad medida.

Capa agéntica

La IA está aguas abajo por diseño.

Es un sistema híbrido entre flujo y agente. La capa determinista controla captura, puntuación, persistencia, estado y ensamblaje del informe. La capa LLM se encarga de resumir, priorizar, explicar y traducir los hallazgos a inteligencia comercial. El Prospect Audit Agent no navega libremente, no reescribe hallazgos y no crea puntuaciones.

Motor determinista de auditoríaHallazgos aceptadosProspect Audit AgentInteligencia interna

Qué puede y qué no puede hacer el LLM

Permitido

Sintetizar hallazgos aceptados.
Priorizar recomendaciones.
Traducir evidencia de auditoría en inteligencia comercial interna.
Explicar por qué un hallazgo importa comercialmente.

Bloqueado

Crear hallazgos de auditoría.
Modificar scores de categoría.
Inventar métricas.
Presentar inferencias como verdad medida.
Hacer afirmaciones de ingresos sin soporte.

Informe

Un informe privado construido desde evidencia aceptada

La superficie de informe es deliberadamente interna. Presenta scores, confianza, etiquetas de evidencia y hallazgos principales sin exponer el despliegue privado de Vercel como demo pública.

Hallazgo

El CTA principal es visible, pero queda poco reforzado en el primer tramo de pantalla.

Categoría: UX / Conversión
Evidencia: Observed
Fuente: Captura renderizada en navegador

Permitida — basada solo en evidencia aceptada.

Tarjeta representativa de hallazgo. No es un resultado de auditoría en vivo.

Ejemplo de informe

Ejemplo sintético/anonimizado basado solo en evidencia pública de página.

Measured evidence: Longitud del title, número de headings, cobertura de alt text y estado de respuesta se capturan directamente desde la página pública.
Observed evidence: El CTA principal aparece en el primer tramo, pero la prueba que lo respalda queda más abajo.
Inferred evidence: Un visitante nuevo puede entender la oferta antes de entender por qué es creíble.
Recommendation: Acercar una señal de prueba al CTA del hero y mantener el claim unido a evidencia visible.
Caveat: El workflow no accede a analítica privada, tasa de conversión, CRM ni datos propietarios de rendimiento.

Seguridad / Límite de acceso

Repositorio público. Superficie operativa privada.

El proyecto es público como portafolio y referencia, mientras que la superficie operativa permanece privada detrás de login interno y endpoint de trabajo protegido.

Despliegue privado en VercelLogin interno y control de accesoEndpoint de job protegido con worker secretSolo evidencia pública del sitioSin bypass anti-botSin demo pública en vivo

Resultado

Un sistema de IA útil porque se mantiene dentro de sus límites.

El resultado es un flujo privado de adquisición capaz de convertir una URL pública en un informe interno estructurado con etiquetas de evidencia, scores por categoría y hallazgos priorizados.

Pipeline repetible

Una URL pública pasa por captura, almacenamiento de evidencia, puntuación, síntesis e informe con fronteras explícitas.

Síntesis IA controlada

El LLM resume hallazgos aceptados y contexto comercial sin crear verdad de auditoría.

Disciplina de evidencia

Las afirmaciones medidas, observadas e inferidas se mantienen separadas durante todo el informe.

Arquitectura segura para portafolio

El repositorio puede mostrarse públicamente mientras la superficie operativa y los informes generados siguen privados.

Stack

Construido como prototipo orientado a producción

El stack es práctico: Next.js para la superficie de app, Postgres y pg-boss para ejecuciones duraderas, Playwright para captura, Gemini para síntesis acotada y un endpoint worker protegido por separado.

Next.jsTypeScriptPostgrespg-bossPlaywrightGeminiVercelPuntuación deterministaEtiquetas de evidenciaEndpoint worker privado

Límites / Mejoras futuras

Son límites de diseño, no excusas.

El alcance actual es deliberadamente estrecho para que el caso de estudio no sobreprometa lo que hace el sistema.

No es un SaaS público.
No hay demo pública en vivo.
Prospect Intelligence es guía interna, no verdad de auditoría.
Los informes solo estáticos excluyen intencionalmente puntuación visual, móvil y del primer tramo de pantalla.
La síntesis IA depende de hallazgos aceptados.
El trabajo futuro incluye evals, comparación de modelos, observabilidad y ejemplos reales de auditoría.

Ver GitHub →Revisar flujo

Por qué importa

La fiabilidad pesa más que la novedad

Las auditorías con IA se vuelven arriesgadas cuando mezclan evidencia e interpretación en una única respuesta del modelo. Este sistema define entradas claras, evidencia aceptada, puntuación determinista y síntesis revisable, lo que hace las recomendaciones más útiles para equipos que necesitan diagnósticos repetibles.

Uso para clientes

Dónde se vuelve útil

Una versión para cliente podría ayudar a equipos de marca, contenido, producto o digital a estandarizar auditorías web, acelerar diagnósticos de UX/SEO/conversión y convertir observaciones desordenadas en apoyo claro para decidir.

Hablar de un sistema IA similar

¿Tienes un sistema creativo que merece desarrollarse?

Si tu equipo tiene un proceso creativo, herramienta interna, flujo de campaña o sistema de marca que merece ampliarse con IA, envía un brief breve y te ayudo a definir la lógica más clara.

Enviar brief de sistema creativo

Sistemas de IA / Flujo analíticoDataBrief AIVer caso →

Motor benchmark desde datos rawBenchmark Intelligence EngineVer caso →