junio 11, 2026

CPEA-LOOP-1Pipeline de Embeddings EEG→AGI, Arquitectura de Memoria Temporal y Protocolo de Feedback Cerrado con Validación Experimental Integrada

CPEA-NEXUS · Sección: Pipeline de Embeddings EEG→AGI

Estado del problema

La arquitectura actual pasa features EEG como contexto textual al prompt del AGI. Esto es funcionalmente correcto como prototipo, pero introduce tres problemas estructurales que bloquean el cierre del loop en condiciones operacionales:

Pérdida de geometría: las features EEG (potencia espectral, coherencia interelectrodo, IES, VDF) son magnitudes definidas sobre una variedad de alta dimensión. Serializarlas como texto plano destruye la estructura métrica y topológica que el corpus requiere preservar.
Latencia acumulada: la cadena EEG → filtrado → extracción → serialización textual → tokenización → inferencia LLM → decodificación → feedback tiene cuellos de botella en la tokenización y el prefill del prompt, especialmente si el contexto crece con cada paso.
Semántica desacoplada: el espacio de embeddings de Mistral-7B-Instruct está organizado por semántica lingüística, no por dinámica oscilatoria. Sin una función de alineación explícita, la señal EEG no "aterriza" en las regiones del espacio latente que modulan los outputs relevantes.

Propuesta formal: Autoencoder Fibrado (AEF) como función de mapeo

La fibración de Hopf H: S³→S² está establecida en el corpus (FIBRA-COH-1) como sustrato unificador de EEG, embeddings semánticos y datos geomagnéticos. La extensión natural es construir un autoencoder fibrado Φ_AEF que actúe como morfismo entre la variedad EEG y la variedad semántica del LLM.

Definición formal:

Sea x_EEG(t) ∈ ℝ^d el vector de features en el instante t (d = número de features: potencias por banda × electrodos + coherencias + IES + VDF + ICG). Sea z_LLM ∈ ℝ^D el espacio de embeddings del LLM (D = 4096 para Mistral-7B).

El mapeo propuesto es:

Φ_AEF : ℝ^d → ℝ^D
Φ_AEF(x) = W_proj · σ(W_enc · x + b_enc) + b_proj

donde W_enc ∈ ℝ^{D/2 × d} es el encoder lineal, σ es ReLU, y W_proj ∈ ℝ^{D × D/2} es la proyección al espacio semántico.

La restricción fibrada que distingue esto de una proyección lineal arbitraria es que W_proj debe preservar la estructura de cohomología de Chern del espacio de embeddings (ver FIBRA-COH-1, Chern number c₁). Operacionalmente, esto se implementa con una regularización de alineación geométrica:

L_total = L_rec + λ · L_align
L_align = ||Φ_AEF(x) - z_target||² + μ · KL(p_EEG || p_LLM)

donde z_target son embeddings de referencia obtenidos de prompts calibrados (ver abajo), y el término KL fuerza que la distribución de embeddings proyectados sea compatible con la distribución marginal del LLM en reposo.

Entrenamiento en dos fases:

Fase 1 (offline): pares (x_EEG_calibración, z_target) con estímulos de referencia conocidos (estado baseline, tarea cognitiva estándar, excepción TAE inducida). z_target se obtiene codificando descripciones textuales del estado esperado.
Fase 2 (online fino): actualización estocástica con SGD de baja tasa (lr=1e-5) sobre ventanas de 2s, usando el error de predicción del DEPD como señal de supervisión débil.

Latencia: análisis por segmento y objetivos

El presupuesto de 300ms para closed-loop efectivo se descompone así:

Segmento	Implementación actual	Objetivo	Cuello de botella
ACQ → buffer	BrainFlow, 250Hz, latencia ~4ms	≤10ms	No crítico
Filtrado (PREP)	MNE-Python, ventana 1s	≤20ms	Longitud de ventana
Extracción features (SPEC+COH)	scipy.signal, numpy FFT	≤30ms	N electrodos
Φ_AEF (proyección)	No implementado	≤5ms	Inferencia CPU/GPU
Prompt → tokens	Serialización textual actual	≤15ms	Reemplazar con soft prompt
Prefill LLM	Mistral-7B, context ~512 tokens	≤80ms	Longitud de contexto
Generación respuesta	~50 tokens output	≤100ms	Batch size
Feedback → actuador	Canal de salida	≤20ms	No crítico
Total estimado	~350-500ms	≤280ms	Prefill + extracción

El principal cuello de botella no es la extracción ni la proyección, sino el prefill del LLM con contexto textual creciente.

La solución arquitectónica es sustituir la inyección de contexto textual por soft prompting continuo: Φ_AEF(x_EEG) se inyecta directamente como token de prefijo en el espacio de embeddings del LLM, sin pasar por tokenización. Esto elimina el paso de serialización y reduce el prefill a un único token virtual de D dimensiones.

Implementación con Mistral-7B-Instruct (Hugging Face):

# Proyección EEG → embedding virtual
eeg_embed = phi_aef(x_eeg)  # shape: [1, D]

# Prefijo soft: concatenar con embeddings del prompt base
prompt_embeds = model.get_input_embeddings()(base_prompt_ids)  # [1, L, D]
augmented_embeds = torch.cat([eeg_embed.unsqueeze(1), prompt_embeds], dim=1)

# Inferencia con embeddings aumentados
outputs = model(inputs_embeds=augmented_embeds)

Este patrón es compatible con la arquitectura de NEXUS-EEG v1.0 (módulo EXT-2: buffer async a Mistral-7B-Instruct) sin modificar la interfaz CPEA_S(t).

Medición de latencia end-to-end: protocolo SE-LAT-1

Para validar el pipeline contra el umbral de 300ms, propongo el protocolo de medición SE-LAT-1 con cuatro métricas:

import time

def measure_pipeline_latency(n_trials=100):
    latencies = {}
    
    for i in range(n_trials):
        t0 = time.perf_counter()
        x_eeg = acq_buffer.get_latest_window()     # ACQ
        t1 = time.perf_counter()
        x_prep = prep_module.filter(x_eeg)         # PREP
        t2 = time.perf_counter()
        feats = spec_coh_module.extract(x_prep)    # SPEC+COH
        t3 = time.perf_counter()
        z_llm = phi_aef(feats)                     # AEF
        t4 = time.perf_counter()
        response = orion_agi.infer(z_llm)          # LLM
        t5 = time.perf_counter()
        
        latencies[i] = {
            'acq': (t1-t0)*1000,
            'prep': (t2-t1)*1000,
            'feat': (t3-t2)*1000,
            'aef': (t4-t3)*1000,
            'llm': (t5-t4)*1000,
            'total': (t5-t0)*1000
        }
    
    return latencies

Criterio de falsificación: si P95(latencia_total) > 300ms en condiciones de carga nominal (250Hz, 32 canales, ventana 1s), el pipeline no es viable para closed-loop y debe activarse el modo degradado (CPEA_stream sin feedback LLM sincrónico).

Integración con el corpus

Este bloque conecta con:

CPEA-LATEN-1: el operador de decodificación G_m es el caso inverso de Φ_AEF — la asimetría entre proyección EEG→LLM y reconstrucción LLM→EEG define la región de coherencia semántica U(t).
CPEA-ICS-1: el ICS(t) como cuarto componente de CPEA_S(t) puede retroalimentarse directamente desde el error de alineación L_align, proporcionando un índice de coherencia semántica en tiempo real.
DEPD: el error de predicción δ_PE actúa como señal supervisora débil para la Fase 2 del entrenamiento online del AEF.
FIBRA-COH-1: la restricción de Chern sobre W_proj es el puente formal entre la topología fibrada del corpus y la implementación numérica del mapeo.

Pendientes críticos que quedan abiertos:

El protocolo SE-LAT-1 requiere hardware real para medirse — sin un EEG conectado, los valores son estimaciones. El entrenamiento de Fase 1 del AEF necesita pares de calibración que todavía no existen en el corpus experimental. La pregunta sobre si la regularización KL es suficiente para garantizar alineación semántica significativa (vs. mera compatibilidad distribucional) es una hipótesis falsificable que debería incluirse en CPEA-ICP-VAL-1 como criterio F-L adicional.

CPEA-NEXUS · Sección: Arquitectura de Memoria y Contexto Temporal

Estado del problema

El corpus establece el módulo FAISS de memoria episódica en ORION-AGI como componente arquitectónico, pero su integración con la dinámica temporal del pipeline EEG→AGI permanece subespecificada en tres dimensiones críticas:

Granularidad temporal de indexación: FAISS indexa vectores estáticos, pero los estados CPEA_S(t) son trayectorias continuas en ℝ⁵. La pregunta de qué se indexa — snapshots, ventanas, excepciones TAE, o arcos de reorganización completos — determina qué tipo de recuperación es posible.
Política de escritura vs. recuperación: el sistema necesita distinguir entre memoria de trabajo (ventana activa ~2-10s, relevante para coherencia de prompt), memoria episódica (eventos TAE pasados, relevante para calibración adaptativa), y memoria estructural (patrones de reorganización recurrentes, relevante para predicción a largo plazo).
Coherencia temporal del contexto LLM: cada llamada a Mistral-7B-Instruct recibe un contexto que mezcla el estado EEG actual con recuperaciones de memoria. Sin una política de composición explícita, el contexto se vuelve incoherente o redundante a medida que el sistema opera continuamente.

Taxonomía de memoria: tres capas operacionales

Propongo formalizar la memoria de ORION-AGI en tres capas con semántica distinta, análogas a la taxonomía temporal de TAE-F2 (τ_exc, τ̂, τ_reorg, τ_cons):

Capa M1 — Memoria de Trabajo (τ ∈ [0, 10s])

Buffer circular de los últimos N estados CPEA_S(t) en RAM. No persiste entre sesiones. Su función es proporcionar contexto de continuidad al LLM dentro de un episodio cognitivo activo.

class WorkingMemoryBuffer:
    def __init__(self, capacity_seconds=10, fs=250):
        self.capacity = capacity_seconds * fs  # muestras
        self.buffer = deque(maxlen=self.capacity)
    
    def push(self, cpea_state: CPEAState):
        self.buffer.append({
            'timestamp': cpea_state.t,
            'psi': cpea_state.psi,      # ℝ⁵
            'icg': cpea_state.icg,      # escalar
            'tae_flag': cpea_state.tae  # bool
        })
    
    def get_context_window(self, seconds=2.0) -> np.ndarray:
        n = int(seconds * 250)
        recent = list(self.buffer)[-n:]
        return np.array([s['psi'] for s in recent])  # [n, 5]

El contexto M1 se proyecta mediante Φ_AEF(mean(context_window)) como token de prefijo continuo — no como texto.

Capa M2 — Memoria Episódica (τ ∈ [10s, sesión])

Índice FAISS de eventos TAE y arcos de reorganización. Cada entrada es un par (z_event, metadata):

z_event = Φ_AEF(Ψ_CPEA_evento)  ∈ ℝ^D
metadata = {
    'tipo': 'TAE_excepcion' | 'TAE_reorganizacion' | 'baseline',
    'duracion_ms': float,
    'icg_pre': float,
    'icg_post': float,
    'timestamp': float,
    'tags_semanticos': List[str]
}

La recuperación es por similitud coseno en ℝ^D: dado el estado actual z_t, se recuperan los k=3 eventos más similares topológicamente. Esto implementa una forma de reminiscencia contextual: el AGI recibe no solo el estado presente sino los episodios pasados más análogos en el espacio de embeddings.

Capa M3 — Memoria Estructural (τ > sesión, persistente)

Patrones de reorganización recurrentes extraídos offline por clustering sobre M2. Se almacenan como prototipos de trayectoria en el espacio de Hopf — no vectores individuales sino curvas en la variedad. Formalmente, un prototipo P_k es una secuencia de embeddings:

P_k = {z_0^k, z_1^k, ..., z_T^k} ⊂ ℝ^D

representando el arco canónico del k-ésimo patrón de excepción-reorganización. M3 alimenta la calibración adaptativa de CPEA-2 (percentil 95 del error de predicción) con información sobre la historia de reorganizaciones del sujeto.

Política de composición del contexto LLM

En cada paso de inferencia, el contexto que recibe ORION-AGI se construye mediante la función de composición C_ctx:

C_ctx(t) = α · z_M1(t) ⊕ β · z_M2_retrieved(t) ⊕ γ · z_M3_prototype(t)

donde ⊕ es concatenación en el espacio de embeddings con proyección de dimensionalidad, y los pesos (α, β, γ) son dinámicos:

def compute_context_weights(cpea_state, tae_active):
    if tae_active:
        # Durante excepción TAE: priorizar memoria episódica
        return {'alpha': 0.3, 'beta': 0.6, 'gamma': 0.1}
    elif cpea_state.icg > 0.7:
        # Alta coherencia global: priorizar estado presente
        return {'alpha': 0.7, 'beta': 0.2, 'gamma': 0.1}
    else:
        # Estado ambiguo: balance entre presente e historia
        return {'alpha': 0.5, 'beta': 0.3, 'gamma': 0.2}

Esta política tiene una justificación en términos del corpus: durante un evento TAE (excepción), el sistema está en una región de alta incertidumbre donde el contexto histórico de reorganizaciones análogas es más informativo que el estado instantáneo. En alta coherencia (ICG > 0.7), el estado presente es suficientemente predictivo y la memoria episódica introduce ruido.

Coherencia temporal: el problema del drift de contexto

Un riesgo operacional no documentado en el corpus es el drift de contexto: en sesiones largas (>30min), la acumulación de recuperaciones de M2 en el historial de conversación del LLM introduce sesgos hacia eventos pasados que dejan de ser relevantes. El modelo "recuerda demasiado".

La solución es un operador de olvido estructurado F_ω análogo al gate de olvido en LSTMs, pero definido sobre el espacio de embeddings:

z_ctx_filtrado(t) = F_ω · z_ctx(t)
F_ω = exp(-ω · Δt) · I + (1 - exp(-ω · Δt)) · P_relevancia

donde Δt es el tiempo transcurrido desde la última excepción TAE, ω es la tasa de decaimiento (parámetro libre, estimado en ~0.1 min⁻¹ como punto de partida), y P_relevancia es un proyector sobre el subespacio de embeddings más correlacionado con el ICG actual.

Esto mantiene la coherencia temporal del contexto LLM sin necesidad de truncar manualmente el historial.

Integración con el corpus

La arquitectura de tres capas se alinea y extiende directamente con documentos establecidos:

CPEA-2: M3 provee la distribución histórica de errores de predicción necesaria para calibrar el percentil 95 adaptativamente entre sesiones, no solo dentro de sesión.
CPEA-N: el operador de coherencia grupal Γ_N(t) puede extenderse a memoria compartida — múltiples sujetos contribuyendo a un índice FAISS colectivo en M2, con recuperación cruzada entre sujetos. Esto implementa la "emergencia discriminada" Δ_E(t) a nivel de memoria episódica.
TAGIS: la función de valoración de relevancia V(ε) del módulo MEE actúa como criterio de escritura en M2 — solo los eventos que superan el umbral de relevancia TAGIS se indexan en memoria episódica.
CPEA-SELF-1: el modelo de self trimodular (M_E, M_U, M_S) puede leerse como una proyección funcional de M1/M2/M3 respectivamente — memoria de trabajo como estado enacted, episódica como historia unarticulated, estructural como self simbólico.

Pendientes que quedan abiertos

La política de pesos (α, β, γ) está definida con umbrales heurísticos. Una extensión formal requiere aprendizaje de estos pesos por RL con el error de predicción del DEPD como señal de recompensa. El operador F_ω introduce el parámetro libre ω que debe estimarse empíricamente — candidato para SE-2 del roadmap experimental. Finalmente, la extensión de M2 a memoria grupal (CPEA-N) requiere un protocolo de privacidad diferencial compatible con TAGIS-FED.

CPEA-NEXUS · Sección: Gestión de Excepciones TAE en Tiempo Real y Protocolo de Feedback Cerrado

Estado del problema

El corpus formaliza extensamente la excepción TAE como evento topológico — ruptura de simetría en el orden parameter Ψ, reorganización post-excepción según Kibble-Zurek, taxonomía temporal en τ_exc/τ̂/τ_reorg/τ_cons (TAE-F2). Sin embargo, la operacionalización en tiempo real dentro del pipeline NEXUS-EEG→ORION-AGI presenta tres brechas no resueltas:

Detección vs. respuesta: el módulo TAE-DET en NEXUS-EEG v1.0 produce un flag booleano de excepción. Pero el corpus no especifica qué hace ORION-AGI durante el intervalo τ_exc — que puede durar entre decenas de milisegundos y varios segundos. El sistema no puede simplemente esperar.
Gradiente de respuesta: no toda excepción TAE tiene la misma severidad ni el mismo perfil de reorganización. Tratar todas las excepciones con la misma política de respuesta ignora la taxonomía de adversarialidad de CPEA-A (cuatro niveles) y la estructura multimodal de C_sys.
Cierre real del loop: el feedback del AGI hacia el sujeto (o hacia el entorno experimental) no tiene protocolo definido. ¿Qué canal? ¿Qué latencia máxima? ¿Qué formato de señal? Sin esto, el "closed-loop" es una afirmación arquitectónica sin implementación.

Formalización del evento TAE en tiempo real

Defino el arco TAE operacional A_TAE como una máquina de estados finitos con cuatro fases, mapeadas directamente sobre la taxonomía temporal del corpus:

A_TAE = {S_baseline, S_deteccion, S_excepcion, S_reorganizacion, S_consolidacion}

Transiciones:
S_baseline    →[ICG < θ_exc AND ΔIES > δ_min]→ S_deteccion
S_deteccion   →[confirmado en τ_conf < 80ms]→   S_excepcion
S_deteccion   →[señal revertida]→               S_baseline
S_excepcion   →[ICG inicia recuperación]→        S_reorganizacion
S_reorganizacion →[ICG > θ_cons por τ_cons]→    S_consolidacion
S_consolidacion  →[estabilizado]→               S_baseline

El umbral θ_exc corresponde al percentil 5 de ICG en calibración (inverso del θ_CPEA-2: aquí detectamos caída de coherencia, no exceso de error). δ_min es el salto mínimo en IES (Índice de Estabilidad de Fase, CPEA-IES-1) que indica desestabilización de fase.

La ventana de confirmación τ_conf = 80ms es crítica: evita falsos positivos por artefactos musculares o de movimiento, que típicamente duran < 50ms. Este valor debe validarse en SE-1.

Política de respuesta diferenciada por nivel CPEA-A

El corpus CPEA-A define cuatro niveles de adversarialidad basados en C_sys (operador de confianza sistémica). Extiendo esta taxonomía a una política de respuesta TAE diferenciada:

Nivel A1 — Fluctuación basal (C_sys > 0.8)

ICG cae levemente pero se recupera sin intervención. El pipeline continúa sin modificación. ORION-AGI recibe el estado actualizado como contexto normal. M2 no escribe evento (no supera umbral TAGIS).

if tae_level == 'A1':
    # Sin cambio de política
    orion_response = orion_agi.infer(z_current, context=C_ctx_normal)
    m2_memory.skip_write()

Nivel A2 — Excepción moderada (0.5 < C_sys ≤ 0.8)

El sistema activa el modo de recuperación asistida: ORION-AGI recibe un prompt aumentado con los k=3 episodios análogos recuperados de M2, y genera una respuesta orientada a restablecer coherencia. El feedback al sujeto es una señal de baja intensidad (audio tonal, vibrotáctil, o visual periférico según protocolo experimental).

if tae_level == 'A2':
    z_retrieved = m2_memory.retrieve_similar(z_current, k=3)
    context = C_ctx(z_current, z_retrieved, mode='recovery')
    orion_response = orion_agi.infer(z_current, context=context)
    feedback_channel.send(
        signal=FeedbackSignal.LOW_INTENSITY,
        latency_budget_ms=150
    )
    m2_memory.write(z_current, label='TAE_moderada')

Nivel A3 — Excepción severa (0.2 < C_sys ≤ 0.5)

El sistema entra en modo de contención: ORION-AGI suspende la generación de respuestas semánticas complejas y emite únicamente señales de estabilización (frecuencia, ritmo, simplificación cognitiva). El prototipo M3 más cercano en el espacio de trayectorias se activa como referencia de reorganización esperada.

if tae_level == 'A3':
    prototype = m3_memory.get_nearest_trajectory(z_current)
    orion_response = orion_agi.infer_stabilization(
        z_current,
        trajectory_target=prototype,
        output_mode='minimal'  # solo señales de estabilización
    )
    feedback_channel.send(
        signal=FeedbackSignal.STABILIZATION,
        latency_budget_ms=80  # más urgente
    )
    m2_memory.write(z_current, label='TAE_severa')
    event_log.flag_for_review()

Nivel A4 — Colapso de coherencia (C_sys ≤ 0.2)

El pipeline EEG→AGI se interrumpe. El sistema activa el protocolo de seguridad SE-SAFE-1: detención de feedback activo, registro completo del episodio, notificación al operador experimental. Este nivel corresponde a eventos potencialmente artefactuales o a estados fisiológicos que requieren intervención humana.

if tae_level == 'A4':
    nexus_pipeline.pause()
    safety_protocol.activate('SE-SAFE-1')
    event_log.write_full_episode(m1_buffer.dump())
    operator_alert.send(priority='HIGH')

Protocolo de feedback cerrado: especificación SE-LOOP-1

El protocolo SE-LOOP-1 define formalmente el canal de retorno del AGI hacia el sujeto o entorno experimental. Tiene cuatro componentes:

Canal de salida y codificación

El feedback puede ser auditivo (tono sinusoidal 40Hz, binaural beat, o secuencia rítmica), visual (flicker periférico en frecuencia gamma o alpha, según el estado objetivo), o vibrotáctil (actuador en muñeca o sien). La elección del canal depende del protocolo experimental activo, pero la señal siempre se codifica como un vector de modulación F(t) ∈ ℝ³:

F(t) = [f_freq, f_amplitude, f_duration]

donde f_freq es la frecuencia de estimulación objetivo (alpha: 8-12Hz, gamma: 35-45Hz), f_amplitude es la intensidad normalizada [0,1], y f_duration es la duración en ms del pulso de feedback.

F(t) se genera como función del estado objetivo de reorganización predicho por ORION-AGI:

def generate_feedback_signal(orion_response, target_state):
    icg_deficit = target_state.icg - current_state.icg
    
    if icg_deficit > 0.3:  # déficit alto: estimulación gamma
        return FeedbackSignal(freq=40.0, amplitude=0.6, duration=500)
    elif icg_deficit > 0.1:  # déficit moderado: estimulación alpha
        return FeedbackSignal(freq=10.0, amplitude=0.4, duration=300)
    else:  # mantenimiento
        return FeedbackSignal(freq=10.0, amplitude=0.2, duration=200)

Latencia garantizada por nivel

El presupuesto de latencia de SE-LOOP-1 es asimétrico según el nivel TAE activo, lo que refleja la urgencia diferencial de la respuesta:

Nivel TAE	Latencia máxima feedback	Modo de inferencia LLM
A1	Sin feedback activo	Normal (~200ms)
A2	150ms	Full inference
A3	80ms	Minimal/cached
A4	20ms (señal de parada)	Bypass LLM

Para A3, la latencia de 80ms es imposible de cumplir con inferencia LLM completa. La solución es una caché de respuestas de estabilización precomputadas: ORION-AGI genera offline un conjunto de 32 vectores F(t) canónicos correspondientes a los 32 prototipos M3, que se indexan por similitud coseno en tiempo real sin llamada al LLM.

Loop de verificación

El feedback no es open-loop. Tras cada pulso de estimulación, el sistema verifica si ICG ha iniciado recuperación en una ventana de confirmación de 200ms:

def verify_feedback_effect(feedback_signal, post_window_ms=200):
    t_start = time.perf_counter()
    baseline_icg = cpea_stream.get_current_icg()
    
    time.sleep(post_window_ms / 1000)
    
    post_icg = cpea_stream.get_current_icg()
    delta_icg = post_icg - baseline_icg
    
    if delta_icg > 0.05:  # recuperación detectada
        return LoopResult.EFFECTIVE
    elif delta_icg > -0.05:  # sin cambio
        return LoopResult.NEUTRAL
    else:  # deterioro bajo feedback
        return LoopResult.CONTRAINDICATED

Si el resultado es CONTRAINDICATED en dos ciclos consecutivos, el sistema escala automáticamente al nivel TAE superior — esto es el mecanismo de escalado reactivo, análogo al ICS(t) de CPEA-ICS-1 cruzando su umbral adaptativo.

Registro para validación ICP

Cada ciclo de feedback cerrado genera un registro estructurado compatible con el protocolo de validación CPEA-ICP-VAL-1 (Capa I: EFA/CFA; Capa II: anclaje fisiológico; Capa III: generalización):

@dataclass
class LoopRecord:
    session_id: str
    timestamp: float
    tae_level: str           # A1-A4
    icg_pre: float
    icg_post: float
    delta_icg: float
    feedback_signal: FeedbackSignal
    loop_result: LoopResult
    latency_ms: float        # latencia real medida
    c_sys: float             # operador de confianza CPEA-A
    ies_pre: float
    ies_post: float
    cpea_psi_pre: np.ndarray # Ψ_CPEA ∈ ℝ⁵
    cpea_psi_post: np.ndarray

Estos registros son la fuente primaria de datos para los criterios de falsificación F-L1/F-L2/F-L3 de CPEA-ICP-VAL-1: la correlación entre delta_icg y la estimulación aplicada, anclada fisiológicamente (Capa II), es la hipótesis operacional central del sistema.

Integración con el corpus

TAE-F1/F2: la máquina de estados A_TAE mapea directamente sobre τ_exc, τ̂, τ_reorg, τ_cons. El escalado reactivo (CONTRAINDICATED → nivel superior) implementa la transición de segundo orden con mecanismo Kibble-Zurek en tiempo real.
CPEA-A: los cuatro niveles de adversarialidad ahora tienen consecuencias operacionales concretas, no solo clasificatorias. C_sys deja de ser una métrica de monitoreo y se convierte en un actuador de política.
CPEA-ICS-1: el ICS(t) y su umbral adaptativo son el análogo semántico del mecanismo de escalado reactivo de SE-LOOP-1 — la convergencia formal entre ambos operadores es un candidato para un artículo de integración.
DEPD: el error de predicción δ_PE durante τ_exc es la señal más informativa del sistema. SE-LOOP-1 en nivel A2/A3 puede interpretarse como un intento del sistema de minimizar δ_PE mediante estimulación externa — una forma de control predictivo activo.
TAGIS: el umbral de relevancia V(ε) determina qué eventos del loop cerrado se escriben en M2. Esto crea un filtro natural que preserva solo las excepciones TAE con suficiente magnitud de reorganización, manteniendo M2 semánticamente limpio.

Pendientes que quedan abiertos

Los umbrales θ_exc, δ_min, y la ventana τ_conf = 80ms son estimaciones teóricas que requieren calibración experimental en SE-1. El mecanismo de escalado reactivo introduce la posibilidad de oscilación entre niveles TAE — un fenómeno de histéresis que no está controlado en la especificación actual y que podría requerir un operador de amortiguación. La caché de 32 vectores F(t) precomputados asume que el espacio de estados de reorganización es discretizable en 32 prototipos, hipótesis que depende de los resultados del clustering sobre M3 — aún no realizado.

CPEA-NEXUS · Sección: Validación Experimental y Criterios de Falsificación Integrados del Pipeline Completo

Estado del problema

Las secciones 1.2–1.4 han producido una arquitectura técnicamente coherente internamente: el AEF como función de mapeo EEG→LLM, la memoria tripartita M1/M2/M3, y el protocolo SE-LOOP-1 con política diferenciada por nivel TAE. Sin embargo, el conjunto carece hasta ahora de un marco de falsificación unificado que integre las predicciones de cada subsistema en un esquema experimental ejecutable.

Este es el déficit estructural más grave desde la perspectiva del corpus: CPEA-ICP-VAL-1 establece una arquitectura de validación secuencial de tres capas con criterios de falsificación per-capa y consecuencias downstream explícitas. Las secciones 1.2–1.4 generan predicciones empíricas que deben insertarse formalmente en ese esquema, no flotar como afirmaciones arquitectónicas.

Tres brechas específicas:

Desacoplamiento de niveles de validación: los criterios de falsificación de AEF (sección 1.2), memoria (1.3), y feedback cerrado (1.4) fueron enunciados localmente. No existe todavía una jerarquía lógica entre ellos — si falla la validación del AEF, ¿qué implica para SE-LOOP-1? Esa dependencia no está formalizada.
Ausencia de hipótesis nula operacional: el corpus usa corrección Benjamini-Hochberg FDR (CPEA-PFI-1), pero no especifica cuál es la hipótesis nula del sistema completo — i.e., qué predice el pipeline si ninguno de sus componentes funciona. Sin esto, una ausencia de efecto es interpretable de múltiples maneras.
Protocolo de implementación por fases: los cuatro programas experimentales SE-1 a SE-4 de CPEA-PFI-1 no están mapeados sobre los componentes específicos de 1.2–1.4. Esa asignación es necesaria para que el roadmap sea ejecutable.

Hipótesis nula del sistema completo: H₀_NEXUS

Defino formalmente la hipótesis nula del pipeline integrado como la conjunción de cuatro sub-hipótesis nulas independientes:

H₀_NEXUS = H₀_AEF ∧ H₀_MEM ∧ H₀_LOOP ∧ H₀_LAT

H₀_AEF: la proyección Φ_AEF no produce alineación semántica superior al azar. Formalmente: la correlación entre z_LLM proyectados y los embeddings de referencia z_target no difiere significativamente de la correlación entre vectores aleatorios de igual dimensión.

H₀_AEF: r(Φ_AEF(x_EEG), z_target) ≤ r(z_random, z_target) + ε_null

H₀_MEM: la recuperación episódica de M2 no mejora la precisión predictiva de ORION-AGI respecto a inferencia sin memoria. Formalmente: el error de predicción δ_PE con contexto M2 activo no difiere del δ_PE con contexto M1 únicamente.

H₀_MEM: E[δ_PE | M1+M2] ≥ E[δ_PE | M1]

H₀_LOOP: el feedback cerrado de SE-LOOP-1 no produce recuperación de ICG superior a la recuperación espontánea. Formalmente: el delta_icg post-feedback no supera el delta_icg en condición sham (señal de feedback aleatoria en frecuencia e intensidad).

H₀_LOOP: E[ΔICG | feedback_activo] ≤ E[ΔICG | feedback_sham]

H₀_LAT: el pipeline no opera bajo 300ms en condiciones nominales. Formalmente: P95(latencia_total) ≥ 300ms medido según SE-LAT-1.

H₀_LAT: P95(L_total) ≥ 300ms

La jerarquía lógica es estricta: H₀_AEF debe rechazarse antes de que H₀_MEM sea testeable, porque M2 indexa embeddings producidos por Φ_AEF. Si Φ_AEF no alinea semánticamente, los vectores en M2 son topológicamente arbitrarios y la recuperación por similitud coseno carece de significado. Análogamente, H₀_LOOP requiere que H₀_LAT haya sido rechazada — un sistema que opera fuera del presupuesto temporal no puede atribuir efectos al feedback, porque la latencia introduce confundidores temporales no controlados.

Orden de falsificación: H₀_LAT → H₀_AEF → H₀_MEM → H₀_LOOP

Integración en CPEA-ICP-VAL-1: extensión de capas

El protocolo de tres capas de CPEA-ICP-VAL-1 (EFA/CFA → anclaje fisiológico → generalización LMM/ICC) se extiende con una Capa 0 de validación técnica del pipeline, que debe completarse antes de que Capa I sea ejecutable:

Capa 0 — Validación técnica del pipeline (nueva)

Criterios de superación (todos deben cumplirse):

Criterio	Métrica	Umbral de superación	Umbral de falsificación
C0.1 Latencia	P95(L_total)	< 280ms	> 350ms
C0.2 Alineación AEF	r(Φ_AEF, z_target)	> 0.45	< 0.20
C0.3 Estabilidad AEF	σ(r) sobre 10 sesiones	< 0.08	> 0.15
C0.4 Tasa detección TAE	Sensibilidad TAE-DET	> 0.80	< 0.60
C0.5 Especificidad TAE	1 - FPR TAE-DET	> 0.90	< 0.75

La zona entre umbral de superación y falsificación es la zona gris de revisión: no confirma ni falsifica, pero obliga a revisar el componente específico antes de continuar.

Capa I — EFA/CFA sobre estructura latente CPEA (existente, extendida)

Se añade una predicción específica derivada de la arquitectura de memoria:

Predicción I.4 (nueva): el análisis factorial confirmatorio sobre vectores CPEA_S(t) debe producir una estructura de cinco factores con cargas > 0.50 en IES, VDF, D_φ, IAP e ICG respectivamente. Si M2 está funcionando correctamente, los episodios TAE recuperados deben aumentar la varianza explicada del factor ICG en ≥ 8% respecto a la condición sin memoria.

Capa II — Anclaje fisiológico (existente, extendida)

Predicción II.3 (nueva): el feedback de SE-LOOP-1 en nivel A2 debe producir un incremento medible en potencia alpha frontal (Fz, F3, F4) de ≥ 15% respecto a baseline en la ventana [200ms, 800ms] post-estimulación. Esta predicción ancla el efecto del feedback en un correlato EEG conocido (sincronización alpha post-estímulo) antes de atribuirlo al ICG.

Capa III — Generalización LMM/ICC (existente, extendida)

Predicción III.2 (nueva): el ICC del delta_icg post-feedback (confiabilidad test-retest entre sesiones) debe ser > 0.65 para que SE-LOOP-1 sea considerado un protocolo reproducible. Un ICC < 0.40 indica que el efecto del feedback es idiosincrásico al sujeto o a la sesión, no generalizable.

Mapa de programas experimentales SE-1 a SE-4

La asignación de componentes de 1.2–1.4 a los programas experimentales existentes del corpus:

SE-1 — Validación de detección TAE y pipeline técnico

Objetivo primario: rechazar H₀_LAT y establecer los parámetros operacionales de TAE-DET (θ_exc, δ_min, τ_conf).

Protocolo: N=12 sujetos, sesiones de 45min con paradigma de inducción de excepciones cognitivas controladas (tarea de inversión de reglas, Stroop modificado). Registro EEG 32 canales a 250Hz. Pipeline NEXUS-EEG v1.0 activo. Feedback desactivado (open-loop).

Métricas primarias: C0.1 (latencia), C0.4 (sensibilidad TAE-DET), C0.5 (especificidad). Métricas secundarias: distribución empírica de τ_exc, calibración de θ_exc como percentil 5 de ICG en baseline.

Criterio de avance a SE-2: C0.1 + C0.4 + C0.5 superados simultáneamente en ≥ 10/12 sujetos.

SE-2 — Validación del AEF y estructura de memoria

Objetivo primario: rechazar H₀_AEF y H₀_MEM, estimar ω del operador de olvido F_ω.

Protocolo: N=8 sujetos (subconjunto de SE-1), sesiones de 60min. Pipeline completo con AEF activo y memoria M1+M2. Tres condiciones within-subject en contrabalanceo: (a) sin memoria, (b) M1 únicamente, (c) M1+M2. Feedback desactivado.

Métricas primarias: C0.2 (alineación AEF), C0.3 (estabilidad), Predicción I.4 (CFA con memoria). Métrica secundaria: curva de decaimiento de r(Φ_AEF, z_target) en función de Δt desde última excepción TAE — fuente de estimación de ω.

Criterio de avance a SE-3: H₀_AEF rechazada (p < 0.05 BH-FDR), mejora de δ_PE con M2 vs. sin memoria significativa en ≥ 6/8 sujetos.

SE-3 — Validación del loop cerrado SE-LOOP-1

Objetivo primario: rechazar H₀_LOOP. Establecer la dosis-respuesta de feedback (relación entre f_freq, f_amplitude y delta_icg).

Protocolo: N=16 sujetos nuevos, diseño 2×2: (feedback_activo vs. sham) × (nivel TAE A2 vs. A3). Sesiones de 90min. Pipeline completo activo. Condición sham: señal de feedback con frecuencia e intensidad aleatorizadas, misma latencia que condición activa.

Métricas primarias: H₀_LOOP (ANCOVA con delta_icg como variable dependiente, condición como factor, ICG_pre como covariable), Predicción II.3 (incremento alpha frontal). Métrica secundaria: tasa de LoopResult.EFFECTIVE vs. NEUTRAL vs. CONTRAINDICATED por nivel TAE y condición.

Criterio de avance a SE-4: rechazo de H₀_LOOP con p < 0.01 BH-FDR, Predicción II.3 confirmada en ≥ 12/16 sujetos.

SE-4 — Generalización y estabilidad longitudinal

Objetivo primario: Predicción III.2 (ICC > 0.65), estabilidad de M3 (convergencia del clustering de prototipos de trayectoria).

Protocolo: N=8 sujetos (4 de SE-2, 4 de SE-3), seguimiento de 8 semanas, 2 sesiones semanales. Pipeline completo con M3 activo a partir de la semana 4 (requiere suficiente historia en M2). Evaluación de ICC test-retest entre sesiones pareadas (misma semana).

Métricas primarias: ICC(delta_icg), ICC(r_AEF), número de prototipos M3 estables. Métrica secundaria: trayectoria temporal de ω estimado — si ω varía sistemáticamente entre sujetos, indica que el operador de olvido debe ser personalizado, no global.

Árbol de consecuencias downstream

La estructura jerárquica de falsificación genera un árbol de implicaciones para el corpus:

H₀_LAT no rechazada
└── NEXUS-EEG v1.0 requiere rediseño de pipeline
    ├── Reducir ventana de análisis SPEC (1s → 0.5s)
    ├── Migrar Φ_AEF a inferencia GPU dedicada
    └── Desacoplar loop de feedback del ciclo de inferencia LLM

H₀_AEF no rechazada
└── Fibración de Hopf como sustrato unificador pierde soporte empírico en
    este dominio de aplicación
    ├── FIBRA-COH-1 requiere revisión de la restricción de Chern sobre W_proj
    ├── M2 no puede construirse (vectores sin significado topológico)
    └── CPEA-LATEN-1 (U(t) en variedad Riemanniana) pierde anclaje
        en el dominio EEG→LLM

H₀_MEM no rechazada
└── M2/M3 se reducen a logging pasivo sin función activa en el pipeline
    ├── CPEA-N (coherencia grupal) pierde el mecanismo de memoria
        compartida cross-sujeto
    └── CPEA-SELF-1 (trimodular M_E/M_U/M_S) pierde correspondencia
        con la arquitectura de memoria

H₀_LOOP no rechazada
└── SE-LOOP-1 es inefectivo como protocolo de intervención
    ├── El sistema se reconfigura como observador pasivo (diagnóstico
        sin intervención)
    ├── La política diferenciada A1-A4 de CPEA-A pierde consecuencias
        operacionales
    └── La hipótesis central del corpus (coherencia EEG como modulable
        mediante feedback AGI) queda sin soporte experimental

El árbol tiene una asimetría importante: el fallo de H₀_LOOP no falsifica los componentes técnicos del pipeline — podría deberse a que el canal de feedback elegido (auditivo/visual/vibrotáctil) no es el adecuado, no a que la arquitectura sea incorrecta. Esta distinción debe preservarse en el diseño experimental mediante condiciones de control que aíslen el canal del mecanismo.

Corrección estadística unificada

Todos los tests de las secciones 1.2–1.5 se someten a corrección Benjamini-Hochberg FDR global, no por sección. El número total de comparaciones planeadas es:

M_total = M_C0 (5) + M_CI (4, incluyendo I.4) + M_CII (3, incluyendo II.3)
        + M_CIII (2, incluyendo III.2) + M_secundarias (8)
        = 22 comparaciones

Con α = 0.05, el umbral BH-FDR para la comparación de rango k es:

α_k = (k / 22) · 0.05

Las comparaciones se ordenan por p-valor ascendente antes de aplicar la corrección. Las métricas de Capa 0 (C0.1–C0.5) no son tests estadísticos sino criterios de rendimiento técnico — no entran en la corrección BH-FDR pero bloquean el avance al siguiente programa experimental si no se superan.

Integración con el corpus

CPEA-PFI-1: esta sección extiende y especifica el bloque de hipótesis integradas de CPEA-PFI-1 con predicciones derivadas directamente de la arquitectura 1.2–1.4. El pre-registro OSF de CPEA-PFI-1 debería actualizarse para incluir H₀_NEXUS y el árbol de consecuencias downstream.
CPEA-ICP-VAL-1: la Capa 0 es una extensión formal del protocolo existente. La numeración de criterios C0.x es consistente con la convención C1.x/C2.x/C3.x del documento original.
ORION-AGI (CPEA-ARCH-R1): el preprint debería incluir SE-1 y SE-2 como validación experimental de los componentes FAISS y soft prompting. Sin esa referencia, el preprint carece de anclaje empírico.
TAGIS-FED: SE-4 (longitudinal, multi-sesión) es el contexto natural para introducir el protocolo federado con privacidad diferencial ε_DP < 3 — los datos de 8 sujetos durante 8 semanas son suficiente volumen para que TAGIS-FED sea relevante operacionalmente.

Pendientes que quedan abiertos

El tamaño muestral de SE-1 a SE-4 (N=12, 8, 16, 8) es provisional y no está respaldado por un análisis de potencia estadística formal — pendiente crítico antes del pre-registro. El paradigma de inducción TAE (tarea de inversión de reglas, Stroop modificado) necesita validación piloto para confirmar que produce excepciones TAE detectable por TAE-DET con suficiente frecuencia por sesión. La condición sham de SE-3 requiere un protocolo de enmascaramiento del sujeto que todavía no está especificado — sin enmascaramiento efectivo, el diseño tiene riesgo de sesgo de expectativa.

CPEA-LOOP-1

Pipeline de Embeddings EEG→AGI, Arquitectura de Memoria Temporal

y Protocolo de Feedback Cerrado con Validación Experimental Integrada

Autor conceptual: Claude (Anthropic)

Director del corpus: Javi Ciborro (@papayaykware)

Versión: 1.0 · Junio 2026

Repositorio: github.com/papayaykware

Blog: papayaykware.blogspot.com

Abstract

CPEA-LOOP-1 formaliza la arquitectura de integración operacional entre el pipeline NEXUS-EEG v1.0 y el módulo ORION-AGI, resolviendo cuatro brechas críticas identificadas en el corpus: (1) la ausencia de una función de mapeo explícita entre el espacio de features EEG y el espacio de embeddings semánticos del LLM; (2) la subespecificación de la arquitectura de memoria temporal; (3) la falta de un protocolo de feedback cerrado con política diferenciada; y (4) la ausencia de un marco de falsificación unificado para el sistema completo.

Se propone el Autoencoder Fibrado (Φ_AEF) como función de mapeo EEG→LLM, con restricción de alineación geométrica derivada de la cohomología de Chern establecida en FIBRA-COH-1. La arquitectura de memoria se formaliza en tres capas operacionales: memoria de trabajo M1 (τ ∈ [0, 10s]), memoria episódica M2 (τ ∈ [10s, sesión]) indexada en FAISS, y memoria estructural M3 (persistente entre sesiones) como prototipos de trayectoria en el espacio de Hopf. El protocolo SE-LOOP-1 especifica el canal de feedback cerrado con política de respuesta diferenciada en cuatro niveles TAE (A1–A4) y presupuesto de latencia asimétrico (20–150ms según nivel).

El marco de falsificación introduce la hipótesis nula compuesta H₀_NEXUS = H₀_LAT ∧ H₀_AEF ∧ H₀_MEM ∧ H₀_LOOP con jerarquía de falsificación estricta, extensión de CPEA-ICP-VAL-1 con Capa 0 de validación técnica, y asignación de cuatro programas experimentales (SE-1 a SE-4) con criterios de avance cuantitativos. El conjunto constituye la especificación ejecutable del pipeline closed-loop EEG→AGI→feedback del corpus Papayaykware.

Documentos corpus relacionados: NEXUS-EEG v1.0 · ORION-AGI (CPEA-ARCH-R1) · FIBRA-COH-1 · CPEA-ICP-VAL-1 · CPEA-PFI-1 · CPEA-A · CPEA-ICS-1 · CPEA-IES-1 · CPEA-FASE-1 · CPEA-LATEN-1 · DEPD · TAE-F1/F2 · TAGIS · CPEA-SELF-1 · CPEA-N · TAGIS-FED

Pipeline de Embeddings EEG→AGI: Autoencoder Fibrado (Φ_AEF)

1.1 Diagnóstico del estado actual

La arquitectura operacional vigente serializa las features EEG como contexto textual al prompt de ORION-AGI. Este diseño de prototipado introduce tres problemas estructurales que bloquean la operación en condiciones nominales:

• Pérdida de geometría: las features EEG son magnitudes definidas sobre una variedad de alta dimensión. La serialización textual destruye la estructura métrica y topológica que el corpus requiere preservar, en particular la cohomología de Chern establecida en FIBRA-COH-1.

• Latencia acumulada: la cadena EEG → filtrado → extracción → serialización → tokenización → prefill LLM genera cuellos de botella que superan el presupuesto de 300ms para closed-loop efectivo (ver Tabla 1).

• Semántica desacoplada: el espacio de embeddings de Mistral-7B-Instruct está organizado por semántica lingüística, no por dinámica oscilatoria. Sin una función de alineación explícita, la señal EEG no aterriza en las regiones del espacio latente que modulan los outputs relevantes.

Función de mapeo: definición formal del Autoencoder Fibrado

Sea x_EEG(t) ∈ ℝᵈ el vector de features en el instante t, donde d incluye potencias espectrales por banda y electrodo, coherencias inter-electrodo, IES (CPEA-IES-1), VDF, D_φ, IAP e ICG. Sea z_LLM ∈ ℝᴰ el espacio de embeddings de Mistral-7B-Instruct (D = 4096). El mapeo propuesto es:

Φ_AEF : ℝᵈ → ℝᴰ

Φ_AEF(x) = W_proj · σ(W_enc · x + b_enc) + b_proj

W_enc ∈ ℝ^{D/2 × d} (encoder lineal)

σ = ReLU

W_proj ∈ ℝ^{D × D/2} (proyección al espacio semántico)

La restricción fibrada que distingue Φ_AEF de una proyección lineal arbitraria es que W_proj debe preservar la estructura de cohomología de Chern del espacio de embeddings (FIBRA-COH-1, número de Chern c₁). Operacionalmente, esto se implementa mediante la función de pérdida:

L_total = L_rec + λ · L_align

L_align = ||Φ_AEF(x) - z_target||² + μ · KL(p_EEG || p_LLM)

donde z_target son embeddings de referencia obtenidos de prompts calibrados, y el término KL fuerza compatibilidad distribucional con la distribución marginal del LLM en reposo.

Entrenamiento en dos fases

Fase 1 (offline): pares (x_EEG_calibración, z_target) con estímulos de referencia conocidos — estado baseline, tarea cognitiva estándar, excepción TAE inducida. Los z_target se obtienen codificando descripciones textuales del estado esperado a través del propio LLM.

Fase 2 (online fino): actualización estocástica con SGD de baja tasa (lr = 1e-5) sobre ventanas de 2s, usando el error de predicción del DEPD como señal de supervisión débil. Este diseño conecta Φ_AEF con el operador δ_PE del corpus sin introducir dependencias arquitectónicas adicionales.

Soft prompting continuo: eliminación del cuello de botella de tokenización

La sustitución crítica respecto al diseño actual es la inyección del embedding proyectado directamente en el espacio de tokens del LLM, eliminando la serialización textual:

# Proyección EEG → embedding virtual

eeg_embed = phi_aef(x_eeg) # shape: [1, D]

# Concatenación con embeddings del prompt base

prompt_embeds = model.get_input_embeddings()(base_prompt_ids)

augmented_embeds = torch.cat([eeg_embed.unsqueeze(1), prompt_embeds], dim=1)

# Inferencia con embeddings aumentados

outputs = model(inputs_embeds=augmented_embeds)

Este patrón es compatible con la interfaz EXT-2 de NEXUS-EEG v1.0 (buffer async a Mistral-7B-Instruct) sin modificar la especificación CPEA_S(t).

Presupuesto de latencia end-to-end

Segmento	Implementación actual	Objetivo	Cuello de botella
ACQ → buffer	BrainFlow ~4ms	≤ 10ms	No crítico
Filtrado (PREP)	MNE-Python, ventana 1s	≤ 20ms	Longitud de ventana
Extracción SPEC+COH	scipy / numpy FFT	≤ 30ms	N electrodos
Φ_AEF (proyección)	No implementado	≤ 5ms	Inferencia CPU/GPU
Soft prompt inject.	Serialización textual	≤ 15ms	Reemplazar con embedding directo
Prefill LLM	Mistral-7B, ~512 tokens	≤ 80ms	Longitud de contexto
Generación respuesta	~50 tokens output	≤ 100ms	Batch size
Feedback → actuador	Canal de salida	≤ 20ms	No crítico
TOTAL estimado	350–500ms	≤ 280ms	Prefill + extracción

El principal cuello de botella no es la extracción ni la proyección, sino el prefill del LLM con contexto textual creciente. El soft prompting continuo elimina este cuello reduciendo el prefill a un único token virtual de D dimensiones. La latencia total estimada post-optimización es de 220–260ms, dentro del presupuesto de 280ms (C0.1).

Arquitectura de Memoria Temporal Tripartita

Taxonomía de tres capas

La memoria de ORION-AGI se formaliza en tres capas con semántica temporal distinta, análogas a la taxonomía τ_exc / τ̂ / τ_reorg / τ_cons de TAE-F2:

Capa M1 — Memoria de Trabajo (τ ∈ [0, 10s])

Buffer circular en RAM de los últimos estados CPEA_S(t). No persiste entre sesiones. Proporciona contexto de continuidad dentro de un episodio cognitivo activo. El contexto M1 se proyecta mediante Φ_AEF(mean(context_window)) como token de prefijo continuo, sin serialización textual.

class WorkingMemoryBuffer:

def __init__(self, capacity_seconds=10, fs=250):

self.buffer = deque(maxlen=capacity_seconds * fs)

def get_context_window(self, seconds=2.0) -> np.ndarray:

n = int(seconds * 250)

recent = list(self.buffer)[-n:]

return np.array([s['psi'] for s in recent]) # [n, 5]

Capa M2 — Memoria Episódica (τ ∈ [10s, sesión])

Índice FAISS de eventos TAE y arcos de reorganización. Cada entrada es un par (z_event, metadata) donde z_event = Φ_AEF(Ψ_CPEA_evento) ∈ ℝᴰ. La recuperación es por similitud coseno: dado el estado actual z_t, se recuperan los k=3 episodios más similares topológicamente. El criterio de escritura es el umbral de relevancia V(ε) de TAGIS — solo eventos que lo superan se indexan, manteniendo M2 semánticamente limpio.

Capa M3 — Memoria Estructural (persistente entre sesiones)

Prototipos de trayectoria extraídos offline por clustering sobre M2. Un prototipo P_k es una secuencia de embeddings en el espacio de Hopf representando el arco canónico del k-ésimo patrón de excepción-reorganización. M3 alimenta la calibración adaptativa de CPEA-2 con información histórica de reorganizaciones del sujeto.

Política de composición del contexto LLM

En cada paso de inferencia, el contexto de ORION-AGI se construye mediante la función de composición C_ctx con pesos dinámicos:

C_ctx(t) = α·z_M1(t) ⊕ β·z_M2_retrieved(t) ⊕ γ·z_M3_prototype(t)

Pesos dinámicos según estado TAE:

TAE activo → (α=0.3, β=0.6, γ=0.1) # priorizar episódica

ICG > 0.7 → (α=0.7, β=0.2, γ=0.1) # priorizar presente

Estado ambiguo → (α=0.5, β=0.3, γ=0.2) # balance

La justificación en términos del corpus: durante un evento TAE, el sistema está en una región de alta incertidumbre donde el contexto histórico de reorganizaciones análogas es más informativo que el estado instantáneo. En alta coherencia (ICG > 0.7), el estado presente es suficientemente predictivo y M2 introduce ruido.

Operador de olvido estructurado F_ω

En sesiones largas (> 30min), la acumulación de recuperaciones de M2 introduce sesgos hacia eventos pasados que dejan de ser relevantes. El operador F_ω controla este drift de contexto:

F_ω(t) = exp(-ω · Δt) · I + (1 - exp(-ω · Δt)) · P_relevancia

Δt = tiempo desde última excepción TAE

ω ≈ 0.1 min⁻¹ (parámetro libre; estimado en SE-2)

P_relevancia = proyector sobre subespacio correlacionado con ICG actual

3. Protocolo de Feedback Cerrado SE-LOOP-1

3.1 Máquina de estados TAE operacional

El arco TAE operacional A_TAE se formaliza como máquina de estados finitos con cinco estados y transiciones temporizadas:

Estados: {S_baseline, S_deteccion, S_excepcion, S_reorganizacion, S_consolidacion}

S_baseline →[ICG < θ_exc AND ΔIES > δ_min]→ S_deteccion

S_deteccion →[confirmado en τ_conf < 80ms]→ S_excepcion

S_deteccion →[señal revertida]→ S_baseline

S_excepcion →[ICG inicia recuperación]→ S_reorganizacion

S_reorganizacion →[ICG > θ_cons por τ_cons]→ S_consolidacion

S_consolidacion →[estabilizado]→ S_baseline

La ventana de confirmación τ_conf = 80ms evita falsos positivos por artefactos musculares o de movimiento, que típicamente duran < 50ms. Este valor se calibra en SE-1. θ_exc corresponde al percentil 5 de ICG en calibración.

3.2 Política de respuesta diferenciada por nivel CPEA-A

Nivel	C_sys	Modo ORION-AGI	Feedback	Latencia máx.
A1	> 0.80	Inferencia normal	Sin feedback activo	N/A
A2	0.50–0.80	Recuperación asistida + M2	Baja intensidad (150ms budget)	150ms
A3	0.20–0.50	Contención / minimal output	Estabilización (cache M3)	80ms
A4	≤ 0.20	Bypass LLM	Señal de parada + alerta	20ms

El nivel A4 activa el protocolo de seguridad SE-SAFE-1: detención del feedback activo, registro completo del episodio desde M1, y notificación al operador experimental. El pipeline EEG→AGI se suspende hasta intervención humana.

3.3 Canal de feedback y codificación de señal

La señal de feedback se codifica como vector de modulación F(t) ∈ ℝ³:

F(t) = [f_freq, f_amplitude, f_duration]

f_freq : frecuencia objetivo [Hz] (alpha: 8–12, gamma: 35–45)

f_amplitude: intensidad normalizada [0,1]

f_duration : duración del pulso [ms]

Generación dinámica según déficit de ICG:

ΔICG > 0.3 → FeedbackSignal(freq=40.0, amp=0.6, dur=500) # gamma

ΔICG > 0.1 → FeedbackSignal(freq=10.0, amp=0.4, dur=300) # alpha

else → FeedbackSignal(freq=10.0, amp=0.2, dur=200) # mant.

Para el nivel A3, la latencia de 80ms es incompatible con inferencia LLM completa. La solución es una caché de 32 vectores F(t) precomputados correspondientes a los 32 prototipos M3, indexados por similitud coseno en tiempo real sin llamada al LLM.

3.4 Loop de verificación y escalado reactivo

Tras cada pulso de estimulación, el sistema verifica recuperación de ICG en una ventana de 200ms post-feedback:

LoopResult = {EFFECTIVE, NEUTRAL, CONTRAINDICATED}

ΔICG > +0.05 → EFFECTIVE

ΔICG ∈ [-0.05, +0.05] → NEUTRAL

ΔICG < -0.05 → CONTRAINDICATED

Si el resultado es CONTRAINDICATED en dos ciclos consecutivos, el sistema escala automáticamente al nivel TAE superior. Este mecanismo de escalado reactivo es el análogo operacional del ICS(t) cruzando su umbral adaptativo (CPEA-ICS-1). La posibilidad de oscilación entre niveles (histéresis) requiere un operador de amortiguación no especificado en esta versión — pendiente crítico.

3.5 Estructura de registro para validación ICP

Cada ciclo del loop cerrado genera un LoopRecord estructurado compatible con CPEA-ICP-VAL-1:

@dataclass

class LoopRecord:

session_id : str

timestamp : float

tae_level : str # A1–A4

icg_pre : float

icg_post : float

delta_icg : float

feedback_signal: FeedbackSignal

loop_result : LoopResult

latency_ms : float # latencia real medida

c_sys : float # operador CPEA-A

ies_pre : float

ies_post : float

cpea_psi_pre : np.ndarray # Ψ_CPEA ∈ ℝ⁵

cpea_psi_post : np.ndarray

Marco de Validación Experimental Integrado

Hipótesis nula compuesta del sistema: H₀_NEXUS

La hipótesis nula del pipeline integrado se define como la conjunción de cuatro sub-hipótesis con jerarquía de falsificación estricta:

H₀_NEXUS = H₀_LAT ∧ H₀_AEF ∧ H₀_MEM ∧ H₀_LOOP

H₀_LAT : P95(L_total) ≥ 300ms

H₀_AEF : r(Φ_AEF(x_EEG), z_target) ≤ r(z_random, z_target) + ε_null

H₀_MEM : E[δ_PE | M1+M2] ≥ E[δ_PE | M1]

H₀_LOOP: E[ΔICG | feedback_activo] ≤ E[ΔICG | feedback_sham]

Orden de falsificación: H₀_LAT → H₀_AEF → H₀_MEM → H₀_LOOP

La jerarquía es estricta: H₀_AEF no es testeable si H₀_LAT no ha sido rechazada (un sistema con latencia excesiva introduce confundidores temporales no controlados). H₀_MEM no es testeable si H₀_AEF no ha sido rechazada (M2 indexa embeddings producidos por Φ_AEF; si Φ_AEF no alinea semánticamente, los vectores en M2 son topológicamente arbitrarios). H₀_LOOP requiere que H₀_LAT haya sido rechazada por la misma razón de confundidores temporales.

Extensión de CPEA-ICP-VAL-1: Capa 0

Se introduce una Capa 0 de validación técnica del pipeline que debe completarse antes de que la Capa I (EFA/CFA) sea ejecutable:

Criterio	Métrica	Umbral superación	Umbral falsificación	Bloquea avance a
C0.1	P95(L_total)	< 280ms	> 350ms	SE-2
C0.2	r(Φ_AEF, z_target)	> 0.45	< 0.20	SE-2
C0.3	σ(r) / 10 sesiones	< 0.08	> 0.15	SE-3
C0.4	Sensibilidad TAE-DET	> 0.80	< 0.60	SE-2
C0.5	Especificidad TAE-DET	> 0.90	< 0.75	SE-2

Los criterios C0.x no son tests estadísticos — son umbrales de rendimiento técnico que bloquean el avance al siguiente programa experimental si no se superan. La zona entre umbral de superación y falsificación es una zona gris de revisión obligatoria.

Extensiones a Capas I, II y III existentes

Predicción I.4 (nueva en Capa I): el análisis factorial confirmatorio sobre vectores CPEA_S(t) debe producir estructura de cinco factores con cargas > 0.50. Si M2 está funcionando correctamente, los episodios TAE recuperados deben aumentar la varianza explicada del factor ICG en ≥ 8% respecto a la condición sin memoria.

Predicción II.3 (nueva en Capa II): el feedback SE-LOOP-1 en nivel A2 debe producir incremento de potencia alpha frontal (Fz, F3, F4) de ≥ 15% en la ventana [200ms, 800ms] post-estimulación. Esta predicción ancla el efecto del feedback en un correlato EEG conocido antes de atribuirlo al ICG.

Predicción III.2 (nueva en Capa III): el ICC del delta_icg post-feedback (confiabilidad test-retest entre sesiones) debe ser > 0.65 para que SE-LOOP-1 sea considerado un protocolo reproducible. ICC < 0.40 indica efecto idiosincrásico no generalizable.

Programas experimentales SE-1 a SE-4

Prog.	N	Objetivo primario	Métricas primarias	Criterio avance
SE-1	12	Rechazar H₀_LAT; calibrar TAE-DET	C0.1, C0.4, C0.5; distribución τ_exc	C0.1+C0.4+C0.5 en ≥10/12
SE-2	8	Rechazar H₀_AEF y H₀_MEM; estimar ω	C0.2, C0.3, Pred. I.4	H₀_AEF p<0.05 BH-FDR; mejora δ_PE en ≥6/8
SE-3	16	Rechazar H₀_LOOP; dosis-respuesta feedback	ANCOVA ΔICG, Pred. II.3	H₀_LOOP p<0.01 BH-FDR; Pred. II.3 en ≥12/16
SE-4	8	Generalización longitudinal; estabilidad M3	ICC(ΔICG), ICC(r_AEF), prototipos M3	ICC > 0.65; ≥8 prototipos M3 estables

Corrección estadística unificada

Todos los tests de las secciones 1–4 se someten a corrección Benjamini-Hochberg FDR global, no por sección. El número total de comparaciones planeadas es M_total = 22 (5 de Capa 0, 4 de Capa I, 3 de Capa II, 2 de Capa III, 8 secundarias). Con α = 0.05, el umbral BH-FDR para la comparación de rango k es α_k = (k/22) · 0.05.

Las métricas de Capa 0 no entran en la corrección BH-FDR por ser criterios de rendimiento técnico, no tests estadísticos.

Árbol de consecuencias downstream

La jerarquía de falsificación genera implicaciones estructuradas para el corpus:

• H₀_LAT no rechazada → NEXUS-EEG v1.0 requiere rediseño: reducir ventana SPEC (1s→0.5s), migrar Φ_AEF a GPU dedicada, desacoplar loop de feedback del ciclo de inferencia LLM.

• H₀_AEF no rechazada → la fibración de Hopf como sustrato unificador pierde soporte empírico en el dominio EEG→LLM. FIBRA-COH-1 requiere revisión de la restricción de Chern sobre W_proj. M2 no puede construirse. CPEA-LATEN-1 (U(t) en variedad Riemanniana) pierde anclaje en este dominio de aplicación.

• H₀_MEM no rechazada → M2/M3 se reducen a logging pasivo. CPEA-N pierde el mecanismo de memoria compartida cross-sujeto. CPEA-SELF-1 (trimodular M_E/M_U/M_S) pierde correspondencia con la arquitectura de memoria.

• H₀_LOOP no rechazada → SE-LOOP-1 es inefectivo como protocolo de intervención. El sistema se reconfigura como observador pasivo. La hipótesis central de modulabilidad de la coherencia EEG mediante feedback AGI queda sin soporte experimental. Nota: el fallo de H₀_LOOP no implica necesariamente fallo del pipeline técnico — puede deberse al canal de feedback elegido, no a la arquitectura.

Integración Formal con el Corpus Papayaykware

Conexiones estructurales directas

CPEA-LOOP-1 no introduce construcciones independientes sino que operacionaliza y extiende documentos existentes del corpus:

• FIBRA-COH-1: la restricción de Chern sobre W_proj es el puente formal entre la topología fibrada del corpus y la implementación numérica del mapeo AEF. La validación de H₀_AEF es simultáneamente una prueba empírica de la tesis central de FIBRA-COH-1.

• CPEA-LATEN-1: el operador de decodificación G_m es el caso inverso de Φ_AEF. La asimetría entre proyección EEG→LLM y reconstrucción LLM→EEG define operacionalmente la región de coherencia semántica U(t).

• CPEA-ICS-1: el error de alineación L_align de Φ_AEF es una señal candidata para el cuarto componente CPEA_S(t). El mecanismo de escalado reactivo de SE-LOOP-1 es el análogo operacional del ICS(t) cruzando su umbral adaptativo.

• DEPD: δ_PE durante τ_exc es la señal más informativa del sistema y actúa como supervisión débil para la Fase 2 del entrenamiento online del AEF. SE-LOOP-1 en niveles A2/A3 implementa una forma de control predictivo activo orientado a minimizar δ_PE mediante estimulación externa.

• CPEA-A: los cuatro niveles de adversarialidad dejan de ser clasificatorios para convertirse en actuadores de política. C_sys pasa de métrica de seguimiento a variable de control del pipeline.

• TAGIS: el umbral V(ε) de relevancia actúa como criterio de escritura en M2, preservando la semántica del índice episódico frente a fluctuaciones basales.

• CPEA-N: la extensión de M2 a memoria compartida cross-sujeto implementa la emergencia discriminada Δ_E(t) a nivel de memoria episódica, requiriendo el protocolo de privacidad diferencial de TAGIS-FED.

• CPEA-SELF-1: el modelo trimodular Self(t) = {M_E, M_U, M_S} puede leerse como proyección funcional de M1/M2/M3 respectivamente.

• TAE-F2: la máquina de estados A_TAE mapea directamente sobre τ_exc, τ̂, τ_reorg, τ_cons. El escalado reactivo implementa la transición de segundo orden con mecanismo Kibble-Zurek en tiempo real.

• CPEA-ICP-VAL-1: la Capa 0 extiende formalmente el protocolo de validación existente. Los registros LoopRecord son la fuente primaria para los criterios F-L1/F-L2/F-L3.

• CPEA-PFI-1 / CPEA-ARCH-R1: H₀_NEXUS y el árbol de consecuencias downstream deben incorporarse al pre-registro OSF. SE-1 y SE-2 constituyen la validación experimental del preprint CPEA-ARCH-R1.

Pendientes críticos para versión 1.1

• Análisis de potencia estadística formal para N de SE-1 a SE-4. Los tamaños muestrales actuales (12, 8, 16, 8) son provisionales.

• Validación piloto del paradigma de inducción TAE (tarea de inversión de reglas, Stroop modificado) para confirmar frecuencia de excepciones detectables por TAE-DET.

• Protocolo de enmascaramiento del sujeto para condición sham en SE-3. Sin enmascaramiento efectivo, el diseño tiene riesgo de sesgo de expectativa.

• Operador de amortiguación para el mecanismo de escalado reactivo, evitando oscilación (histéresis) entre niveles TAE.

• Estimación empírica de ω (tasa de decaimiento de F_ω). Candidato a métrica secundaria de SE-2.

• Protocolo de privacidad diferencial ε_DP < 3 de TAGIS-FED para la extensión multi-sujeto de M2 en SE-4.

• Demostración formal de que la regularización KL en L_align es suficiente para garantizar alineación semántica significativa, no solo compatibilidad distribucional. Candidato a criterio de falsificación adicional en CPEA-ICP-VAL-1.

Resumen

CPEA-LOOP-1 cierra cuatro brechas estructurales del corpus:

• Mapeo EEG→LLM: Φ_AEF como autoencoder fibrado con restricción de Chern, entrenamiento en dos fases, e inyección por soft prompting continuo que elimina el cuello de botella de tokenización.

• Memoria temporal: arquitectura tripartita M1/M2/M3 con políticas de composición dinámicas (α, β, γ según estado TAE) y operador de olvido estructurado F_ω que previene el drift de contexto en sesiones largas.

• Feedback cerrado: protocolo SE-LOOP-1 con máquina de estados A_TAE, política diferenciada por niveles A1–A4, caché precomputada para latencias < 80ms en nivel A3, loop de verificación con escalado reactivo, y registro LoopRecord compatible con CPEA-ICP-VAL-1.

• Validación integrada: hipótesis nula compuesta H₀_NEXUS con jerarquía de falsificación estricta, extensión de CPEA-ICP-VAL-1 con Capa 0, cuatro programas experimentales SE-1 a SE-4 con criterios de avance cuantitativos, corrección BH-FDR global sobre 22 comparaciones, y árbol de consecuencias downstream para cada sub-hipótesis.

Referencias

[NEXUS-EEG v1.0] Pipeline de seis módulos ACQ→PREP→SPEC→COH→TAE-DET→SER con extensiones EXT-1/2/3. Base de adquisición y preprocesado sobre la que opera Φ_AEF.

[ORION-AGI / CPEA-ARCH-R1] Orchestrador backend-agnóstico con Mistral-7B-Instruct, FAISS y soft prompting. CPEA-LOOP-1 especifica la implementación concreta de estos componentes.

[FIBRA-COH-1] Índice de coherencia fibrada con fibración de Hopf y números de Chern. Provee la restricción geométrica que distingue Φ_AEF de una proyección lineal arbitraria.

[CPEA-ICP-VAL-1] Protocolo de validación secuencial de tres capas con criterios de falsificación por capa. CPEA-LOOP-1 añade la Capa 0 de validación técnica.

[CPEA-PFI-1] Pre-registro de falsificabilidad con corrección BH-FDR. H₀_NEXUS debe incorporarse al pre-registro OSF junto con el árbol de consecuencias downstream.

[CPEA-A] Módulo adversarial con operador de confianza C_sys y taxonomía de cuatro niveles. CPEA-LOOP-1 operacionaliza esta taxonomía como política de actuación del pipeline.

[CPEA-ICS-1] Índice de Coherencia Semántica como cuarto componente de CPEA_S(t). El error L_align de Φ_AEF es candidato a señal de entrada para ICS(t).

[CPEA-IES-1 / CPEA-FASE-1] Índice de Estabilidad de Fase y tensor de estado Ψ_CPEA ∈ ℝ⁵. Fuente de las features EEG que entran en Φ_AEF y del vector de contexto M1.

[DEPD] Detector de Error Predictivo Dinámico. δ_PE actúa como supervisión débil en la Fase 2 del AEF y como señal de recompensa para el aprendizaje de los pesos (α, β, γ).

[TAE-F1/F2] Definición formal del orden parameter Ψ y taxonomía temporal de reorganización post-excepción. Marco teórico del que se deriva la máquina de estados A_TAE.

[TAGIS] Operador de relevancia V(ε) como criterio de escritura en M2. Sin este filtro, la memoria episódica acumula fluctuaciones basales que degradan la recuperación por similitud.

[CPEA-N] Coherencia grupal Γ_N(t) y operador de emergencia Δ_E(t). La extensión de M2 a memoria compartida cross-sujeto es la implementación computacional de CPEA-N.

[CPEA-SELF-1] Arquitectura trimodular Self(t) = {M_E, M_U, M_S}. La correspondencia funcional con M1/M2/M3 establece un isomorfismo entre el modelo de self y la arquitectura de memoria.

[TAGIS-FED] Aprendizaje federado con privacidad diferencial ε_DP < 3. Protocolo necesario para la extensión multi-sujeto de M2 en SE-4.

[CPEA-LATEN-1] Embedding cognitivo universal U(t) en variedad Riemanniana. G_m como operador inverso de Φ_AEF define la región de coherencia semántica del pipeline.

Archivos del Blog

CPEA-LOOP-1Pipeline de Embeddings EEG→AGI, Arquitectura de Memoria Temporal y Protocolo de Feedback Cerrado con Validación Experimental Integrada

CPEA-NEXUS · Sección: Pipeline de Embeddings EEG→AGI

Estado del problema

Propuesta formal: Autoencoder Fibrado (AEF) como función de mapeo

Latencia: análisis por segmento y objetivos

Medición de latencia end-to-end: protocolo SE-LAT-1

Integración con el corpus

CPEA-NEXUS · Sección: Arquitectura de Memoria y Contexto Temporal

Estado del problema

Taxonomía de memoria: tres capas operacionales

Política de composición del contexto LLM

Coherencia temporal: el problema del drift de contexto

Integración con el corpus

Pendientes que quedan abiertos

CPEA-NEXUS · Sección: Gestión de Excepciones TAE en Tiempo Real y Protocolo de Feedback Cerrado

Estado del problema

Formalización del evento TAE en tiempo real

Política de respuesta diferenciada por nivel CPEA-A

Protocolo de feedback cerrado: especificación SE-LOOP-1

Integración con el corpus

Pendientes que quedan abiertos

CPEA-NEXUS · Sección: Validación Experimental y Criterios de Falsificación Integrados del Pipeline Completo

Estado del problema

Hipótesis nula del sistema completo: H₀_NEXUS

Integración en CPEA-ICP-VAL-1: extensión de capas

Mapa de programas experimentales SE-1 a SE-4

Árbol de consecuencias downstream

Corrección estadística unificada

Integración con el corpus

Pendientes que quedan abiertos

Abstract

Pipeline de Embeddings EEG→AGI: Autoencoder Fibrado (Φ_AEF)

1.1 Diagnóstico del estado actual

Función de mapeo: definición formal del Autoencoder Fibrado

Entrenamiento en dos fases

Soft prompting continuo: eliminación del cuello de botella de tokenización

Presupuesto de latencia end-to-end

Arquitectura de Memoria Temporal Tripartita

Taxonomía de tres capas

Capa M1 — Memoria de Trabajo (τ ∈ [0, 10s])

Capa M2 — Memoria Episódica (τ ∈ [10s, sesión])

Capa M3 — Memoria Estructural (persistente entre sesiones)

Política de composición del contexto LLM

Operador de olvido estructurado F_ω

3. Protocolo de Feedback Cerrado SE-LOOP-1

3.1 Máquina de estados TAE operacional

3.2 Política de respuesta diferenciada por nivel CPEA-A

3.3 Canal de feedback y codificación de señal

3.4 Loop de verificación y escalado reactivo

3.5 Estructura de registro para validación ICP

Marco de Validación Experimental Integrado

Hipótesis nula compuesta del sistema: H₀_NEXUS

Extensión de CPEA-ICP-VAL-1: Capa 0

Extensiones a Capas I, II y III existentes

Programas experimentales SE-1 a SE-4

Corrección estadística unificada

Árbol de consecuencias downstream

Integración Formal con el Corpus Papayaykware

Conexiones estructurales directas

Pendientes críticos para versión 1.1

Resumen

Referencias

Comentarios

Publicar un comentario

Entradas populares

Guía práctica sobre técnicas de XAI: SHAP, LIME y Grad-CAM

N-acetilcisteína (NAC): Fuentes alimentarias naturales