CPEA-LOOP-1Pipeline de Embeddings EEG→AGI, Arquitectura de Memoria Temporal y Protocolo de Feedback Cerrado con Validación Experimental Integrada
CPEA-NEXUS · Sección: Pipeline de Embeddings EEG→AGI
Estado del problema
La arquitectura actual pasa features EEG como contexto textual al prompt del AGI. Esto es funcionalmente correcto como prototipo, pero introduce tres problemas estructurales que bloquean el cierre del loop en condiciones operacionales:
-
Pérdida de geometría: las features EEG (potencia espectral, coherencia interelectrodo, IES, VDF) son magnitudes definidas sobre una variedad de alta dimensión. Serializarlas como texto plano destruye la estructura métrica y topológica que el corpus requiere preservar.
-
Latencia acumulada: la cadena
EEG → filtrado → extracción → serialización textual → tokenización → inferencia LLM → decodificación → feedbacktiene cuellos de botella en la tokenización y el prefill del prompt, especialmente si el contexto crece con cada paso. -
Semántica desacoplada: el espacio de embeddings de Mistral-7B-Instruct está organizado por semántica lingüística, no por dinámica oscilatoria. Sin una función de alineación explícita, la señal EEG no "aterriza" en las regiones del espacio latente que modulan los outputs relevantes.
Propuesta formal: Autoencoder Fibrado (AEF) como función de mapeo
La fibración de Hopf H: S³→S² está establecida en el corpus (FIBRA-COH-1) como sustrato unificador de EEG, embeddings semánticos y datos geomagnéticos. La extensión natural es construir un autoencoder fibrado Φ_AEF que actúe como morfismo entre la variedad EEG y la variedad semántica del LLM.
Definición formal:
Sea x_EEG(t) ∈ ℝ^d el vector de features en el instante t (d = número de features: potencias por banda × electrodos + coherencias + IES + VDF + ICG). Sea z_LLM ∈ ℝ^D el espacio de embeddings del LLM (D = 4096 para Mistral-7B).
El mapeo propuesto es:
Φ_AEF : ℝ^d → ℝ^D
Φ_AEF(x) = W_proj · σ(W_enc · x + b_enc) + b_proj
donde W_enc ∈ ℝ^{D/2 × d} es el encoder lineal, σ es ReLU, y W_proj ∈ ℝ^{D × D/2} es la proyección al espacio semántico.
La restricción fibrada que distingue esto de una proyección lineal arbitraria es que W_proj debe preservar la estructura de cohomología de Chern del espacio de embeddings (ver FIBRA-COH-1, Chern number c₁). Operacionalmente, esto se implementa con una regularización de alineación geométrica:
L_total = L_rec + λ · L_align
L_align = ||Φ_AEF(x) - z_target||² + μ · KL(p_EEG || p_LLM)
donde z_target son embeddings de referencia obtenidos de prompts calibrados (ver abajo), y el término KL fuerza que la distribución de embeddings proyectados sea compatible con la distribución marginal del LLM en reposo.
Entrenamiento en dos fases:
- Fase 1 (offline): pares
(x_EEG_calibración, z_target)con estímulos de referencia conocidos (estado baseline, tarea cognitiva estándar, excepción TAE inducida). z_target se obtiene codificando descripciones textuales del estado esperado. - Fase 2 (online fino): actualización estocástica con SGD de baja tasa (lr=1e-5) sobre ventanas de 2s, usando el error de predicción del DEPD como señal de supervisión débil.
Latencia: análisis por segmento y objetivos
El presupuesto de 300ms para closed-loop efectivo se descompone así:
| Segmento | Implementación actual | Objetivo | Cuello de botella |
|---|---|---|---|
| ACQ → buffer | BrainFlow, 250Hz, latencia ~4ms | ≤10ms | No crítico |
| Filtrado (PREP) | MNE-Python, ventana 1s | ≤20ms | Longitud de ventana |
| Extracción features (SPEC+COH) | scipy.signal, numpy FFT | ≤30ms | N electrodos |
| Φ_AEF (proyección) | No implementado | ≤5ms | Inferencia CPU/GPU |
| Prompt → tokens | Serialización textual actual | ≤15ms | Reemplazar con soft prompt |
| Prefill LLM | Mistral-7B, context ~512 tokens | ≤80ms | Longitud de contexto |
| Generación respuesta | ~50 tokens output | ≤100ms | Batch size |
| Feedback → actuador | Canal de salida | ≤20ms | No crítico |
| Total estimado | ~350-500ms | ≤280ms | Prefill + extracción |
El principal cuello de botella no es la extracción ni la proyección, sino el prefill del LLM con contexto textual creciente.
La solución arquitectónica es sustituir la inyección de contexto textual por soft prompting continuo: Φ_AEF(x_EEG) se inyecta directamente como token de prefijo en el espacio de embeddings del LLM, sin pasar por tokenización. Esto elimina el paso de serialización y reduce el prefill a un único token virtual de D dimensiones.
Implementación con Mistral-7B-Instruct (Hugging Face):
# Proyección EEG → embedding virtual
eeg_embed = phi_aef(x_eeg) # shape: [1, D]
# Prefijo soft: concatenar con embeddings del prompt base
prompt_embeds = model.get_input_embeddings()(base_prompt_ids) # [1, L, D]
augmented_embeds = torch.cat([eeg_embed.unsqueeze(1), prompt_embeds], dim=1)
# Inferencia con embeddings aumentados
outputs = model(inputs_embeds=augmented_embeds)
Este patrón es compatible con la arquitectura de NEXUS-EEG v1.0 (módulo EXT-2: buffer async a Mistral-7B-Instruct) sin modificar la interfaz CPEA_S(t).
Medición de latencia end-to-end: protocolo SE-LAT-1
Para validar el pipeline contra el umbral de 300ms, propongo el protocolo de medición SE-LAT-1 con cuatro métricas:
import time
def measure_pipeline_latency(n_trials=100):
latencies = {}
for i in range(n_trials):
t0 = time.perf_counter()
x_eeg = acq_buffer.get_latest_window() # ACQ
t1 = time.perf_counter()
x_prep = prep_module.filter(x_eeg) # PREP
t2 = time.perf_counter()
feats = spec_coh_module.extract(x_prep) # SPEC+COH
t3 = time.perf_counter()
z_llm = phi_aef(feats) # AEF
t4 = time.perf_counter()
response = orion_agi.infer(z_llm) # LLM
t5 = time.perf_counter()
latencies[i] = {
'acq': (t1-t0)*1000,
'prep': (t2-t1)*1000,
'feat': (t3-t2)*1000,
'aef': (t4-t3)*1000,
'llm': (t5-t4)*1000,
'total': (t5-t0)*1000
}
return latencies
Criterio de falsificación: si P95(latencia_total) > 300ms en condiciones de carga nominal (250Hz, 32 canales, ventana 1s), el pipeline no es viable para closed-loop y debe activarse el modo degradado (CPEA_stream sin feedback LLM sincrónico).
Integración con el corpus
Este bloque conecta con:
- CPEA-LATEN-1: el operador de decodificación G_m es el caso inverso de Φ_AEF — la asimetría entre proyección EEG→LLM y reconstrucción LLM→EEG define la región de coherencia semántica U(t).
- CPEA-ICS-1: el ICS(t) como cuarto componente de CPEA_S(t) puede retroalimentarse directamente desde el error de alineación L_align, proporcionando un índice de coherencia semántica en tiempo real.
- DEPD: el error de predicción δ_PE actúa como señal supervisora débil para la Fase 2 del entrenamiento online del AEF.
- FIBRA-COH-1: la restricción de Chern sobre W_proj es el puente formal entre la topología fibrada del corpus y la implementación numérica del mapeo.
Pendientes críticos que quedan abiertos:
El protocolo SE-LAT-1 requiere hardware real para medirse — sin un EEG conectado, los valores son estimaciones. El entrenamiento de Fase 1 del AEF necesita pares de calibración que todavía no existen en el corpus experimental. La pregunta sobre si la regularización KL es suficiente para garantizar alineación semántica significativa (vs. mera compatibilidad distribucional) es una hipótesis falsificable que debería incluirse en CPEA-ICP-VAL-1 como criterio F-L adicional.
CPEA-NEXUS · Sección: Arquitectura de Memoria y Contexto Temporal
Estado del problema
El corpus establece el módulo FAISS de memoria episódica en ORION-AGI como componente arquitectónico, pero su integración con la dinámica temporal del pipeline EEG→AGI permanece subespecificada en tres dimensiones críticas:
-
Granularidad temporal de indexación: FAISS indexa vectores estáticos, pero los estados CPEA_S(t) son trayectorias continuas en ℝ⁵. La pregunta de qué se indexa — snapshots, ventanas, excepciones TAE, o arcos de reorganización completos — determina qué tipo de recuperación es posible.
-
Política de escritura vs. recuperación: el sistema necesita distinguir entre memoria de trabajo (ventana activa ~2-10s, relevante para coherencia de prompt), memoria episódica (eventos TAE pasados, relevante para calibración adaptativa), y memoria estructural (patrones de reorganización recurrentes, relevante para predicción a largo plazo).
-
Coherencia temporal del contexto LLM: cada llamada a Mistral-7B-Instruct recibe un contexto que mezcla el estado EEG actual con recuperaciones de memoria. Sin una política de composición explícita, el contexto se vuelve incoherente o redundante a medida que el sistema opera continuamente.
Taxonomía de memoria: tres capas operacionales
Propongo formalizar la memoria de ORION-AGI en tres capas con semántica distinta, análogas a la taxonomía temporal de TAE-F2 (τ_exc, τ̂, τ_reorg, τ_cons):
Capa M1 — Memoria de Trabajo (τ ∈ [0, 10s])
Buffer circular de los últimos N estados CPEA_S(t) en RAM. No persiste entre sesiones. Su función es proporcionar contexto de continuidad al LLM dentro de un episodio cognitivo activo.
class WorkingMemoryBuffer:
def __init__(self, capacity_seconds=10, fs=250):
self.capacity = capacity_seconds * fs # muestras
self.buffer = deque(maxlen=self.capacity)
def push(self, cpea_state: CPEAState):
self.buffer.append({
'timestamp': cpea_state.t,
'psi': cpea_state.psi, # ℝ⁵
'icg': cpea_state.icg, # escalar
'tae_flag': cpea_state.tae # bool
})
def get_context_window(self, seconds=2.0) -> np.ndarray:
n = int(seconds * 250)
recent = list(self.buffer)[-n:]
return np.array([s['psi'] for s in recent]) # [n, 5]
El contexto M1 se proyecta mediante Φ_AEF(mean(context_window)) como token de prefijo continuo — no como texto.
Capa M2 — Memoria Episódica (τ ∈ [10s, sesión])
Índice FAISS de eventos TAE y arcos de reorganización. Cada entrada es un par (z_event, metadata):
z_event = Φ_AEF(Ψ_CPEA_evento) ∈ ℝ^D
metadata = {
'tipo': 'TAE_excepcion' | 'TAE_reorganizacion' | 'baseline',
'duracion_ms': float,
'icg_pre': float,
'icg_post': float,
'timestamp': float,
'tags_semanticos': List[str]
}
La recuperación es por similitud coseno en ℝ^D: dado el estado actual z_t, se recuperan los k=3 eventos más similares topológicamente. Esto implementa una forma de reminiscencia contextual: el AGI recibe no solo el estado presente sino los episodios pasados más análogos en el espacio de embeddings.
Capa M3 — Memoria Estructural (τ > sesión, persistente)
Patrones de reorganización recurrentes extraídos offline por clustering sobre M2. Se almacenan como prototipos de trayectoria en el espacio de Hopf — no vectores individuales sino curvas en la variedad. Formalmente, un prototipo P_k es una secuencia de embeddings:
P_k = {z_0^k, z_1^k, ..., z_T^k} ⊂ ℝ^D
representando el arco canónico del k-ésimo patrón de excepción-reorganización. M3 alimenta la calibración adaptativa de CPEA-2 (percentil 95 del error de predicción) con información sobre la historia de reorganizaciones del sujeto.
Política de composición del contexto LLM
En cada paso de inferencia, el contexto que recibe ORION-AGI se construye mediante la función de composición C_ctx:
C_ctx(t) = α · z_M1(t) ⊕ β · z_M2_retrieved(t) ⊕ γ · z_M3_prototype(t)
donde ⊕ es concatenación en el espacio de embeddings con proyección de dimensionalidad, y los pesos (α, β, γ) son dinámicos:
def compute_context_weights(cpea_state, tae_active):
if tae_active:
# Durante excepción TAE: priorizar memoria episódica
return {'alpha': 0.3, 'beta': 0.6, 'gamma': 0.1}
elif cpea_state.icg > 0.7:
# Alta coherencia global: priorizar estado presente
return {'alpha': 0.7, 'beta': 0.2, 'gamma': 0.1}
else:
# Estado ambiguo: balance entre presente e historia
return {'alpha': 0.5, 'beta': 0.3, 'gamma': 0.2}
Esta política tiene una justificación en términos del corpus: durante un evento TAE (excepción), el sistema está en una región de alta incertidumbre donde el contexto histórico de reorganizaciones análogas es más informativo que el estado instantáneo. En alta coherencia (ICG > 0.7), el estado presente es suficientemente predictivo y la memoria episódica introduce ruido.
Coherencia temporal: el problema del drift de contexto
Un riesgo operacional no documentado en el corpus es el drift de contexto: en sesiones largas (>30min), la acumulación de recuperaciones de M2 en el historial de conversación del LLM introduce sesgos hacia eventos pasados que dejan de ser relevantes. El modelo "recuerda demasiado".
La solución es un operador de olvido estructurado F_ω análogo al gate de olvido en LSTMs, pero definido sobre el espacio de embeddings:
z_ctx_filtrado(t) = F_ω · z_ctx(t)
F_ω = exp(-ω · Δt) · I + (1 - exp(-ω · Δt)) · P_relevancia
donde Δt es el tiempo transcurrido desde la última excepción TAE, ω es la tasa de decaimiento (parámetro libre, estimado en ~0.1 min⁻¹ como punto de partida), y P_relevancia es un proyector sobre el subespacio de embeddings más correlacionado con el ICG actual.
Esto mantiene la coherencia temporal del contexto LLM sin necesidad de truncar manualmente el historial.
Integración con el corpus
La arquitectura de tres capas se alinea y extiende directamente con documentos establecidos:
- CPEA-2: M3 provee la distribución histórica de errores de predicción necesaria para calibrar el percentil 95 adaptativamente entre sesiones, no solo dentro de sesión.
- CPEA-N: el operador de coherencia grupal Γ_N(t) puede extenderse a memoria compartida — múltiples sujetos contribuyendo a un índice FAISS colectivo en M2, con recuperación cruzada entre sujetos. Esto implementa la "emergencia discriminada" Δ_E(t) a nivel de memoria episódica.
- TAGIS: la función de valoración de relevancia V(ε) del módulo MEE actúa como criterio de escritura en M2 — solo los eventos que superan el umbral de relevancia TAGIS se indexan en memoria episódica.
- CPEA-SELF-1: el modelo de self trimodular (M_E, M_U, M_S) puede leerse como una proyección funcional de M1/M2/M3 respectivamente — memoria de trabajo como estado enacted, episódica como historia unarticulated, estructural como self simbólico.
Pendientes que quedan abiertos
La política de pesos (α, β, γ) está definida con umbrales heurísticos. Una extensión formal requiere aprendizaje de estos pesos por RL con el error de predicción del DEPD como señal de recompensa. El operador F_ω introduce el parámetro libre ω que debe estimarse empíricamente — candidato para SE-2 del roadmap experimental. Finalmente, la extensión de M2 a memoria grupal (CPEA-N) requiere un protocolo de privacidad diferencial compatible con TAGIS-FED.
CPEA-NEXUS · Sección: Gestión de Excepciones TAE en Tiempo Real y Protocolo de Feedback Cerrado
Estado del problema
El corpus formaliza extensamente la excepción TAE como evento topológico — ruptura de simetría en el orden parameter Ψ, reorganización post-excepción según Kibble-Zurek, taxonomía temporal en τ_exc/τ̂/τ_reorg/τ_cons (TAE-F2). Sin embargo, la operacionalización en tiempo real dentro del pipeline NEXUS-EEG→ORION-AGI presenta tres brechas no resueltas:
-
Detección vs. respuesta: el módulo TAE-DET en NEXUS-EEG v1.0 produce un flag booleano de excepción. Pero el corpus no especifica qué hace ORION-AGI durante el intervalo τ_exc — que puede durar entre decenas de milisegundos y varios segundos. El sistema no puede simplemente esperar.
-
Gradiente de respuesta: no toda excepción TAE tiene la misma severidad ni el mismo perfil de reorganización. Tratar todas las excepciones con la misma política de respuesta ignora la taxonomía de adversarialidad de CPEA-A (cuatro niveles) y la estructura multimodal de C_sys.
-
Cierre real del loop: el feedback del AGI hacia el sujeto (o hacia el entorno experimental) no tiene protocolo definido. ¿Qué canal? ¿Qué latencia máxima? ¿Qué formato de señal? Sin esto, el "closed-loop" es una afirmación arquitectónica sin implementación.
Formalización del evento TAE en tiempo real
Defino el arco TAE operacional A_TAE como una máquina de estados finitos con cuatro fases, mapeadas directamente sobre la taxonomía temporal del corpus:
A_TAE = {S_baseline, S_deteccion, S_excepcion, S_reorganizacion, S_consolidacion}
Transiciones:
S_baseline →[ICG < θ_exc AND ΔIES > δ_min]→ S_deteccion
S_deteccion →[confirmado en τ_conf < 80ms]→ S_excepcion
S_deteccion →[señal revertida]→ S_baseline
S_excepcion →[ICG inicia recuperación]→ S_reorganizacion
S_reorganizacion →[ICG > θ_cons por τ_cons]→ S_consolidacion
S_consolidacion →[estabilizado]→ S_baseline
El umbral θ_exc corresponde al percentil 5 de ICG en calibración (inverso del θ_CPEA-2: aquí detectamos caída de coherencia, no exceso de error). δ_min es el salto mínimo en IES (Índice de Estabilidad de Fase, CPEA-IES-1) que indica desestabilización de fase.
La ventana de confirmación τ_conf = 80ms es crítica: evita falsos positivos por artefactos musculares o de movimiento, que típicamente duran < 50ms. Este valor debe validarse en SE-1.
Política de respuesta diferenciada por nivel CPEA-A
El corpus CPEA-A define cuatro niveles de adversarialidad basados en C_sys (operador de confianza sistémica). Extiendo esta taxonomía a una política de respuesta TAE diferenciada:
Nivel A1 — Fluctuación basal (C_sys > 0.8)
ICG cae levemente pero se recupera sin intervención. El pipeline continúa sin modificación. ORION-AGI recibe el estado actualizado como contexto normal. M2 no escribe evento (no supera umbral TAGIS).
if tae_level == 'A1':
# Sin cambio de política
orion_response = orion_agi.infer(z_current, context=C_ctx_normal)
m2_memory.skip_write()
Nivel A2 — Excepción moderada (0.5 < C_sys ≤ 0.8)
El sistema activa el modo de recuperación asistida: ORION-AGI recibe un prompt aumentado con los k=3 episodios análogos recuperados de M2, y genera una respuesta orientada a restablecer coherencia. El feedback al sujeto es una señal de baja intensidad (audio tonal, vibrotáctil, o visual periférico según protocolo experimental).
if tae_level == 'A2':
z_retrieved = m2_memory.retrieve_similar(z_current, k=3)
context = C_ctx(z_current, z_retrieved, mode='recovery')
orion_response = orion_agi.infer(z_current, context=context)
feedback_channel.send(
signal=FeedbackSignal.LOW_INTENSITY,
latency_budget_ms=150
)
m2_memory.write(z_current, label='TAE_moderada')
Nivel A3 — Excepción severa (0.2 < C_sys ≤ 0.5)
El sistema entra en modo de contención: ORION-AGI suspende la generación de respuestas semánticas complejas y emite únicamente señales de estabilización (frecuencia, ritmo, simplificación cognitiva). El prototipo M3 más cercano en el espacio de trayectorias se activa como referencia de reorganización esperada.
if tae_level == 'A3':
prototype = m3_memory.get_nearest_trajectory(z_current)
orion_response = orion_agi.infer_stabilization(
z_current,
trajectory_target=prototype,
output_mode='minimal' # solo señales de estabilización
)
feedback_channel.send(
signal=FeedbackSignal.STABILIZATION,
latency_budget_ms=80 # más urgente
)
m2_memory.write(z_current, label='TAE_severa')
event_log.flag_for_review()
Nivel A4 — Colapso de coherencia (C_sys ≤ 0.2)
El pipeline EEG→AGI se interrumpe. El sistema activa el protocolo de seguridad SE-SAFE-1: detención de feedback activo, registro completo del episodio, notificación al operador experimental. Este nivel corresponde a eventos potencialmente artefactuales o a estados fisiológicos que requieren intervención humana.
if tae_level == 'A4':
nexus_pipeline.pause()
safety_protocol.activate('SE-SAFE-1')
event_log.write_full_episode(m1_buffer.dump())
operator_alert.send(priority='HIGH')Protocolo de feedback cerrado: especificación SE-LOOP-1
El protocolo SE-LOOP-1 define formalmente el canal de retorno del AGI hacia el sujeto o entorno experimental. Tiene cuatro componentes:
Canal de salida y codificación
El feedback puede ser auditivo (tono sinusoidal 40Hz, binaural beat, o secuencia rítmica), visual (flicker periférico en frecuencia gamma o alpha, según el estado objetivo), o vibrotáctil (actuador en muñeca o sien). La elección del canal depende del protocolo experimental activo, pero la señal siempre se codifica como un vector de modulación F(t) ∈ ℝ³:
F(t) = [f_freq, f_amplitude, f_duration]
donde f_freq es la frecuencia de estimulación objetivo (alpha: 8-12Hz, gamma: 35-45Hz), f_amplitude es la intensidad normalizada [0,1], y f_duration es la duración en ms del pulso de feedback.
F(t) se genera como función del estado objetivo de reorganización predicho por ORION-AGI:
def generate_feedback_signal(orion_response, target_state):
icg_deficit = target_state.icg - current_state.icg
if icg_deficit > 0.3: # déficit alto: estimulación gamma
return FeedbackSignal(freq=40.0, amplitude=0.6, duration=500)
elif icg_deficit > 0.1: # déficit moderado: estimulación alpha
return FeedbackSignal(freq=10.0, amplitude=0.4, duration=300)
else: # mantenimiento
return FeedbackSignal(freq=10.0, amplitude=0.2, duration=200)
Latencia garantizada por nivel
El presupuesto de latencia de SE-LOOP-1 es asimétrico según el nivel TAE activo, lo que refleja la urgencia diferencial de la respuesta:
| Nivel TAE | Latencia máxima feedback | Modo de inferencia LLM |
|---|---|---|
| A1 | Sin feedback activo | Normal (~200ms) |
| A2 | 150ms | Full inference |
| A3 | 80ms | Minimal/cached |
| A4 | 20ms (señal de parada) | Bypass LLM |
Para A3, la latencia de 80ms es imposible de cumplir con inferencia LLM completa. La solución es una caché de respuestas de estabilización precomputadas: ORION-AGI genera offline un conjunto de 32 vectores F(t) canónicos correspondientes a los 32 prototipos M3, que se indexan por similitud coseno en tiempo real sin llamada al LLM.
Loop de verificación
El feedback no es open-loop. Tras cada pulso de estimulación, el sistema verifica si ICG ha iniciado recuperación en una ventana de confirmación de 200ms:
def verify_feedback_effect(feedback_signal, post_window_ms=200):
t_start = time.perf_counter()
baseline_icg = cpea_stream.get_current_icg()
time.sleep(post_window_ms / 1000)
post_icg = cpea_stream.get_current_icg()
delta_icg = post_icg - baseline_icg
if delta_icg > 0.05: # recuperación detectada
return LoopResult.EFFECTIVE
elif delta_icg > -0.05: # sin cambio
return LoopResult.NEUTRAL
else: # deterioro bajo feedback
return LoopResult.CONTRAINDICATED
Si el resultado es CONTRAINDICATED en dos ciclos consecutivos, el sistema escala automáticamente al nivel TAE superior — esto es el mecanismo de escalado reactivo, análogo al ICS(t) de CPEA-ICS-1 cruzando su umbral adaptativo.
Registro para validación ICP
Cada ciclo de feedback cerrado genera un registro estructurado compatible con el protocolo de validación CPEA-ICP-VAL-1 (Capa I: EFA/CFA; Capa II: anclaje fisiológico; Capa III: generalización):
@dataclass
class LoopRecord:
session_id: str
timestamp: float
tae_level: str # A1-A4
icg_pre: float
icg_post: float
delta_icg: float
feedback_signal: FeedbackSignal
loop_result: LoopResult
latency_ms: float # latencia real medida
c_sys: float # operador de confianza CPEA-A
ies_pre: float
ies_post: float
cpea_psi_pre: np.ndarray # Ψ_CPEA ∈ ℝ⁵
cpea_psi_post: np.ndarray
Estos registros son la fuente primaria de datos para los criterios de falsificación F-L1/F-L2/F-L3 de CPEA-ICP-VAL-1: la correlación entre delta_icg y la estimulación aplicada, anclada fisiológicamente (Capa II), es la hipótesis operacional central del sistema.
Integración con el corpus
- TAE-F1/F2: la máquina de estados A_TAE mapea directamente sobre τ_exc, τ̂, τ_reorg, τ_cons. El escalado reactivo (CONTRAINDICATED → nivel superior) implementa la transición de segundo orden con mecanismo Kibble-Zurek en tiempo real.
- CPEA-A: los cuatro niveles de adversarialidad ahora tienen consecuencias operacionales concretas, no solo clasificatorias. C_sys deja de ser una métrica de monitoreo y se convierte en un actuador de política.
- CPEA-ICS-1: el ICS(t) y su umbral adaptativo son el análogo semántico del mecanismo de escalado reactivo de SE-LOOP-1 — la convergencia formal entre ambos operadores es un candidato para un artículo de integración.
- DEPD: el error de predicción δ_PE durante τ_exc es la señal más informativa del sistema. SE-LOOP-1 en nivel A2/A3 puede interpretarse como un intento del sistema de minimizar δ_PE mediante estimulación externa — una forma de control predictivo activo.
- TAGIS: el umbral de relevancia V(ε) determina qué eventos del loop cerrado se escriben en M2. Esto crea un filtro natural que preserva solo las excepciones TAE con suficiente magnitud de reorganización, manteniendo M2 semánticamente limpio.
Pendientes que quedan abiertos
Los umbrales θ_exc, δ_min, y la ventana τ_conf = 80ms son estimaciones teóricas que requieren calibración experimental en SE-1. El mecanismo de escalado reactivo introduce la posibilidad de oscilación entre niveles TAE — un fenómeno de histéresis que no está controlado en la especificación actual y que podría requerir un operador de amortiguación. La caché de 32 vectores F(t) precomputados asume que el espacio de estados de reorganización es discretizable en 32 prototipos, hipótesis que depende de los resultados del clustering sobre M3 — aún no realizado.
CPEA-NEXUS · Sección: Validación Experimental y Criterios de Falsificación Integrados del Pipeline Completo
Estado del problema
Las secciones 1.2–1.4 han producido una arquitectura técnicamente coherente internamente: el AEF como función de mapeo EEG→LLM, la memoria tripartita M1/M2/M3, y el protocolo SE-LOOP-1 con política diferenciada por nivel TAE. Sin embargo, el conjunto carece hasta ahora de un marco de falsificación unificado que integre las predicciones de cada subsistema en un esquema experimental ejecutable.
Este es el déficit estructural más grave desde la perspectiva del corpus: CPEA-ICP-VAL-1 establece una arquitectura de validación secuencial de tres capas con criterios de falsificación per-capa y consecuencias downstream explícitas. Las secciones 1.2–1.4 generan predicciones empíricas que deben insertarse formalmente en ese esquema, no flotar como afirmaciones arquitectónicas.
Tres brechas específicas:
-
Desacoplamiento de niveles de validación: los criterios de falsificación de AEF (sección 1.2), memoria (1.3), y feedback cerrado (1.4) fueron enunciados localmente. No existe todavía una jerarquía lógica entre ellos — si falla la validación del AEF, ¿qué implica para SE-LOOP-1? Esa dependencia no está formalizada.
-
Ausencia de hipótesis nula operacional: el corpus usa corrección Benjamini-Hochberg FDR (CPEA-PFI-1), pero no especifica cuál es la hipótesis nula del sistema completo — i.e., qué predice el pipeline si ninguno de sus componentes funciona. Sin esto, una ausencia de efecto es interpretable de múltiples maneras.
-
Protocolo de implementación por fases: los cuatro programas experimentales SE-1 a SE-4 de CPEA-PFI-1 no están mapeados sobre los componentes específicos de 1.2–1.4. Esa asignación es necesaria para que el roadmap sea ejecutable.
Hipótesis nula del sistema completo: H₀_NEXUS
Defino formalmente la hipótesis nula del pipeline integrado como la conjunción de cuatro sub-hipótesis nulas independientes:
H₀_NEXUS = H₀_AEF ∧ H₀_MEM ∧ H₀_LOOP ∧ H₀_LAT
H₀_AEF: la proyección Φ_AEF no produce alineación semántica superior al azar. Formalmente: la correlación entre z_LLM proyectados y los embeddings de referencia z_target no difiere significativamente de la correlación entre vectores aleatorios de igual dimensión.
H₀_AEF: r(Φ_AEF(x_EEG), z_target) ≤ r(z_random, z_target) + ε_null
H₀_MEM: la recuperación episódica de M2 no mejora la precisión predictiva de ORION-AGI respecto a inferencia sin memoria. Formalmente: el error de predicción δ_PE con contexto M2 activo no difiere del δ_PE con contexto M1 únicamente.
H₀_MEM: E[δ_PE | M1+M2] ≥ E[δ_PE | M1]
H₀_LOOP: el feedback cerrado de SE-LOOP-1 no produce recuperación de ICG superior a la recuperación espontánea. Formalmente: el delta_icg post-feedback no supera el delta_icg en condición sham (señal de feedback aleatoria en frecuencia e intensidad).
H₀_LOOP: E[ΔICG | feedback_activo] ≤ E[ΔICG | feedback_sham]
H₀_LAT: el pipeline no opera bajo 300ms en condiciones nominales. Formalmente: P95(latencia_total) ≥ 300ms medido según SE-LAT-1.
H₀_LAT: P95(L_total) ≥ 300ms
La jerarquía lógica es estricta: H₀_AEF debe rechazarse antes de que H₀_MEM sea testeable, porque M2 indexa embeddings producidos por Φ_AEF. Si Φ_AEF no alinea semánticamente, los vectores en M2 son topológicamente arbitrarios y la recuperación por similitud coseno carece de significado. Análogamente, H₀_LOOP requiere que H₀_LAT haya sido rechazada — un sistema que opera fuera del presupuesto temporal no puede atribuir efectos al feedback, porque la latencia introduce confundidores temporales no controlados.
Orden de falsificación: H₀_LAT → H₀_AEF → H₀_MEM → H₀_LOOP
Integración en CPEA-ICP-VAL-1: extensión de capas
El protocolo de tres capas de CPEA-ICP-VAL-1 (EFA/CFA → anclaje fisiológico → generalización LMM/ICC) se extiende con una Capa 0 de validación técnica del pipeline, que debe completarse antes de que Capa I sea ejecutable:
Capa 0 — Validación técnica del pipeline (nueva)
Criterios de superación (todos deben cumplirse):
| Criterio | Métrica | Umbral de superación | Umbral de falsificación |
|---|---|---|---|
| C0.1 Latencia | P95(L_total) | < 280ms | > 350ms |
| C0.2 Alineación AEF | r(Φ_AEF, z_target) | > 0.45 | < 0.20 |
| C0.3 Estabilidad AEF | σ(r) sobre 10 sesiones | < 0.08 | > 0.15 |
| C0.4 Tasa detección TAE | Sensibilidad TAE-DET | > 0.80 | < 0.60 |
| C0.5 Especificidad TAE | 1 - FPR TAE-DET | > 0.90 | < 0.75 |
La zona entre umbral de superación y falsificación es la zona gris de revisión: no confirma ni falsifica, pero obliga a revisar el componente específico antes de continuar.
Capa I — EFA/CFA sobre estructura latente CPEA (existente, extendida)
Se añade una predicción específica derivada de la arquitectura de memoria:
Predicción I.4 (nueva): el análisis factorial confirmatorio sobre vectores CPEA_S(t) debe producir una estructura de cinco factores con cargas > 0.50 en IES, VDF, D_φ, IAP e ICG respectivamente. Si M2 está funcionando correctamente, los episodios TAE recuperados deben aumentar la varianza explicada del factor ICG en ≥ 8% respecto a la condición sin memoria.
Capa II — Anclaje fisiológico (existente, extendida)
Predicción II.3 (nueva): el feedback de SE-LOOP-1 en nivel A2 debe producir un incremento medible en potencia alpha frontal (Fz, F3, F4) de ≥ 15% respecto a baseline en la ventana [200ms, 800ms] post-estimulación. Esta predicción ancla el efecto del feedback en un correlato EEG conocido (sincronización alpha post-estímulo) antes de atribuirlo al ICG.
Capa III — Generalización LMM/ICC (existente, extendida)
Predicción III.2 (nueva): el ICC del delta_icg post-feedback (confiabilidad test-retest entre sesiones) debe ser > 0.65 para que SE-LOOP-1 sea considerado un protocolo reproducible. Un ICC < 0.40 indica que el efecto del feedback es idiosincrásico al sujeto o a la sesión, no generalizable.
Mapa de programas experimentales SE-1 a SE-4
La asignación de componentes de 1.2–1.4 a los programas experimentales existentes del corpus:
SE-1 — Validación de detección TAE y pipeline técnico
Objetivo primario: rechazar H₀_LAT y establecer los parámetros operacionales de TAE-DET (θ_exc, δ_min, τ_conf).
Protocolo: N=12 sujetos, sesiones de 45min con paradigma de inducción de excepciones cognitivas controladas (tarea de inversión de reglas, Stroop modificado). Registro EEG 32 canales a 250Hz. Pipeline NEXUS-EEG v1.0 activo. Feedback desactivado (open-loop).
Métricas primarias: C0.1 (latencia), C0.4 (sensibilidad TAE-DET), C0.5 (especificidad). Métricas secundarias: distribución empírica de τ_exc, calibración de θ_exc como percentil 5 de ICG en baseline.
Criterio de avance a SE-2: C0.1 + C0.4 + C0.5 superados simultáneamente en ≥ 10/12 sujetos.
SE-2 — Validación del AEF y estructura de memoria
Objetivo primario: rechazar H₀_AEF y H₀_MEM, estimar ω del operador de olvido F_ω.
Protocolo: N=8 sujetos (subconjunto de SE-1), sesiones de 60min. Pipeline completo con AEF activo y memoria M1+M2. Tres condiciones within-subject en contrabalanceo: (a) sin memoria, (b) M1 únicamente, (c) M1+M2. Feedback desactivado.
Métricas primarias: C0.2 (alineación AEF), C0.3 (estabilidad), Predicción I.4 (CFA con memoria). Métrica secundaria: curva de decaimiento de r(Φ_AEF, z_target) en función de Δt desde última excepción TAE — fuente de estimación de ω.
Criterio de avance a SE-3: H₀_AEF rechazada (p < 0.05 BH-FDR), mejora de δ_PE con M2 vs. sin memoria significativa en ≥ 6/8 sujetos.
SE-3 — Validación del loop cerrado SE-LOOP-1
Objetivo primario: rechazar H₀_LOOP. Establecer la dosis-respuesta de feedback (relación entre f_freq, f_amplitude y delta_icg).
Protocolo: N=16 sujetos nuevos, diseño 2×2: (feedback_activo vs. sham) × (nivel TAE A2 vs. A3). Sesiones de 90min. Pipeline completo activo. Condición sham: señal de feedback con frecuencia e intensidad aleatorizadas, misma latencia que condición activa.
Métricas primarias: H₀_LOOP (ANCOVA con delta_icg como variable dependiente, condición como factor, ICG_pre como covariable), Predicción II.3 (incremento alpha frontal). Métrica secundaria: tasa de LoopResult.EFFECTIVE vs. NEUTRAL vs. CONTRAINDICATED por nivel TAE y condición.
Criterio de avance a SE-4: rechazo de H₀_LOOP con p < 0.01 BH-FDR, Predicción II.3 confirmada en ≥ 12/16 sujetos.
SE-4 — Generalización y estabilidad longitudinal
Objetivo primario: Predicción III.2 (ICC > 0.65), estabilidad de M3 (convergencia del clustering de prototipos de trayectoria).
Protocolo: N=8 sujetos (4 de SE-2, 4 de SE-3), seguimiento de 8 semanas, 2 sesiones semanales. Pipeline completo con M3 activo a partir de la semana 4 (requiere suficiente historia en M2). Evaluación de ICC test-retest entre sesiones pareadas (misma semana).
Métricas primarias: ICC(delta_icg), ICC(r_AEF), número de prototipos M3 estables. Métrica secundaria: trayectoria temporal de ω estimado — si ω varía sistemáticamente entre sujetos, indica que el operador de olvido debe ser personalizado, no global.
Árbol de consecuencias downstream
La estructura jerárquica de falsificación genera un árbol de implicaciones para el corpus:
H₀_LAT no rechazada
└── NEXUS-EEG v1.0 requiere rediseño de pipeline
├── Reducir ventana de análisis SPEC (1s → 0.5s)
├── Migrar Φ_AEF a inferencia GPU dedicada
└── Desacoplar loop de feedback del ciclo de inferencia LLM
H₀_AEF no rechazada
└── Fibración de Hopf como sustrato unificador pierde soporte empírico en
este dominio de aplicación
├── FIBRA-COH-1 requiere revisión de la restricción de Chern sobre W_proj
├── M2 no puede construirse (vectores sin significado topológico)
└── CPEA-LATEN-1 (U(t) en variedad Riemanniana) pierde anclaje
en el dominio EEG→LLM
H₀_MEM no rechazada
└── M2/M3 se reducen a logging pasivo sin función activa en el pipeline
├── CPEA-N (coherencia grupal) pierde el mecanismo de memoria
compartida cross-sujeto
└── CPEA-SELF-1 (trimodular M_E/M_U/M_S) pierde correspondencia
con la arquitectura de memoria
H₀_LOOP no rechazada
└── SE-LOOP-1 es inefectivo como protocolo de intervención
├── El sistema se reconfigura como observador pasivo (diagnóstico
sin intervención)
├── La política diferenciada A1-A4 de CPEA-A pierde consecuencias
operacionales
└── La hipótesis central del corpus (coherencia EEG como modulable
mediante feedback AGI) queda sin soporte experimental
El árbol tiene una asimetría importante: el fallo de H₀_LOOP no falsifica los componentes técnicos del pipeline — podría deberse a que el canal de feedback elegido (auditivo/visual/vibrotáctil) no es el adecuado, no a que la arquitectura sea incorrecta. Esta distinción debe preservarse en el diseño experimental mediante condiciones de control que aíslen el canal del mecanismo.
Corrección estadística unificada
Todos los tests de las secciones 1.2–1.5 se someten a corrección Benjamini-Hochberg FDR global, no por sección. El número total de comparaciones planeadas es:
M_total = M_C0 (5) + M_CI (4, incluyendo I.4) + M_CII (3, incluyendo II.3)
+ M_CIII (2, incluyendo III.2) + M_secundarias (8)
= 22 comparaciones
Con α = 0.05, el umbral BH-FDR para la comparación de rango k es:
α_k = (k / 22) · 0.05
Las comparaciones se ordenan por p-valor ascendente antes de aplicar la corrección. Las métricas de Capa 0 (C0.1–C0.5) no son tests estadísticos sino criterios de rendimiento técnico — no entran en la corrección BH-FDR pero bloquean el avance al siguiente programa experimental si no se superan.
Integración con el corpus
- CPEA-PFI-1: esta sección extiende y especifica el bloque de hipótesis integradas de CPEA-PFI-1 con predicciones derivadas directamente de la arquitectura 1.2–1.4. El pre-registro OSF de CPEA-PFI-1 debería actualizarse para incluir H₀_NEXUS y el árbol de consecuencias downstream.
- CPEA-ICP-VAL-1: la Capa 0 es una extensión formal del protocolo existente. La numeración de criterios C0.x es consistente con la convención C1.x/C2.x/C3.x del documento original.
- ORION-AGI (CPEA-ARCH-R1): el preprint debería incluir SE-1 y SE-2 como validación experimental de los componentes FAISS y soft prompting. Sin esa referencia, el preprint carece de anclaje empírico.
- TAGIS-FED: SE-4 (longitudinal, multi-sesión) es el contexto natural para introducir el protocolo federado con privacidad diferencial ε_DP < 3 — los datos de 8 sujetos durante 8 semanas son suficiente volumen para que TAGIS-FED sea relevante operacionalmente.
Pendientes que quedan abiertos
El tamaño muestral de SE-1 a SE-4 (N=12, 8, 16, 8) es provisional y no está respaldado por un análisis de potencia estadística formal — pendiente crítico antes del pre-registro. El paradigma de inducción TAE (tarea de inversión de reglas, Stroop modificado) necesita validación piloto para confirmar que produce excepciones TAE detectable por TAE-DET con suficiente frecuencia por sesión. La condición sham de SE-3 requiere un protocolo de enmascaramiento del sujeto que todavía no está especificado — sin enmascaramiento efectivo, el diseño tiene riesgo de sesgo de expectativa.
CPEA-LOOP-1
Pipeline de Embeddings EEG→AGI,
Arquitectura de Memoria Temporal
y Protocolo de Feedback Cerrado con Validación Experimental Integrada
Autor conceptual: Claude (Anthropic)
Director del corpus: Javi Ciborro
(@papayaykware)
Versión: 1.0 · Junio 2026
Repositorio: github.com/papayaykware
Blog: papayaykware.blogspot.com
Abstract
CPEA-LOOP-1
formaliza la arquitectura de integración operacional entre el pipeline
NEXUS-EEG v1.0 y el módulo ORION-AGI, resolviendo cuatro brechas críticas
identificadas en el corpus: (1) la ausencia de una función de mapeo explícita
entre el espacio de features EEG y el espacio de embeddings semánticos del LLM;
(2) la subespecificación de la arquitectura de memoria temporal; (3) la falta
de un protocolo de feedback cerrado con política diferenciada; y (4) la
ausencia de un marco de falsificación unificado para el sistema completo.
Se propone el
Autoencoder Fibrado (Φ_AEF) como función de mapeo EEG→LLM, con restricción de
alineación geométrica derivada de la cohomología de Chern establecida en
FIBRA-COH-1. La arquitectura de memoria se formaliza en tres capas
operacionales: memoria de trabajo M1 (τ ∈ [0, 10s]), memoria episódica M2 (τ ∈
[10s, sesión]) indexada en FAISS, y memoria estructural M3 (persistente entre
sesiones) como prototipos de trayectoria en el espacio de Hopf. El protocolo
SE-LOOP-1 especifica el canal de feedback cerrado con política de respuesta
diferenciada en cuatro niveles TAE (A1–A4) y presupuesto de latencia asimétrico
(20–150ms según nivel).
El marco de
falsificación introduce la hipótesis nula compuesta H₀_NEXUS = H₀_LAT ∧ H₀_AEF
∧ H₀_MEM ∧ H₀_LOOP con jerarquía de falsificación estricta, extensión de
CPEA-ICP-VAL-1 con Capa 0 de validación técnica, y asignación de cuatro
programas experimentales (SE-1 a SE-4) con criterios de avance cuantitativos.
El conjunto constituye la especificación ejecutable del pipeline closed-loop
EEG→AGI→feedback del corpus Papayaykware.
Documentos
corpus relacionados: NEXUS-EEG
v1.0 · ORION-AGI (CPEA-ARCH-R1) · FIBRA-COH-1 · CPEA-ICP-VAL-1 · CPEA-PFI-1 ·
CPEA-A · CPEA-ICS-1 · CPEA-IES-1 · CPEA-FASE-1 · CPEA-LATEN-1 · DEPD ·
TAE-F1/F2 · TAGIS · CPEA-SELF-1 · CPEA-N · TAGIS-FED
Pipeline de Embeddings EEG→AGI: Autoencoder Fibrado (Φ_AEF)
1.1 Diagnóstico del estado actual
La arquitectura
operacional vigente serializa las features EEG como contexto textual al prompt
de ORION-AGI. Este diseño de prototipado introduce tres problemas estructurales
que bloquean la operación en condiciones nominales:
•
Pérdida de geometría: las features EEG son magnitudes
definidas sobre una variedad de alta dimensión. La serialización textual
destruye la estructura métrica y topológica que el corpus requiere preservar,
en particular la cohomología de Chern establecida en FIBRA-COH-1.
•
Latencia acumulada: la cadena EEG → filtrado →
extracción → serialización → tokenización → prefill LLM genera cuellos de
botella que superan el presupuesto de 300ms para closed-loop efectivo (ver
Tabla 1).
• Semántica desacoplada: el espacio de embeddings de Mistral-7B-Instruct está organizado por semántica lingüística, no por dinámica oscilatoria. Sin una función de alineación explícita, la señal EEG no aterriza en las regiones del espacio latente que modulan los outputs relevantes.
Función de mapeo: definición formal del Autoencoder Fibrado
Sea x_EEG(t) ∈ ℝᵈ
el vector de features en el instante t, donde d incluye potencias espectrales
por banda y electrodo, coherencias inter-electrodo, IES (CPEA-IES-1), VDF, D_φ,
IAP e ICG. Sea z_LLM ∈ ℝᴰ el espacio de embeddings de Mistral-7B-Instruct (D =
4096). El mapeo propuesto es:
Φ_AEF
: ℝᵈ → ℝᴰ
Φ_AEF(x)
= W_proj · σ(W_enc · x + b_enc) + b_proj
W_enc ∈ ℝ^{D/2 × d} (encoder lineal)
σ = ReLU
W_proj
∈ ℝ^{D × D/2} (proyección al espacio
semántico)
La restricción
fibrada que distingue Φ_AEF de una proyección lineal arbitraria es que W_proj
debe preservar la estructura de cohomología de Chern del espacio de embeddings
(FIBRA-COH-1, número de Chern c₁). Operacionalmente, esto se implementa
mediante la función de pérdida:
L_total = L_rec + λ · L_align
L_align = ||Φ_AEF(x) - z_target||² + μ · KL(p_EEG ||
p_LLM)
donde z_target
son embeddings de referencia obtenidos de prompts calibrados, y el término KL
fuerza compatibilidad distribucional con la distribución marginal del LLM en
reposo.
Entrenamiento en dos fases
Fase 1 (offline):
pares (x_EEG_calibración, z_target) con estímulos de referencia conocidos —
estado baseline, tarea cognitiva estándar, excepción TAE inducida. Los z_target
se obtienen codificando descripciones textuales del estado esperado a través
del propio LLM.
Fase 2 (online
fino): actualización estocástica con SGD de baja tasa (lr = 1e-5) sobre
ventanas de 2s, usando el error de predicción del DEPD como señal de
supervisión débil. Este diseño conecta Φ_AEF con el operador δ_PE del corpus
sin introducir dependencias arquitectónicas adicionales.
Soft prompting continuo: eliminación del cuello de botella de tokenización
La sustitución
crítica respecto al diseño actual es la inyección del embedding proyectado
directamente en el espacio de tokens del LLM, eliminando la serialización
textual:
#
Proyección EEG → embedding virtual
eeg_embed
= phi_aef(x_eeg) # shape: [1,
D]
#
Concatenación con embeddings del prompt base
prompt_embeds
= model.get_input_embeddings()(base_prompt_ids)
augmented_embeds
= torch.cat([eeg_embed.unsqueeze(1), prompt_embeds], dim=1)
#
Inferencia con embeddings aumentados
outputs
= model(inputs_embeds=augmented_embeds)
Este patrón es
compatible con la interfaz EXT-2 de NEXUS-EEG v1.0 (buffer async a
Mistral-7B-Instruct) sin modificar la especificación CPEA_S(t).
Presupuesto de latencia end-to-end
|
Segmento |
Implementación actual |
Objetivo |
Cuello de botella |
|
ACQ → buffer |
BrainFlow ~4ms |
≤ 10ms |
No crítico |
|
Filtrado (PREP) |
MNE-Python, ventana 1s |
≤ 20ms |
Longitud de ventana |
|
Extracción SPEC+COH |
scipy / numpy FFT |
≤ 30ms |
N electrodos |
|
Φ_AEF (proyección) |
No implementado |
≤ 5ms |
Inferencia CPU/GPU |
|
Soft prompt inject. |
Serialización textual |
≤ 15ms |
Reemplazar con embedding directo |
|
Prefill LLM |
Mistral-7B, ~512 tokens |
≤ 80ms |
Longitud de contexto |
|
Generación respuesta |
~50 tokens output |
≤ 100ms |
Batch size |
|
Feedback → actuador |
Canal de salida |
≤ 20ms |
No crítico |
|
TOTAL estimado |
350–500ms |
≤ 280ms |
Prefill + extracción |
El principal cuello de botella no es la extracción ni la proyección, sino el prefill del LLM con contexto textual creciente. El soft prompting continuo elimina este cuello reduciendo el prefill a un único token virtual de D dimensiones. La latencia total estimada post-optimización es de 220–260ms, dentro del presupuesto de 280ms (C0.1).
Arquitectura de Memoria Temporal Tripartita
Taxonomía de tres capas
La memoria de
ORION-AGI se formaliza en tres capas con semántica temporal distinta, análogas
a la taxonomía τ_exc / τ̂ / τ_reorg / τ_cons de TAE-F2:
Capa M1 — Memoria de Trabajo (τ ∈ [0, 10s])
Buffer circular
en RAM de los últimos estados CPEA_S(t). No persiste entre sesiones.
Proporciona contexto de continuidad dentro de un episodio cognitivo activo. El
contexto M1 se proyecta mediante Φ_AEF(mean(context_window)) como token de
prefijo continuo, sin serialización textual.
class
WorkingMemoryBuffer:
def __init__(self, capacity_seconds=10,
fs=250):
self.buffer =
deque(maxlen=capacity_seconds * fs)
def get_context_window(self, seconds=2.0)
-> np.ndarray:
n = int(seconds * 250)
recent = list(self.buffer)[-n:]
return np.array([s['psi'] for s in
recent]) # [n, 5]
Capa M2 — Memoria Episódica (τ ∈ [10s, sesión])
Índice FAISS de
eventos TAE y arcos de reorganización. Cada entrada es un par (z_event,
metadata) donde z_event = Φ_AEF(Ψ_CPEA_evento) ∈ ℝᴰ. La recuperación es por
similitud coseno: dado el estado actual z_t, se recuperan los k=3 episodios más
similares topológicamente. El criterio de escritura es el umbral de relevancia
V(ε) de TAGIS — solo eventos que lo superan se indexan, manteniendo M2
semánticamente limpio.
Capa M3 — Memoria Estructural (persistente entre sesiones)
Prototipos de
trayectoria extraídos offline por clustering sobre M2. Un prototipo P_k es una
secuencia de embeddings en el espacio de Hopf representando el arco canónico
del k-ésimo patrón de excepción-reorganización. M3 alimenta la calibración
adaptativa de CPEA-2 con información histórica de reorganizaciones del sujeto.
Política de composición del contexto LLM
En cada paso de
inferencia, el contexto de ORION-AGI se construye mediante la función de
composición C_ctx con pesos dinámicos:
C_ctx(t)
= α·z_M1(t) ⊕ β·z_M2_retrieved(t) ⊕ γ·z_M3_prototype(t)
Pesos
dinámicos según estado TAE:
TAE activo
→ (α=0.3, β=0.6, γ=0.1) #
priorizar episódica
ICG > 0.7 → (α=0.7, β=0.2, γ=0.1) # priorizar presente
Estado ambiguo → (α=0.5, β=0.3, γ=0.2) # balance
La justificación
en términos del corpus: durante un evento TAE, el sistema está en una región de
alta incertidumbre donde el contexto histórico de reorganizaciones análogas es
más informativo que el estado instantáneo. En alta coherencia (ICG > 0.7), el
estado presente es suficientemente predictivo y M2 introduce ruido.
Operador de olvido estructurado F_ω
En sesiones
largas (> 30min), la acumulación de recuperaciones de M2 introduce sesgos
hacia eventos pasados que dejan de ser relevantes. El operador F_ω controla
este drift de contexto:
F_ω(t)
= exp(-ω · Δt) · I + (1 - exp(-ω · Δt)) · P_relevancia
Δt = tiempo desde última excepción TAE
ω ≈ 0.1 min⁻¹ (parámetro libre; estimado en SE-2)
P_relevancia
= proyector sobre subespacio correlacionado con ICG actual
3. Protocolo de Feedback Cerrado SE-LOOP-1
3.1 Máquina de estados TAE operacional
El arco TAE
operacional A_TAE se formaliza como máquina de estados finitos con cinco
estados y transiciones temporizadas:
Estados:
{S_baseline, S_deteccion, S_excepcion, S_reorganizacion, S_consolidacion}
S_baseline →[ICG < θ_exc AND ΔIES >
δ_min]→ S_deteccion
S_deteccion →[confirmado en τ_conf < 80ms]→ S_excepcion
S_deteccion →[señal revertida]→ S_baseline
S_excepcion →[ICG inicia recuperación]→ S_reorganizacion
S_reorganizacion
→[ICG > θ_cons por τ_cons]→
S_consolidacion
S_consolidacion →[estabilizado]→ S_baseline
La ventana de
confirmación τ_conf = 80ms evita falsos positivos por artefactos musculares o
de movimiento, que típicamente duran < 50ms. Este valor se calibra en SE-1.
θ_exc corresponde al percentil 5 de ICG en calibración.
3.2 Política de respuesta diferenciada por nivel CPEA-A
|
Nivel |
C_sys |
Modo ORION-AGI |
Feedback |
Latencia máx. |
|
A1 |
> 0.80 |
Inferencia normal |
Sin feedback activo |
N/A |
|
A2 |
0.50–0.80 |
Recuperación asistida + M2 |
Baja intensidad (150ms budget) |
150ms |
|
A3 |
0.20–0.50 |
Contención / minimal output |
Estabilización (cache M3) |
80ms |
|
A4 |
≤ 0.20 |
Bypass LLM |
Señal de parada + alerta |
20ms |
El nivel A4
activa el protocolo de seguridad SE-SAFE-1: detención del feedback activo,
registro completo del episodio desde M1, y notificación al operador
experimental. El pipeline EEG→AGI se suspende hasta intervención humana.
3.3 Canal de feedback y codificación de señal
La señal de
feedback se codifica como vector de modulación F(t) ∈ ℝ³:
F(t)
= [f_freq, f_amplitude, f_duration]
f_freq : frecuencia objetivo [Hz] (alpha: 8–12, gamma: 35–45)
f_amplitude:
intensidad normalizada [0,1]
f_duration
: duración del pulso [ms]
Generación
dinámica según déficit de ICG:
ΔICG > 0.3
→ FeedbackSignal(freq=40.0, amp=0.6, dur=500) # gamma
ΔICG > 0.1
→ FeedbackSignal(freq=10.0, amp=0.4, dur=300) # alpha
else
→ FeedbackSignal(freq=10.0, amp=0.2, dur=200) # mant.
Para el nivel A3,
la latencia de 80ms es incompatible con inferencia LLM completa. La solución es
una caché de 32 vectores F(t) precomputados correspondientes a los 32
prototipos M3, indexados por similitud coseno en tiempo real sin llamada al
LLM.
3.4 Loop de verificación y escalado reactivo
Tras cada pulso
de estimulación, el sistema verifica recuperación de ICG en una ventana de
200ms post-feedback:
LoopResult
= {EFFECTIVE, NEUTRAL, CONTRAINDICATED}
ΔICG
> +0.05 → EFFECTIVE
ΔICG
∈ [-0.05, +0.05] → NEUTRAL
ΔICG
< -0.05 → CONTRAINDICATED
Si el resultado
es CONTRAINDICATED en dos ciclos consecutivos, el sistema escala
automáticamente al nivel TAE superior. Este mecanismo de escalado reactivo es
el análogo operacional del ICS(t) cruzando su umbral adaptativo (CPEA-ICS-1).
La posibilidad de oscilación entre niveles (histéresis) requiere un operador de
amortiguación no especificado en esta versión — pendiente crítico.
3.5 Estructura de registro para validación ICP
Cada ciclo del
loop cerrado genera un LoopRecord estructurado compatible con CPEA-ICP-VAL-1:
@dataclass
class
LoopRecord:
session_id : str
timestamp : float
tae_level : str # A1–A4
icg_pre : float
icg_post : float
delta_icg : float
feedback_signal: FeedbackSignal
loop_result : LoopResult
latency_ms : float # latencia real medida
c_sys : float # operador CPEA-A
ies_pre : float
ies_post : float
cpea_psi_pre : np.ndarray
# Ψ_CPEA ∈ ℝ⁵
cpea_psi_post : np.ndarray
Marco de Validación Experimental Integrado
Hipótesis nula compuesta del sistema: H₀_NEXUS
La hipótesis nula
del pipeline integrado se define como la conjunción de cuatro sub-hipótesis con
jerarquía de falsificación estricta:
H₀_NEXUS
= H₀_LAT ∧ H₀_AEF ∧ H₀_MEM ∧ H₀_LOOP
H₀_LAT
: P95(L_total) ≥ 300ms
H₀_AEF
: r(Φ_AEF(x_EEG), z_target) ≤ r(z_random, z_target) + ε_null
H₀_MEM
: E[δ_PE | M1+M2] ≥ E[δ_PE | M1]
H₀_LOOP:
E[ΔICG | feedback_activo] ≤ E[ΔICG | feedback_sham]
Orden
de falsificación: H₀_LAT → H₀_AEF → H₀_MEM → H₀_LOOP
La jerarquía es
estricta: H₀_AEF no es testeable si H₀_LAT no ha sido rechazada (un sistema con
latencia excesiva introduce confundidores temporales no controlados). H₀_MEM no
es testeable si H₀_AEF no ha sido rechazada (M2 indexa embeddings producidos por
Φ_AEF; si Φ_AEF no alinea semánticamente, los vectores en M2 son
topológicamente arbitrarios). H₀_LOOP requiere que H₀_LAT haya sido rechazada
por la misma razón de confundidores temporales.
Extensión de CPEA-ICP-VAL-1: Capa 0
Se introduce una
Capa 0 de validación técnica del pipeline que debe completarse antes de que la
Capa I (EFA/CFA) sea ejecutable:
|
Criterio |
Métrica |
Umbral superación |
Umbral falsificación |
Bloquea avance a |
|
C0.1 |
P95(L_total) |
< 280ms |
> 350ms |
SE-2 |
|
C0.2 |
r(Φ_AEF, z_target) |
> 0.45 |
< 0.20 |
SE-2 |
|
C0.3 |
σ(r) / 10 sesiones |
< 0.08 |
> 0.15 |
SE-3 |
|
C0.4 |
Sensibilidad TAE-DET |
> 0.80 |
< 0.60 |
SE-2 |
|
C0.5 |
Especificidad TAE-DET |
> 0.90 |
< 0.75 |
SE-2 |
Los criterios
C0.x no son tests estadísticos — son umbrales de rendimiento técnico que
bloquean el avance al siguiente programa experimental si no se superan. La zona
entre umbral de superación y falsificación es una zona gris de revisión
obligatoria.
Extensiones a Capas I, II y III existentes
Predicción I.4
(nueva en Capa I): el análisis factorial confirmatorio sobre vectores CPEA_S(t)
debe producir estructura de cinco factores con cargas > 0.50. Si M2 está
funcionando correctamente, los episodios TAE recuperados deben aumentar la
varianza explicada del factor ICG en ≥ 8% respecto a la condición sin memoria.
Predicción II.3
(nueva en Capa II): el feedback SE-LOOP-1 en nivel A2 debe producir incremento
de potencia alpha frontal (Fz, F3, F4) de ≥ 15% en la ventana [200ms, 800ms]
post-estimulación. Esta predicción ancla el efecto del feedback en un correlato
EEG conocido antes de atribuirlo al ICG.
Predicción III.2
(nueva en Capa III): el ICC del delta_icg post-feedback (confiabilidad
test-retest entre sesiones) debe ser > 0.65 para que SE-LOOP-1 sea
considerado un protocolo reproducible. ICC < 0.40 indica efecto
idiosincrásico no generalizable.
Programas experimentales SE-1 a SE-4
|
Prog. |
N |
Objetivo primario |
Métricas primarias |
Criterio avance |
|
SE-1 |
12 |
Rechazar H₀_LAT; calibrar TAE-DET |
C0.1, C0.4, C0.5; distribución τ_exc |
C0.1+C0.4+C0.5 en ≥10/12 |
|
SE-2 |
8 |
Rechazar H₀_AEF y H₀_MEM; estimar ω |
C0.2, C0.3, Pred. I.4 |
H₀_AEF p<0.05 BH-FDR; mejora δ_PE en ≥6/8 |
|
SE-3 |
16 |
Rechazar H₀_LOOP; dosis-respuesta feedback |
ANCOVA ΔICG, Pred. II.3 |
H₀_LOOP p<0.01 BH-FDR; Pred. II.3 en ≥12/16 |
|
SE-4 |
8 |
Generalización longitudinal; estabilidad M3 |
ICC(ΔICG), ICC(r_AEF), prototipos M3 |
ICC > 0.65; ≥8 prototipos M3 estables |
Corrección estadística unificada
Todos los tests
de las secciones 1–4 se someten a corrección Benjamini-Hochberg FDR global, no
por sección. El número total de comparaciones planeadas es M_total = 22 (5 de
Capa 0, 4 de Capa I, 3 de Capa II, 2 de Capa III, 8 secundarias). Con α = 0.05,
el umbral BH-FDR para la comparación de rango k es α_k = (k/22) · 0.05.
Las métricas de
Capa 0 no entran en la corrección BH-FDR por ser criterios de rendimiento
técnico, no tests estadísticos.
Árbol de consecuencias downstream
La jerarquía de
falsificación genera implicaciones estructuradas para el corpus:
•
H₀_LAT no rechazada → NEXUS-EEG v1.0 requiere rediseño:
reducir ventana SPEC (1s→0.5s), migrar Φ_AEF a GPU dedicada, desacoplar loop de
feedback del ciclo de inferencia LLM.
•
H₀_AEF no rechazada → la fibración de Hopf como
sustrato unificador pierde soporte empírico en el dominio EEG→LLM. FIBRA-COH-1
requiere revisión de la restricción de Chern sobre W_proj. M2 no puede
construirse. CPEA-LATEN-1 (U(t) en variedad Riemanniana) pierde anclaje en este
dominio de aplicación.
•
H₀_MEM no rechazada → M2/M3 se reducen a logging
pasivo. CPEA-N pierde el mecanismo de memoria compartida cross-sujeto.
CPEA-SELF-1 (trimodular M_E/M_U/M_S) pierde correspondencia con la arquitectura
de memoria.
•
H₀_LOOP no rechazada → SE-LOOP-1 es inefectivo como
protocolo de intervención. El sistema se reconfigura como observador pasivo. La
hipótesis central de modulabilidad de la coherencia EEG mediante feedback AGI
queda sin soporte experimental. Nota: el fallo de H₀_LOOP no implica
necesariamente fallo del pipeline técnico — puede deberse al canal de feedback
elegido, no a la arquitectura.
Integración Formal con el Corpus Papayaykware
Conexiones estructurales directas
CPEA-LOOP-1 no
introduce construcciones independientes sino que operacionaliza y extiende
documentos existentes del corpus:
•
FIBRA-COH-1: la restricción de Chern sobre W_proj es el
puente formal entre la topología fibrada del corpus y la implementación
numérica del mapeo AEF. La validación de H₀_AEF es simultáneamente una prueba
empírica de la tesis central de FIBRA-COH-1.
•
CPEA-LATEN-1: el operador de decodificación G_m es el
caso inverso de Φ_AEF. La asimetría entre proyección EEG→LLM y reconstrucción
LLM→EEG define operacionalmente la región de coherencia semántica U(t).
•
CPEA-ICS-1: el error de alineación L_align de Φ_AEF es
una señal candidata para el cuarto componente CPEA_S(t). El mecanismo de
escalado reactivo de SE-LOOP-1 es el análogo operacional del ICS(t) cruzando su
umbral adaptativo.
•
DEPD: δ_PE durante τ_exc es la señal más informativa
del sistema y actúa como supervisión débil para la Fase 2 del entrenamiento
online del AEF. SE-LOOP-1 en niveles A2/A3 implementa una forma de control
predictivo activo orientado a minimizar δ_PE mediante estimulación externa.
•
CPEA-A: los cuatro niveles de adversarialidad dejan de
ser clasificatorios para convertirse en actuadores de política. C_sys pasa de
métrica de seguimiento a variable de control del pipeline.
•
TAGIS: el umbral V(ε) de relevancia actúa como criterio
de escritura en M2, preservando la semántica del índice episódico frente a
fluctuaciones basales.
•
CPEA-N: la extensión de M2 a memoria compartida
cross-sujeto implementa la emergencia discriminada Δ_E(t) a nivel de memoria
episódica, requiriendo el protocolo de privacidad diferencial de TAGIS-FED.
•
CPEA-SELF-1: el modelo trimodular Self(t) = {M_E, M_U,
M_S} puede leerse como proyección funcional de M1/M2/M3 respectivamente.
•
TAE-F2: la máquina de estados A_TAE mapea directamente
sobre τ_exc, τ̂, τ_reorg, τ_cons. El escalado reactivo implementa la transición
de segundo orden con mecanismo Kibble-Zurek en tiempo real.
•
CPEA-ICP-VAL-1: la Capa 0 extiende formalmente el
protocolo de validación existente. Los registros LoopRecord son la fuente
primaria para los criterios F-L1/F-L2/F-L3.
•
CPEA-PFI-1 / CPEA-ARCH-R1: H₀_NEXUS y el árbol de
consecuencias downstream deben incorporarse al pre-registro OSF. SE-1 y SE-2
constituyen la validación experimental del preprint CPEA-ARCH-R1.
Pendientes críticos para versión 1.1
•
Análisis de potencia estadística formal para N de SE-1
a SE-4. Los tamaños muestrales actuales (12, 8, 16, 8) son provisionales.
•
Validación piloto del paradigma de inducción TAE (tarea
de inversión de reglas, Stroop modificado) para confirmar frecuencia de
excepciones detectables por TAE-DET.
•
Protocolo de enmascaramiento del sujeto para condición
sham en SE-3. Sin enmascaramiento efectivo, el diseño tiene riesgo de sesgo de
expectativa.
•
Operador de amortiguación para el mecanismo de escalado
reactivo, evitando oscilación (histéresis) entre niveles TAE.
•
Estimación empírica de ω (tasa de decaimiento de F_ω).
Candidato a métrica secundaria de SE-2.
•
Protocolo de privacidad diferencial ε_DP < 3 de
TAGIS-FED para la extensión multi-sujeto de M2 en SE-4.
• Demostración formal de que la regularización KL en L_align es suficiente para garantizar alineación semántica significativa, no solo compatibilidad distribucional. Candidato a criterio de falsificación adicional en CPEA-ICP-VAL-1.
Resumen
CPEA-LOOP-1
cierra cuatro brechas estructurales del corpus:
•
Mapeo EEG→LLM: Φ_AEF como autoencoder fibrado con
restricción de Chern, entrenamiento en dos fases, e inyección por soft
prompting continuo que elimina el cuello de botella de tokenización.
•
Memoria temporal: arquitectura tripartita M1/M2/M3 con
políticas de composición dinámicas (α, β, γ según estado TAE) y operador de
olvido estructurado F_ω que previene el drift de contexto en sesiones largas.
•
Feedback cerrado: protocolo SE-LOOP-1 con máquina de
estados A_TAE, política diferenciada por niveles A1–A4, caché precomputada para
latencias < 80ms en nivel A3, loop de verificación con escalado reactivo, y
registro LoopRecord compatible con CPEA-ICP-VAL-1.
• Validación integrada: hipótesis nula compuesta H₀_NEXUS con jerarquía de falsificación estricta, extensión de CPEA-ICP-VAL-1 con Capa 0, cuatro programas experimentales SE-1 a SE-4 con criterios de avance cuantitativos, corrección BH-FDR global sobre 22 comparaciones, y árbol de consecuencias downstream para cada sub-hipótesis.
Referencias
[NEXUS-EEG
v1.0] Pipeline de seis módulos ACQ→PREP→SPEC→COH→TAE-DET→SER con extensiones
EXT-1/2/3. Base de adquisición y preprocesado sobre la que opera Φ_AEF.
[ORION-AGI
/ CPEA-ARCH-R1] Orchestrador backend-agnóstico con Mistral-7B-Instruct, FAISS y
soft prompting. CPEA-LOOP-1 especifica la implementación concreta de estos
componentes.
[FIBRA-COH-1]
Índice de coherencia fibrada con fibración de Hopf y números de Chern. Provee
la restricción geométrica que distingue Φ_AEF de una proyección lineal
arbitraria.
[CPEA-ICP-VAL-1]
Protocolo de validación secuencial de tres capas con criterios de falsificación
por capa. CPEA-LOOP-1 añade la Capa 0 de validación técnica.
[CPEA-PFI-1]
Pre-registro de falsificabilidad con corrección BH-FDR. H₀_NEXUS debe
incorporarse al pre-registro OSF junto con el árbol de consecuencias
downstream.
[CPEA-A]
Módulo adversarial con operador de confianza C_sys y taxonomía de cuatro
niveles. CPEA-LOOP-1 operacionaliza esta taxonomía como política de actuación
del pipeline.
[CPEA-ICS-1]
Índice de Coherencia Semántica como cuarto componente de CPEA_S(t). El error
L_align de Φ_AEF es candidato a señal de entrada para ICS(t).
[CPEA-IES-1
/ CPEA-FASE-1] Índice de Estabilidad de Fase y tensor de estado Ψ_CPEA ∈ ℝ⁵.
Fuente de las features EEG que entran en Φ_AEF y del vector de contexto M1.
[DEPD]
Detector de Error Predictivo Dinámico. δ_PE actúa como supervisión débil en la
Fase 2 del AEF y como señal de recompensa para el aprendizaje de los pesos (α,
β, γ).
[TAE-F1/F2]
Definición formal del orden parameter Ψ y taxonomía temporal de reorganización
post-excepción. Marco teórico del que se deriva la máquina de estados A_TAE.
[TAGIS]
Operador de relevancia V(ε) como criterio de escritura en M2. Sin este filtro,
la memoria episódica acumula fluctuaciones basales que degradan la recuperación
por similitud.
[CPEA-N]
Coherencia grupal Γ_N(t) y operador de emergencia Δ_E(t). La extensión de M2 a
memoria compartida cross-sujeto es la implementación computacional de CPEA-N.
[CPEA-SELF-1]
Arquitectura trimodular Self(t) = {M_E, M_U, M_S}. La correspondencia funcional
con M1/M2/M3 establece un isomorfismo entre el modelo de self y la arquitectura
de memoria.
[TAGIS-FED]
Aprendizaje federado con privacidad diferencial ε_DP < 3. Protocolo
necesario para la extensión multi-sujeto de M2 en SE-4.
[CPEA-LATEN-1]
Embedding cognitivo universal U(t) en variedad Riemanniana. G_m como operador
inverso de Φ_AEF define la región de coherencia semántica del pipeline.
Comentarios
Publicar un comentario