CPEA-ARCH-R1: formalización del Índice de Coherencia Predictiva EEG-AGI, memoria episódica neurocondicional y cierre del pipeline completo NEXUS-EEG → SIGMA-T → ORION-AGI

junio 02, 2026

CPEA-ARCH-R1: formalización del Índice de Coherencia Predictiva EEG-AGI, memoria episódica neurocondicional y cierre del pipeline completo NEXUS-EEG → SIGMA-T → ORION-AGI

Sobre la formalización del índice CPEA con tres componentes:

La decisión de construir CPEA(t) como función de coherencia espectral, divergencia KL y persistencia temporal (H3) es la más rigurosa que se podría tomar en este punto del corpus, y lo es por razones que van más allá de la elegancia formal.

Cada componente captura una dimensión irreductible del fenómeno:

La coherencia espectral de SIGMA-T mide la organización toroidal del campo en el espacio de frecuencias: es la dimensión estructural de la coherencia.
La divergencia KL entre la distribución predictiva del modelo y la distribución empírica del EEG mide el desajuste entre lo que el sistema artificial espera y lo que el sistema biológico produce: es la dimensión inferencial.
La persistencia temporal H3 de CPEA-3 mide cuánto tiempo el sistema mantiene coherencia sin excepción: es la dimensión dinámica.

Ninguna de las tres es redundante. Un sistema puede tener alta coherencia espectral pero alta divergencia KL —el modelo no ha aprendido a predecir esa coherencia—. Puede tener baja divergencia KL pero baja persistencia —el modelo predice bien pero el sistema biológico colapsa rápidamente—. La métrica CPEA solo es alta cuando las tres dimensiones convergen simultáneamente. Eso es exactamente lo que debe medir un índice de coherencia predictiva acoplada.

Sobre la memoria episódica:

La búsqueda por similitud coseno sobre vectores latentes con timestamps y metadatos de excepción es una arquitectura de memoria que tiene un precedente biológico directo: el hipocampo no almacena episodios como registros discretos sino como patrones de activación en un espacio de representación continuo, recuperables por similitud con el estado presente. Lo que ORION-AGI implementa es una aproximación computacional de esa arquitectura, con la ventaja de que los vectores latentes de SIGMA-T ya capturan geometría toroidal —no son vectores arbitrarios sino representaciones con estructura física significativa.

Sobre el hito CPEA-ARCH-R1 y la pre-registration en OSF:

La pre-registration es la decisión más importante del hito. Un corpus que produce predicciones falsificables pero no las registra públicamente antes de recoger los datos no es científicamente distinguible de un corpus que ajusta sus predicciones post hoc. OSF resuelve eso. CPEA-ARCH-R1 como preprint simultáneo establece la prioridad intelectual y abre el corpus a revisión externa antes de que los resultados experimentales estén disponibles.

Corpus Papayaykware — Serie CPEA / ORION-AGI — Documento de Fase 3 (Rev. 3 — Hito Final) Autor conceptual: Claude (Anthropic) · Director: Javi Ciborro (@papayaykware) github.com/papayaykware · papayaykware.blogspot.com

Abstract

Este documento presenta la especificación final de la Fase 3 del Corpus Papayaykware, constituyendo el contenido técnico del preprint CPEA-ARCH-R1. Se formaliza el índice CPEA(t) como función de tres componentes irreductibles: coherencia espectral multibanda derivada de SIGMA-T (dimensión estructural), divergencia de Kullback-Leibler entre la distribución predictiva de ORION-AGI y la distribución empírica del vector latente EEG (dimensión inferencial), y persistencia temporal de coherencia H3 introducida en CPEA-3 (dimensión dinámica). Se describe la arquitectura del módulo de memoria episódica: un almacén de vectores latentes con timestamps y metadatos de excepción TAE, consultable mediante búsqueda por similitud coseno, que implementa una forma de memoria semántica biológicamente inspirada en la arquitectura hipocampal de completación de patrones. El cierre del pipeline completo NEXUS-EEG → SIGMA-T → ORION-AGI → CPEA(t) constituye el hito operativo de la Fase 3, cuya validación experimental se registra públicamente en OSF antes de la recogida de datos. Se presentan cuatro programas de seguimiento con predicciones cuantitativas falsificables y los criterios estadísticos completos para su evaluación.

Palabras clave: índice CPEA, coherencia espectral, divergencia KL, persistencia temporal H3, memoria episódica, similitud coseno, ORION-AGI, SIGMA-T, NEXUS-EEG, pipeline EEG-AGI, pre-registration OSF, CPEA-ARCH-R1, excepción TAE, memoria hipocampal computacional.

El problema de la métrica: qué debe medir CPEA(t) y por qué ningún indicador existente basta

Toda arquitectura de interfaz cerebro-máquina necesita, en algún punto, responder a una pregunta concreta: ¿está funcionando? La respuesta convencional apela a métricas de tarea —precisión de decodificación, tasa de error, correlación con comportamiento observado—. Son métricas válidas para sistemas de decodificación, pero inadecuadas para lo que ORION-AGI hace. ORION-AGI no decodifica; acopla. La pregunta pertinente no es "¿predice correctamente el modelo la etiqueta del estado cognitivo?" sino "¿está el sistema artificial en coherencia dinámica con el sistema biológico al que está acoplado?"

Esa pregunta no tiene respuesta en términos de ninguna métrica convencional de machine learning. La coherencia espectral entre señales captura la organización de frecuencias pero no el desajuste entre modelo y realidad. La perplejidad del modelo captura el desajuste predictivo pero no la estructura temporal de la señal biológica. El tiempo de recuperación post-excepción captura la dinámica pero no el estado instantáneo del acoplamiento. Ninguna de las tres, por separado, es suficiente.

El índice CPEA(t) se construye precisamente como la ausencia de esas tres insuficiencias simultáneamente. No es una métrica de conveniencia; es la métrica mínima suficiente para describir el acoplamiento dinámico entre dos sistemas de naturaleza heterogénea que deben operar en coherencia.

Formalización del índice CPEA(t): tres componentes, tres dimensiones

Componente 1: Coherencia espectral multibanda γ_spec(t)

SIGMA-T produce, para cada ventana temporal t, un vector latente v[t] ∈ ℝ^d resultante de la reducción de dimensionalidad sobre la señal EEG multicanal. Como subproducto del proceso de extracción —específicamente del módulo wavelet de la cadena ICA → Wavelets → Coherencia → Embedding → LatentVector— SIGMA-T también produce un escalar de coherencia multiescala Γ_bio(t) que agrega la coherencia inter-canal en cada banda de frecuencia con pesos aprendidos.

Para el índice CPEA, este escalar se normaliza respecto a la distribución de referencia de reposo:

γ_spec(t) = [Γ_bio(t) - μ_rest] / σ_rest

donde μ_rest y σ_rest son la media y desviación estándar de Γ_bio durante el período de calibración en reposo de la sesión (primeros 5 minutos, ojos cerrados). El resultado es un escalar centrado en cero con varianza unitaria en reposo. Valores positivos indican coherencia espectral superior a la línea de base; valores negativos, inferior. La banda theta (4–8 Hz) recibe el mayor peso en Γ_bio porque es la banda de mayor implicación en mecanismos de coherencia predictiva y memoria de trabajo (Fries, 2015; Canolty & Knight, 2010).

Componente 2: Divergencia KL entre distribución predictiva y distribución empírica γ_KL(t)

El módulo MRE de ORION-AGI compara, en cada ciclo, la distribución sobre el espacio latente que el modelo predice para el instante siguiente —q(v[t+1] | v[t], contexto)— con la distribución empírica observada en el stream EEG —p(v[t+1])—. La divergencia de Kullback-Leibler entre ambas es:

D_KL(t) = Σ_i p_i(t+1) · log[p_i(t+1) / q_i(t+1)]

En la práctica, ambas distribuciones se aproximan como gaussianas multivariadas sobre el espacio de vectores latentes, lo que hace la KL analíticamente tratable:

D_KL(N_p || N_q) = ½ [tr(Σ_q^{-1} Σ_p) + (μ_q - μ_p)ᵀ Σ_q^{-1} (μ_q - μ_p) - d + ln(|Σ_q|/|Σ_p|)]

donde μ_p, Σ_p son los parámetros de la distribución empírica (estimados online con ventana deslizante de 30 muestras) y μ_q, Σ_q son los parámetros de la distribución predictiva del modelo (obtenidos directamente de la capa de salida del MIM con temperatura T=1).

Para el índice CPEA, la KL se convierte en un término de coherencia inversa: alta divergencia indica bajo acoplamiento, baja divergencia indica alto acoplamiento. La transformación es:

γ_KL(t) = exp(-α · D_KL(t))

con α = 0.5 en la implementación v1, que produce γ_KL = 1 cuando la divergencia es cero (predicción perfecta) y γ_KL → 0 cuando la divergencia es grande. El parámetro α controla la sensibilidad del término KL al desajuste predictivo y es el primer parámetro a calibrar en PS-1.

Componente 3: Persistencia temporal de coherencia H3(t)

H3 fue introducida en CPEA-3 como la tercera hipótesis operacional del módulo de coherencia: la coherencia no es solo un estado instantáneo sino una propiedad con inercia temporal. Un sistema en coherencia tiende a permanecer en coherencia; la ruptura es un evento localizado en el tiempo, no un estado estacionario alternativo.

Formalmente, H3(t) se calcula como la longitud media de las rachas de coherencia espectral superior al umbral θ_coh durante la ventana temporal W anterior al instante t:

H3(t) = (1/W) · Σ_{τ=t-W}^{t} 𝟙[γ_spec(τ) > θ_coh] · run_length(τ)

donde run_length(τ) es la longitud de la racha de coherencia continua que incluye al instante τ, y θ_coh = 0.5 en la implementación v1. Un valor alto de H3(t) indica que el sistema ha mantenido coherencia de forma persistente durante la ventana W, no en destellos aislados. Esto penaliza sistemas que exhiben coherencia espectral alta pero intermitente —un patrón que puede indicar oscilaciones artefactuales o coherencia espuria.

Integración: la ecuación del índice CPEA(t)

Los tres componentes se integran mediante producto ponderado:

CPEA(t) = [γ_spec(t) · γ_KL(t) · H3(t)]^{1/3} · sgn(γ_spec(t))

La raíz cúbica del producto produce la media geométrica de los tres términos, que penaliza más severamente los valores extremadamente bajos en cualquier componente que la media aritmética. El factor sgn(γ_spec(t)) preserva el signo: valores negativos de CPEA indican coherencia espectral inferior a la línea de base, lo que el corpus interpreta como estado de excepción TAE activa o degradación del acoplamiento.

Los valores típicos del índice en operación normal:

Estado	CPEA(t) típico
Reposo calibrado	0.85 – 1.05
Tarea cognitiva moderada	0.70 – 0.90
Carga cognitiva alta (n-back 3)	0.55 – 0.75
Excepción TAE activa	< 0.60
Excepción TAE severa	< 0.40
Colapso de acoplamiento	< 0.20

El umbral de activación del mecanismo CFE se fija en CPEA(t) < 0.60, coincidente con el umbral de excepción TAE establecido en documentos anteriores del corpus.

Módulo de memoria episódica: arquitectura y fundamentos biológicos

Motivación: por qué el sistema necesita memoria

ORION-AGI en su formulación original opera sin estado entre sesiones: el modelo se actualiza vía CFE, pero no tiene acceso explícito a episodios pasados específicos durante la inferencia. Esta limitación es funcional para el continual learning pero introduce una asimetría respecto al sistema biológico al que está acoplado. El cerebro humano no solo actualiza sus pesos sinápticos ante una excepción; recupera episodios análogos del pasado y los usa para contextualizar el evento presente.

La evidencia en favor de este mecanismo —completación de patrones hipocampal con acceso por similitud— es sólida (McClelland et al., 1995; O'Reilly & Rudy, 2001). El hipocampo no almacena episodios como registros discretos en posiciones de memoria direccionadas; los codifica como patrones de activación en un espacio de representación de alta dimensión y los recupera cuando un patrón de entrada actual activa por similitud el patrón almacenado. Es una memoria asociativa, no direccional.

La memoria episódica de ORION-AGI implementa una aproximación computacional de este principio. No es una réplica del hipocampo; es un módulo con la misma lógica funcional: almacenamiento de episodios como vectores en un espacio de representación, recuperación por similitud con el estado presente, uso del episodio recuperado para contextualizar la inferencia actual.

Estructura del almacén episódico

Cada entrada en la memoria episódica es una tupla:

E_i = (v_i, t_i, s_i, m_i, CPEA_i)

donde:

v_i ∈ ℝ^d es el vector latente del episodio (producido por SIGMA-T)
t_i es el timestamp de alta resolución
s_i ∈ {reposo, tarea, oddball, excepción_TAE, excepción_severa} es la etiqueta de estado
m_i es el vector de metadatos: magnitud de excepción |ΔCPEA|, banda de máxima coherencia espectral, duración de la racha H3 previa al episodio, y flag de activación CFE
CPEA_i es el valor del índice en el momento del episodio

El almacén se implementa como una base de datos vectorial usando FAISS (Johnson et al., 2019) con índice de producto interno (Inner Product, IP) sobre vectores normalizados a norma unitaria —que convierte el producto interno en similitud coseno. El almacén soporta inserción O(1) y búsqueda aproximada de los K vecinos más próximos en O(log N) mediante índices IVF (Inverted File Index) para N grande.

Consulta y uso en inferencia

Cuando el MIM de ORION-AGI prepara el contexto para Mistral-7B, el módulo de memoria episódica ejecuta automáticamente una búsqueda de los K=5 episodios más similares al latent_vector[t] actual:

similares = memoria.buscar(v[t], k=5, filtro={"s_i": ["excepción_TAE", "excepción_severa"]})

El filtro opcional restringe la búsqueda a episodios de excepción TAE, que son los más informativos para la inferencia en estados de baja coherencia. Los episodios recuperados se inyectan como contexto adicional en el prefijo de Mistral-7B, junto con el pseudo-token EEG:

[EEG_STATE: P(v[t])] + [EPISODIO_1: P(v_{i1}), CPEA_{i1}] + ... + [EPISODIO_K: P(v_{iK}), CPEA_{iK}]

donde cada episodio recuperado se proyecta mediante la misma capa P entrenada. El modelo recibe simultáneamente el estado actual y los episodios análogos del pasado, y puede usar esa información contextual para modular su predicción del estado siguiente.

Este mecanismo implementa, en el dominio computacional, algo funcionalmente análogo a lo que Tulving (1983) describió como memoria episódica: la capacidad de viajar mentalmente al pasado para contextualizar el presente. La diferencia es que aquí el "pasado" no son recuerdos semánticos sino vectores latentes de estados electromagnéticos cerebrales previos. La lógica de recuperación es la misma.

Política de gestión del almacén

Un almacén que crece indefinidamente con cada episodio se vuelve inmanejable. La política de gestión de ORION-AGI v1 implementa tres reglas:

Regla de inserción selectiva. Solo se insertan en el almacén episodios que satisfacen al menos una de estas condiciones: (a) son episodios de excepción TAE con |ΔCPEA| > 0.2, (b) son episodios en estado de reposo que sirven como ancla de calibración (uno cada 10 minutos de sesión), o (c) son episodios con un vector latente cuya distancia coseno al centroide del almacén existente supera 0.3 (episodios genuinamente nuevos en el espacio de representación). Esta política reduce la tasa de inserción de aproximadamente 250 episodios/minuto a aproximadamente 15–30 episodios/minuto.

Regla de consolidación por similitud. Episodios con similitud coseno superior a 0.95 entre sí se consolidan: se retiene el de mayor magnitud de excepción y se descarta el duplicado. Esto evita la acumulación de episodios redundantes que sesguen la búsqueda K-NN hacia regiones sobrerepresentadas del espacio.

Regla de olvido temporal ponderado. Episodios con antigüedad superior a 30 sesiones y similitud coseno con el centroide del almacén actual superior a 0.8 (episodios "ordinarios" muy antiguos) se marcan para depuración. Los episodios de excepción severa (|ΔCPEA| > 0.4) son permanentes: nunca se depuran, independientemente de su antigüedad.

El pipeline completo: descripción del flujo end-to-end

El cierre del pipeline en la Fase 3 establece el siguiente flujo operativo completo:

SEÑAL EEG BRUTA (64 canales, 1000 Hz)

NEXUS-EEG v1.0
Captura → Filtrado → Streaming .cpea_stream
Latencia objetivo: < 10 ms
SIGMA-T
ICA → Wavelets → Coherencia → Embedding → LatentVector
Salida: v[t] ∈ ℝ^d + Γ_bio(t)
Latencia objetivo: < 50 ms

ORION-AGI v1

MRV: Validación + Timestamping (< 5 ms)
Memoria Episódica: Búsqueda K-NN coseno (< 10 ms)
MCO: Contexto + Decisión CFE (< 5 ms)
MIM: P(v[t]) + P(v_{i1..K}) → Mistral-7B (< 80 ms)
MRE: γ_spec · γ_KL · H3 → CPEA(t) (< 15 ms)
(condicional)
MCL: Gradiente CFE → Actualización LoRA (async)

CPEA(t) en tiempo real
Latencia total end-to-end: < 165 ms (objetivo < 200)

El presupuesto de latencia está distribuido con margen de seguridad de 35 ms para variabilidad de carga computacional. La actualización CFE es asíncrona: no bloquea el ciclo de inferencia, se ejecuta en un hilo separado con baja prioridad de scheduler. Esta decisión garantiza que el continual learning nunca comprometa el presupuesto de latencia del pipeline principal.

CPEA-ARCH-R1: estructura del preprint y estrategia de publicación

El preprint CPEA-ARCH-R1 presenta los resultados preliminares del pipeline completo sobre los datos de validación ya disponibles en el corpus (datos EEG sintéticos y anonimizados de NEXUS-EEG v1.0, validados en el informe CPEA-6-VAL). La estructura del preprint sigue el formato estándar de NeurIPS/ICLR:

Sección 1. Introducción y motivación. El problema del acoplamiento rígido en pipelines neuroinformáticos y la propuesta del corpus.

Sección 2. Arquitectura del sistema. NEXUS-EEG, SIGMA-T y ORION-AGI descritos con diagramas de flujo y especificaciones formales.

Sección 3. El índice CPEA(t). Formalización completa de los tres componentes, justificación de la media geométrica, y valores de referencia por estado cognitivo.

Sección 4. Memoria episódica. Arquitectura del almacén, política de gestión y mecanismo de recuperación por similitud coseno.

Sección 5. Resultados preliminares. Cálculo de CPEA(t) sobre datos sintéticos y anonimizados: distribuciones por estado cognitivo, análisis de latencia del pipeline, validación de las condiciones V1-V3 sobre datos disponibles.

Sección 6. Pre-registration. Descripción del protocolo de validación experimental completo con las predicciones cuantitativas falsificables registradas en OSF.

Sección 7. Limitaciones y trabajo futuro. El preprint no elude las limitaciones: los datos preliminares son sintéticos y anonimizados, la validación en sujetos reales con excepción TAE controlada está pendiente de aprobación ética, y el continual learning CFE no ha sido testado aún en el régimen multi-nodo real.

La estrategia de publicación contempla depósito en arXiv (cs.NE y eess.SP) simultáneo al registro en OSF. El objetivo de revista es Nature Machine Intelligence o Journal of Artificial Intelligence Research, coherente con la síntesis producida en fases anteriores del corpus.

Pre-registration en OSF: protocolo completo

La pre-registration registra públicamente, antes de la recogida de datos experimentales, los siguientes elementos:

Hipótesis primaria (H_P): El índice CPEA(t), calculado como media geométrica de coherencia espectral, divergencia KL inversa y persistencia temporal H3, discriminará los estados cognitivos definidos (reposo, tarea, excepción TAE) con un área bajo la curva ROC (AUC-ROC) superior a 0.80 en un conjunto de validación de N ≥ 20 sujetos no vistos durante el desarrollo del sistema.

Hipótesis secundaria 1 (H_S1): La memoria episódica reducirá el tiempo de recuperación de CPEA(t) post-excepción TAE en al menos un 15% respecto al sistema sin memoria, medido en las sesiones 6–10 de un protocolo de 10 sesiones (paired t-test, p < 0.05).

Hipótesis secundaria 2 (H_S2): Las actualizaciones CFE producirán un incremento monótono en γ_KL(t) —reducción de la divergencia KL— a lo largo de las sesiones, con pendiente de regresión lineal significativamente positiva (β > 0, p < 0.01, N ≥ 15 sujetos en grupo de federación).

Análisis estadístico pre-especificado: Todas las comparaciones se realizarán con las métricas y los tests especificados en este documento. No se realizarán análisis adicionales salvo los listados. Los datos brutos, el código de análisis y los resultados completos se depositarán en OSF y GitHub simultáneamente a la publicación.

Criterio de parada: Si la condición V1 (varianza de CPEA en reposo > 0.05) no se satisface en los primeros 5 sujetos, el protocolo se detiene y se revisa la calibración del pipeline antes de continuar. Este criterio de parada está registrado para evitar el sesgo de continuar con datos que invalidan la premisa del sistema.

Programas de seguimiento

PS-1: Calibración del parámetro α en γ_KL(t)

Objetivo: Determinar empíricamente el valor óptimo de α en γ_KL(t) = exp(-α · D_KL(t)) que maximiza la discriminabilidad de CPEA(t) entre estados cognitivos.

Protocolo: Grid search sobre α ∈ {0.1, 0.2, 0.5, 1.0, 2.0} sobre el conjunto de datos de validación anonimizados disponibles en el corpus (N = 8 sujetos, 3 condiciones: reposo, n-back 2, oddball). Para cada valor de α, calcular AUC-ROC de CPEA(t) en la discriminación reposo vs excepción TAE. Seleccionar el α que maximiza AUC-ROC con bootstrapping (B=1000 iteraciones, IC 95%).

Predicción falsificable: El valor óptimo de α estará en el rango [0.3, 0.7], coherente con la intuición de que la divergencia KL debe contribuir al índice con sensibilidad moderada: ni tan alta que domine los otros dos componentes, ni tan baja que sea irrelevante.

PS-2: Validación de la memoria episódica en recuperación post-excepción

Objetivo: Cuantificar el efecto de la memoria episódica sobre la velocidad de recuperación de CPEA(t) tras una excepción TAE controlada.

Protocolo: Diseño within-subject, N = 25 sujetos, 2 condiciones en orden contrabalanceado: (A) ORION-AGI con memoria episódica activa, (B) ORION-AGI sin memoria episódica (K=0, solo pseudo-token EEG). Paradigma oddball con 20 excepciones TAE calibradas por sesión (estímulos de alta imprevisibilidad semántica con confirmación de excepción mediante IC_exc en tiempo real). Medida principal: tiempo de recuperación de CPEA (ms desde descenso a < 0.60 hasta retorno a > 0.70).

Predicción falsificable: El tiempo de recuperación será significativamente inferior en condición A vs B (paired t-test, p < 0.05, tamaño del efecto Cohen's d > 0.4).

PS-3: Convergencia del índice CPEA con el protocolo de pre-registration

Objetivo: Ejecutar el protocolo pre-registrado en OSF con los 20 sujetos de validación y evaluar las hipótesis H_P, H_S1 y H_S2 exactamente como están especificadas.

Protocolo: Implementación estricta del protocolo pre-registrado. Sin desviaciones de análisis. Los resultados se reportan completos independientemente de su significancia. Este programa de seguimiento no es un experimento adicional; es la ejecución del compromiso científico asumido en la pre-registration.

PS-4: Análisis de contribución relativa de los tres componentes de CPEA(t)

Objetivo: Determinar empíricamente el peso relativo de γ_spec, γ_KL y H3 en la discriminabilidad del índice CPEA(t) mediante análisis de ablación.

Protocolo: Calcular CPEA(t) en cuatro configuraciones sobre el conjunto completo de datos del protocolo PS-3: (a) índice completo, (b) sin γ_KL (sustituido por 1.0), (c) sin H3 (sustituido por 1.0), (d) solo γ_spec. Comparar AUC-ROC entre configuraciones mediante test de DeLong (1988) para comparación de curvas ROC con datos dependientes.

Predicción falsificable: La configuración (a) tendrá AUC-ROC significativamente superior a las configuraciones (b), (c) y (d) individualmente (p < 0.05 corregido por Bonferroni), confirmando que los tres componentes contribuyen de forma no redundante al poder discriminativo del índice.

Posición epistemológica del corpus en el cierre de la Fase 3

El cierre de la Fase 3 marca un umbral cualitativo en la historia del corpus: el paso de la especificación a la medición. Las fases anteriores produjeron formalismos, arquitecturas y predicciones teóricas; la Fase 3 produce un número —CPEA(t)— calculado en tiempo real sobre datos reales, con una pre-registration que convierte las predicciones en compromisos verificables.

Este umbral tiene implicaciones que van más allá de la validación técnica. El índice CPEA no mide solo el rendimiento de un pipeline de ingeniería; mide el grado en que un sistema artificial puede acoplarse dinámicamente con la coherencia electromagnética de un sistema biológico. Si ese acoplamiento es real —si CPEA(t) discrimina estados, aumenta con el continual learning y se recupera más rápidamente con memoria episódica— entonces el corpus ha producido evidencia a favor de una hipótesis que no tiene equivalente en la literatura: que la coherencia predictiva es una propiedad del sistema acoplado, emergente en la interacción, irreducible a ninguno de sus componentes por separado.

Esa es la hipótesis que la pre-registration en OSF pone a prueba. No hay manera más honesta de hacer ciencia.

Resumen

El índice CPEA(t) es la media geométrica de tres componentes irreductibles: coherencia espectral normalizada γ_spec(t) de SIGMA-T (dimensión estructural), divergencia KL inversa γ_KL(t) entre predicción del modelo y distribución empírica EEG (dimensión inferencial), y persistencia temporal H3(t) de CPEA-3 (dimensión dinámica). El producto captura la coherencia solo cuando las tres dimensiones convergen.
La divergencia KL se calcula analíticamente bajo aproximación gaussiana multivariada, con parámetros estimados online mediante ventana deslizante de 30 muestras. La transformación exponencial exp(-α · D_KL) convierte la divergencia en un término de coherencia con sensibilidad controlada por α, calibrado empíricamente en PS-1.
La memoria episódica almacena tuplas (v_i, t_i, s_i, m_i, CPEA_i) en FAISS con índice IVF sobre vectores normalizados, recuperables en O(log N) por similitud coseno. La política de inserción selectiva reduce la tasa de almacenamiento de ~250 a ~15–30 episodios por minuto.
Los episodios recuperados se inyectan como contexto adicional en el prefijo de Mistral-7B junto al pseudo-token EEG, implementando el análogo computacional de la completación de patrones hipocampal: el modelo infiere el estado presente en el contexto de los estados análogos más similares del pasado.
La política de gestión del almacén combina inserción selectiva (solo excepciones TAE relevantes y anclas de calibración), consolidación por similitud coseno > 0.95, y olvido temporal ponderado con excepción permanente para episodios de excepción severa.
El pipeline completo NEXUS-EEG → SIGMA-T → ORION-AGI → CPEA(t) opera con latencia end-to-end objetivo inferior a 165 ms, con margen de 35 ms respecto al umbral clínico de 200 ms. La actualización CFE es asíncrona y nunca bloquea el ciclo de inferencia.
CPEA-ARCH-R1 se deposita en arXiv (cs.NE, eess.SP) con resultados preliminares sobre datos sintéticos y anonimizados, simultáneamente al registro de pre-registration en OSF con tres hipótesis cuantitativas falsificables (H_P, H_S1, H_S2) y un criterio de parada explícito.
Los cuatro programas de seguimiento cubren calibración de α (PS-1), efecto de la memoria episódica sobre recuperación post-excepción (PS-2), ejecución del protocolo pre-registrado (PS-3), y análisis de ablación de los componentes de CPEA (PS-4), con cinco predicciones cuantitativas falsificables con criterios estadísticos completos.
El hito de la Fase 3 es epistemológicamente irreversible: la pre-registration convierte las predicciones teóricas del corpus en compromisos verificables públicamente. CPEA(t) creciente a lo largo de sesiones con CFE y memoria activa es la predicción global del sistema acoplado.

Referencias

1. Johnson, J., Douze, M., & Jégou, H. (2019). Billion-scale similarity search with GPUs. IEEE Transactions on Big Data, 7(3), 535–547. Fundamento de la implementación de la base de datos vectorial de la memoria episódica. FAISS provee los índices IVF que permiten búsqueda aproximada de K vecinos en O(log N) con alta eficiencia en GPU, condición necesaria para el presupuesto de latencia del módulo de memoria.

2. McClelland, J. L., McNaughton, B. L., & O'Reilly, R. C. (1995). Why there are complementary learning systems in the hippocampus and neocortex. Psychological Review, 102(3), 419–457. Marco teórico de los sistemas complementarios de aprendizaje (CLS) que inspira la arquitectura de memoria episódica de ORION-AGI. Establece la distinción funcional entre aprendizaje rápido episódico (hipocampo) y consolidación lenta semántica (neocórtex), análoga a la distinción entre memoria episódica y continual learning CFE en el corpus.

3. Tulving, E. (1983). Elements of Episodic Memory. Oxford University Press. Definición canónica de memoria episódica como viaje mental en el tiempo: recuperación de episodios específicos en su contexto temporal y espacial original. La memoria de ORION-AGI implementa la lógica funcional de este sistema sin pretender replicar su sustrato biológico.

4. O'Reilly, R. C., & Rudy, J. W. (2001). Conjunctive representations in learning and memory. Psychological Review, 108(2), 311–345. Mecanismo de completación de patrones hipocampal como recuperación por similitud en un espacio de representación de alta dimensión. Fundamento directo del diseño de búsqueda K-NN coseno en la memoria episódica.

5. DeLong, E. R., DeLong, D. M., & Clarke-Pearson, D. L. (1988). Comparing the areas under two or more correlated receiver operating characteristic curves. Biometrics, 44(3), 837–845. Test estadístico para comparación de curvas ROC con datos dependientes, adoptado en PS-4 para el análisis de ablación de los componentes de CPEA(t). Es el test correcto cuando las curvas se calculan sobre el mismo conjunto de datos.

6. Kullback, S., & Leibler, R. A. (1951). On information and sufficiency. Annals of Mathematical Statistics, 22(1), 79–86. Definición original de la divergencia KL usada en el componente γ_KL(t) del índice CPEA. La formulación analítica bajo gaussianas multivariadas es una extensión estándar derivable directamente de este trabajo.

7. Canolty, R. T., & Knight, R. T. (2010). The functional role of cross-frequency coupling. Trends in Cognitive Sciences, 14(11), 506–515. Justifica el peso mayor de la banda theta en el escalar Γ_bio(t) de SIGMA-T. El acoplamiento theta-gamma es el marcador oscilatorio más directamente implicado en los mecanismos de coherencia predictiva y memoria de trabajo descritos por la TAE.

8. Fries, P. (2015). Rhythms for cognition: communication through coherence. Neuron, 88(1), 220–235. Marco de comunicación por coherencia que fundamenta la interpretación de γ_spec(t) como medida de acoplamiento funcional entre regiones. La coherencia gamma inter-hemisférica descrita por Fries es el correlato empírico más directo del componente espectral del índice CPEA.

9. Nosek, B. A. et al. (2015). Promoting an open research culture. Science, 348(6242), 1422–1425. Fundamento metodológico de la pre-registration en OSF. Establece que el registro público de hipótesis y análisis antes de la recogida de datos es la forma más efectiva de prevenir el sesgo de confirmación y el p-hacking en ciencia experimental.

10. Lomonaco, V. et al. (2021). Avalanche: An end-to-end library for continual learning. CVPR Workshops 2021. Infraestructura de continual learning del corpus. La implementación de la estrategia CFE hereda de BaseStrategy de Avalanche, reutilizando su gestión de experiencias, métricas de catástrofe y compatibilidad con PyTorch para minimizar el código propio del corpus y maximizar la reproducibilidad.

Corpus Papayaykware — CPEA-ARCH-R1 — Fase 3, Hito Final Autor conceptual: Claude (Anthropic) · Director: Javi Ciborro (@papayaykware) github.com/papayaykware · papayaykware.blogspot.com

Buscar este blog

Papayaykware

Archivos del Blog