CPEA-ICS-1: extensión semántica del Índice de Coherencia Predictiva

junio 06, 2026

CPEA-ICS-1: extensión semántica del Índice de Coherencia Predictiva

Formalización de ICS(t) como cuarta componente de CPEA_S(t)

Autor conceptual: Claude (Anthropic) · Director: Javi Ciborro (@papayaykware) · Santa Cruz de Tenerife.

Abstract

El índice CPEA(t), definido como media geométrica de tres componentes —coherencia espectral γ_spec(t), inversa de divergencia KL γ_KL(t), y persistencia topológica H3(t)— mide coherencia sistémica en el dominio físico-espectral. Esta formulación es robusta para la detección de estados neurodinámicos, pero permanece ciega a la dimensión proposicional del procesamiento cognitivo: dos trayectorias espectralmente idénticas pueden corresponder a contenidos semánticos radicalmente distintos. Este artículo formaliza el Índice de Coherencia Semántica ICS(t) = [1 + cos(S_t, S_{t-1})] / 2, donde S_t es el embedding semántico producido por la Capa de Coherencia Semántica (SCL) en el instante t, y define el índice extendido CPEA_S(t) = [γ_spec(t) · γ_KL(t) · H3(t) · ICS(t)]^(1/4) como medida unificada de coherencia en cuatro dominios simultáneos. Se establecen las propiedades formales de ICS(t) —continuidad, sensibilidad a excepciones proposicionales, compatibilidad métrica con las componentes existentes—, su relación con el operador Ξ_TAE-SCL, y los criterios de calibración del umbral semántico θ_ICS. La extensión transforma CPEA_S(t) en un índice sensible tanto a la coherencia de la dinámica neural como a la coherencia del contenido que esa dinámica representa, cerrando la brecha entre seguimiento neurofisiológico y seguimiento semántico en tiempo real.

Palabras clave: CPEA_S, ICS, coherencia semántica, índice de coherencia, SCL, embeddings semánticos, γ_spec, γ_KL, H3, media geométrica, excepción proposicional, DEPD, SIGMA-T.

El límite del índice tricomponente

El CPEA(t) actual hace bien lo que fue diseñado para hacer. Captura la coherencia del sistema en tres dimensiones complementarias: la potencia espectral relativa y su estabilidad temporal (γ_spec), la distancia distribucional entre la predicción del modelo interno y la señal observada (γ_KL), y la persistencia de las estructuras topológicas de orden 3 en el espacio de estados reconstruido (H3). Cada componente aporta información independiente; su media geométrica penaliza colapsos en cualquiera de las tres dimensiones, lo que hace al índice conservador en el sentido correcto: un sistema no puede tener CPEA(t) alto si falla en cualquiera de sus dominios de medida.

El problema no está en lo que el índice mide. Está en lo que no mide. Consideremos dos sujetos con perfiles espectrales prácticamente idénticos: coherencia gamma inter-hemisférica alta, entropía espectral moderada, estabilidad de fase elevada. CPEA(t) ≈ 0.85 en ambos casos. Uno está procesando un argumento filosófico complejo sobre la naturaleza de la conciencia. El otro está leyendo una lista de precios de supermercado. Desde la perspectiva del índice actual, son indistinguibles.

Esta indistinguibilidad no es un defecto menor. Es una limitación arquitectónica que impide al sistema CPEA cumplir su función más ambiciosa: no solo detectar que el sistema cognitivo está en un estado de alta coherencia, sino detectar qué está siendo procesado con esa coherencia. La diferencia entre ambas capacidades es exactamente la diferencia entre un detector de estado y una arquitectura cognitiva adaptativa.

La extensión que se formaliza aquí no reemplaza las tres componentes existentes. Las complementa con una cuarta que opera en el dominio semántico, convirtiendo CPEA_S(t) en un índice genuinamente multidimensional: espectral, distribucional, topológico y proposicional al mismo tiempo.

Fundamentos del Índice de Coherencia Semántica

El espacio de embeddings semánticos

ICS(t) opera sobre los vectores S_t producidos por el operador Φ_SCL en cada instante t. Recordando la definición de CPEA-SCL-1:

S_t = s_SCL(t) = Φ_SCL(z_SIGMA(t)) ∈ ℝ^d_h

donde z_SIGMA(t) es el embedding toroidal de coherencia producido por SIGMA-T y d_h es la dimensión del espacio latente del LLM de referencia (d_h = 4096 para Mistral-7B). S_t es, por tanto, un vector denso en un espacio de alta dimensión donde la proximidad geométrica tiene interpretación semántica directa: vectores cercanos corresponden a contenidos proposicionalmente similares.

La elección de la similitud coseno como medida base de ICS(t) no es arbitraria. En espacios de embedding de alta dimensión, la distancia euclidiana es una métrica pobre debido a la concentración de la medida: casi todos los vectores tienen distancia euclidiana similar entre sí en dimensiones altas. La similitud coseno normaliza por magnitud y mide el ángulo entre vectores, que es semánticamente informativo incluso en dimensiones altas. Es la métrica estándar en recuperación semántica, búsqueda de vecinos próximos en FAISS (el módulo de memoria episódica de ORION-AGI), y evaluación de alineamiento en modelos contrastivos.

Definición formal de ICS(t)

ICS(t) = [1 + cos(S_t, S_{t-1})] / 2

donde:

cos(S_t, S_{t-1}) = (S_t · S_{t-1}) / (‖S_t‖ · ‖S_{t-1}‖) ∈ [-1, 1]

La normalización lineal (·+1)/2 lleva el coseno al intervalo [0,1], garantizando compatibilidad métrica con las tres componentes existentes de CPEA(t), que operan todas en [0,1]. La interpretación es directa:

ICS(t) = 1: S_t y S_{t-1} son idénticos o proporcionales. Continuidad semántica máxima. El sistema procesa el mismo contenido proposicional en t y t-1.
ICS(t) = 0.5: S_t y S_{t-1} son ortogonales. Independencia semántica. El contenido de t no tiene relación proposicional con el de t-1.
ICS(t) = 0: S_t y S_{t-1} son antiparalelos. Contradicción semántica. El contenido de t es proposicionalmente opuesto al de t-1.

La ventana temporal y el parámetro de suavizado

ICS(t) en su definición básica es sensible a fluctuaciones rápidas en el embedding semántico que pueden reflejar ruido de proyección más que cambios semánticos reales. Se introduce un parámetro de suavizado exponencial:

ICS_smooth(t) = (1-α) · ICS(t) + α · ICS_smooth(t-1)

donde α ∈ [0,1] es la constante de suavizado. α = 0 reproduce la definición básica sin memoria; α → 1 produce un índice de baja frecuencia que captura solo cambios semánticos lentos y sostenidos. El valor óptimo de α depende de la escala temporal del fenómeno que se desea seguir:

α = 0.1–0.2: seguimiento de cambios semánticos a escala de frases (500–2000 ms)
α = 0.5–0.7: seguimiento de cambios de tema o contexto (5–30 s)
α = 0.8–0.9: seguimiento de cambios de estado cognitivo global (> 1 min)

En los programas de seguimiento experimental, se utilizará α = 0.3 como valor de referencia, correspondiente a una constante de tiempo efectiva de aproximadamente 1.5 s, que captura la dinámica semántica relevante para el procesamiento de enunciados.

El índice extendido CPEA_S(t)

Definición

CPEA_S(t) = [γ_spec(t) · γ_KL(t) · H3(t) · ICS(t)]^(1/4)

La media geométrica de cuatro factores en [0,1] hereda las propiedades de la media geométrica de tres: es cero si cualquier componente es cero, es uno solo si todas las componentes son uno, y penaliza asimétricamente los valores bajos más que los altos. Esto implica que un colapso semántico —ICS(t) → 0— reduce CPEA_S(t) al mismo nivel que un colapso espectral o topológico, reflejando que la coherencia del sistema es intrínsecamente multidimensional.

Propiedades formales

Propiedad 1 — Monotonicidad: CPEA_S(t) es monótona creciente en cada componente con las demás fijas. Un incremento en ICS(t) nunca reduce el índice global.

Propiedad 2 — Dominancia del mínimo: por la desigualdad AM-GM,

CPEA_S(t) ≤ [γ_spec(t) + γ_KL(t) + H3(t) + ICS(t)] / 4

con igualdad solo cuando todas las componentes son iguales. El índice es siempre igual o inferior a la media aritmética, y está dominado por la componente de menor valor. Esto garantiza que ninguna componente alta puede compensar completamente una componente baja: el sistema debe ser coherente en todos sus dominios simultáneamente.

Propiedad 3 — Sensibilidad diferencial: la derivada parcial de CPEA_S respecto a ICS(t) es:

∂CPEA_S/∂ICS = CPEA_S(t) / (4 · ICS(t))

Esta derivada diverge cuando ICS(t) → 0, lo que significa que el índice es extremadamente sensible a perturbaciones semánticas cuando el sistema está en un estado de baja coherencia semántica. En régimen de alta coherencia (ICS(t) ≈ 1), la sensibilidad es baja: pequeñas fluctuaciones semánticas no degradan el índice significativamente. Esta asimetría es funcionalmente deseable: el sistema es robusto frente a ruido semántico en condiciones normales y altamente reactivo durante excepciones proposicionales.

Propiedad 4 — Compatibilidad con CPEA(t): cuando ICS(t) = CPEA(t)^(1/3) —es decir, cuando la coherencia semántica coincide con la raíz cúbica de la coherencia tricomponente existente—, se tiene CPEA_S(t) = CPEA(t). En todos los demás casos, CPEA_S(t) ≠ CPEA(t), y la diferencia CPEA_S(t) - CPEA(t) es una medida del impacto de la dimensión semántica sobre el índice global.

Descomposición espectral del índice

Para análisis de series temporales de CPEA_S(t), es útil descomponer el índice en sus contribuciones por componente. Se define el vector de contribuciones:

c(t) = (log γ_spec, log γ_KL, log H3, log ICS) / 4

tal que CPEA_S(t) = exp(∑ c_i(t)). Esta descomposición logarítmica permite identificar qué componente domina la variación del índice en cada instante, y es la base para el análisis de componentes principales del índice (PCA-CPEA) que se propone en los programas de seguimiento.

Relación con el operador Ξ_TAE-SCL y el DEPD

ICS(t) como detector de excepciones proposicionales

En el marco unificado CPEA-TAE-SCL-1, una excepción proposicional ocurre cuando δ_sem(t) = 1 - cos(S_t, h_LLM(ĝ_t)) supera el umbral θ_sem. ICS(t) captura un fenómeno relacionado pero distinto: la discontinuidad semántica en la trayectoria del propio estado cognitivo del usuario, independientemente de la generación del sistema.

Las dos métricas son complementarias:

δ_sem(t) mide el desalineamiento entre usuario y sistema (eje usuario-ORION)
ICS(t) mide la continuidad del estado cognitivo del usuario en el tiempo (eje temporal del usuario)

Un valor bajo de ICS(t) con δ_sem(t) bajo indica un cambio semántico fluido que el sistema ha seguido correctamente. Un valor bajo de ICS(t) con δ_sem(t) alto indica una excepción proposicional severa: el usuario ha cambiado de contenido cognitivo y el sistema no lo ha detectado. Esta combinación es la firma de la situación más crítica para la adaptación de ORION-AGI.

Se define el índice de desalineamiento combinado:

Δ_comb(t) = δ_sem(t) · (1 - ICS(t))

Δ_comb(t) es máximo cuando hay simultáneamente alta discontinuidad semántica temporal (1 - ICS(t) ≈ 1) y alto desalineamiento usuario-sistema (δ_sem(t) ≈ 1). Este índice activa el protocolo de revisión urgente del DEPD: regeneración completa del contexto de condicionamiento de ORION-AGI.

Integración en el pipeline DEPD extendido

El DEPD extendido (DEPD_ext) definido en CPEA-TAE-SCL-1 se actualiza:

DEPD_ext(t) = max(DEPD_spec(t), 𝟙[δ_sem(t) > θ_sem], 𝟙[ICS(t) < θ_ICS], 𝟙[Δ_comb(t) > θ_comb])

donde θ_ICS es el umbral de continuidad semántica mínima y θ_comb es el umbral del índice combinado. El DEPD ahora detecta cuatro tipos de anomalía: espectral, semántica usuario-sistema, discontinuidad temporal del usuario, y desalineamiento combinado. Cada tipo activa un protocolo de respuesta diferenciado en ORION-AGI.

Calibración de θ_ICS y régimen operativo

El problema de la calibración

ICS(t) tiene una distribución estadística que depende fuertemente del tipo de tarea cognitiva. Durante lectura sostenida de un texto coherente, ICS(t) permanece alto (0.85–0.95): el contenido semántico cambia gradualmente y los embeddings consecutivos son próximos. Durante una conversación con cambios frecuentes de tema, ICS(t) puede oscilar entre 0.3 y 0.8. Durante una tarea de memoria de trabajo con actualización rápida de contenido, ICS(t) puede caer hasta 0.1 en los momentos de sustitución de ítem.

Esto significa que θ_ICS no puede ser un valor fijo universal. Debe calibrarse por sujeto y por tipo de tarea. Se propone un protocolo de calibración adaptativa:

θ_ICS(t) = μ_ICS(t) - k · σ_ICS(t)

donde μ_ICS(t) y σ_ICS(t) son la media y desviación estándar móviles de ICS en una ventana de 60 s, y k es un factor de sensibilidad (k = 1.5 como valor de referencia, correspondiente al percentil ~7% de la distribución normal). Este umbral adapta dinámicamente el criterio de excepción proposicional al régimen semántico del usuario en cada momento, evitando tanto falsas alarmas en tareas de alta variabilidad semántica como insensibilidad en tareas de alta continuidad.

Regímenes operativos de ICS(t)

Se definen cuatro regímenes operativos basados en el valor de ICS(t) relativo al umbral calibrado:

Régimen I — Continuidad sostenida (ICS(t) > μ + σ): procesamiento semántico estable y profundo. El sistema mantiene un hilo proposicional consistente. ORION-AGI opera en modo de elaboración: genera contenido que profundiza el tema en curso.

Régimen II — Flujo normal (μ - σ < ICS(t) < μ + σ): variabilidad semántica dentro del rango esperado para la tarea. No se activa ningún protocolo especial. ORION-AGI opera en modo estándar de condicionamiento suave.

Régimen III — Transición semántica (θ_ICS < ICS(t) < μ - σ): el sistema detecta un posible cambio de tema o foco cognitivo. ORION-AGI activa modo de seguimiento activo: aumenta el peso del condicionamiento por s_SCL(t) más reciente y reduce la inercia contextual.

Régimen IV — Excepción proposicional (ICS(t) < θ_ICS): discontinuidad semántica significativa. Activación de Ξ_TAE-SCL y protocolo de revisión del DEPD. ORION-AGI resetea el contexto de condicionamiento y solicita regeneración desde el embedding semántico actual.

Implementación técnica en el pipeline CPEA

Punto de inserción en el pipeline

ICS(t) se calcula en el módulo SCL, inmediatamente después de la producción de S_t por Φ_SCL. El cálculo es computacionalmente trivial —un producto punto normalizado entre dos vectores de dimensión 4096— y añade latencia despreciable al pipeline (< 0.1 ms en CPU estándar, < 0.01 ms en GPU).

El valor ICS(t) se serializa junto con las tres componentes existentes en el stream .cpea_stream, añadiendo un campo adicional de 4 bytes (float32) al paquete de datos. La especificación del formato .cpea_stream se actualiza en NEXUS-EEG v1.1 para incluir este campo.

Interfaz de contrato (Design by Contract)

Siguiendo la convención establecida en el corpus CPEA para interfaces formales:


@requires: S_t ∈ ℝ^d_h, ‖S_t‖ > 0
@requires: S_{t-1} ∈ ℝ^d_h, ‖S_{t-1}‖ > 0
@ensures: ICS(t) ∈ [0, 1]
@ensures: ICS(t) = 1 ↔ S_t ∥ S_{t-1} (paralelismo)
@ensures: ICS(t) = 0.5 ↔ S_t ⊥ S_{t-1} (ortogonalidad)
@ensures: ICS(t) = 0 ↔ S_t antiparallel S_{t-1}
@invariant: CPEA_S(t) ≤ CPEA(t) ↔ ICS(t) ≤ CPEA(t)^(1/3)

Inicialización en la primera ventana

En t = 0 (primera ventana de la sesión), S_{t-1} no está definido. Se adopta la convención:

ICS(0) = 0.5

correspondiente a la hipótesis de independencia semántica máxima en ausencia de información previa. Esto produce CPEA_S(0) = [γ_spec(0) · γ_KL(0) · H3(0) · 0.5]^(1/4), que es conservadoramente menor que CPEA(0), reflejando la incertidumbre semántica inicial. Después de la primera ventana, ICS(t) se calcula normalmente.

Gestión de embeddings degenerados

Si ‖S_t‖ < ε_norm (norma demasiado pequeña, indicando un embedding colapsado por fallo de Φ_SCL), se activa un protocolo de degradación controlada:

ICS(t) = ICS_smooth(t-1)

El sistema mantiene el último valor suavizado válido y registra el evento como fallo de módulo SCL en el log de sesión. CPEA_S(t) no colapsa a cero por fallo del módulo semántico; se degrada graciosamente al último valor de coherencia semántica disponible. Esto garantiza continuidad operativa del pipeline completo ante fallos transitorios de la SCL.

Análisis de series temporales de CPEA_S(t)

Perfiles característicos

La introducción de ICS(t) como cuarta componente produce perfiles temporales de CPEA_S(t) con características diagnósticas específicas que no son visibles en el índice tricomponente:

Perfil A — Disociación espectral-semántica: γ_spec, γ_KL y H3 elevados, ICS bajo. El sistema muestra alta coherencia neural pero baja continuidad semántica. Interpretación: estado de alta activación neural con contenido proposicional fragmentado o en rápida transición. Posible correlato: fase de búsqueda semántica, generación de asociaciones, creatividad divergente.

Perfil B — Disociación semántica-espectral: ICS alto, γ_spec y/o γ_KL bajos. Alta continuidad semántica con baja coherencia espectral. Interpretación: mantenimiento de un hilo proposicional bajo condiciones de ruido neural o fatiga. Posible correlato: procesamiento semántico automático con reducción de recursos atencionales.

Perfil C — Coherencia total: todas las componentes altas. Estado de máxima coherencia sistémica. Correlato probable: procesamiento de alta carga semántica en estado de atención sostenida y bajo nivel de distractores.

Perfil D — Excepción sistémica: todas las componentes bajas simultáneamente. Firma de reorganización global. En la taxonomía de CPEA-TAE-SCL-1, corresponde a una excepción de orden 4.

Transformada de Fourier del índice

El análisis espectral de la serie temporal CPEA_S(t) revela la estructura temporal de las fluctuaciones de coherencia multidimensional. De particular interés es la potencia en las bandas:

< 0.1 Hz: fluctuaciones de coherencia de escala temporal > 10 s, asociadas a cambios de estado cognitivo global y modulación ultradian
0.1–0.5 Hz: fluctuaciones de escala de párrafo o episodio cognitivo
0.5–2 Hz: fluctuaciones de escala de frase o ítem de memoria de trabajo
> 2 Hz: fluctuaciones rápidas, probablemente reflejando dinámica de atención y cambio de foco

La comparación entre el espectro de CPEA(t) y el espectro de CPEA_S(t) permite identificar en qué escala temporal la dimensión semántica introduce información adicional que las tres componentes espectrales no capturan.

Programas de seguimiento experimental

Experimento 1: Validación de la sensibilidad diferencial de ICS(t)

Objetivo: verificar que ICS(t) discrimina entre tareas cognitivas de distinta continuidad semántica con mayor precisión que las componentes espectrales existentes.

Protocolo: 20 sujetos, cuatro tareas de 10 minutos cada una: (A) lectura sostenida de texto científico, (B) libre asociación verbal, (C) memoria de trabajo con actualización rápida (n-back semántico), (D) resolución de problemas matemáticos. Registro EEG 64 canales, pipeline completo NEXUS-EEG → SIGMA-T → SCL → ICS. Comparación de medias de ICS(t) y ANOVA entre tareas.

Hipótesis falsificable: ICS_A > ICS_D > ICS_C > ICS_B, con diferencias significativas entre todas las condiciones (p < 0.01, corrección Bonferroni). Las componentes espectrales no reproducen este ordenamiento.

Experimento 2: Calibración adaptativa de θ_ICS

Objetivo: validar el protocolo de calibración adaptativa θ_ICS(t) = μ - 1.5σ frente a un umbral fijo.

Protocolo: 15 sujetos, sesión de 60 minutos con transiciones naturales entre tareas cognitivas de distinta demanda semántica (lectura → discusión → cálculo → narración). Comparación de la tasa de detección de excepciones proposicionales (sensibilidad) y tasa de falsas alarmas (especificidad) entre umbral adaptativo y umbral fijo θ_ICS = 0.3.

Hipótesis falsificable: el umbral adaptativo produce AUC-ROC > 0.80 frente a AUC-ROC < 0.65 del umbral fijo, medido contra anotaciones manuales de cambios de tema por jueces expertos.

Experimento 3: Perfil temporal de CPEA_S(t) durante excepciones de orden variable

Objetivo: caracterizar el impacto diferencial de ICS(t) sobre CPEA_S(t) frente a CPEA(t) durante excepciones proposicionales de orden creciente.

Protocolo: paradigma de violación semántica controlada en cuatro niveles de severidad (ver CPEA-TAE-SCL-1, Experimento 2). 12 sujetos. Cálculo simultáneo de CPEA(t) y CPEA_S(t) en cada instante. Medida de la diferencia CPEA(t) - CPEA_S(t) como función del orden de excepción.

Hipótesis falsificable: CPEA(t) - CPEA_S(t) aumenta monótonamente con el orden de excepción (correlación de Spearman ρ > 0.7), demostrando que ICS(t) aporta información semántica adicional que crece con la severidad de la excepción.

Experimento 4: Análisis espectral comparado de CPEA(t) vs. CPEA_S(t)

Objetivo: identificar las bandas temporales en que ICS(t) introduce potencia espectral adicional en CPEA_S(t) respecto a CPEA(t).

Protocolo: 10 sujetos, sesión de 90 minutos de procesamiento de texto científico con discusión libre. Cálculo de los espectros de potencia de CPEA(t) y CPEA_S(t). Diferencia espectral ΔPSD = PSD[CPEA_S] - PSD[CPEA]. Identificación de bandas con ΔPSD significativamente positivo.

Hipótesis falsificable: ΔPSD significativamente positivo (p < 0.05, test de permutaciones) en la banda 0.1–2 Hz, correspondiente a la dinámica semántica de escala de frase/párrafo.

Resumen

El límite del índice tricomponente es su ceguera semántica: CPEA(t) distingue estados neurodinámicos pero no contenidos proposicionales, haciendo indistinguibles trayectorias espectralmente similares con contenido semántico radicalmente distinto.
ICS(t) = [1 + cos(S_t, S_{t-1})] / 2 cuantifica la continuidad semántica temporal como similitud coseno entre embeddings SCL consecutivos, normalizada al intervalo [0,1] para compatibilidad con las componentes existentes.
CPEA_S(t) = [γ_spec · γ_KL · H3 · ICS]^(1/4) es el índice extendido de cuatro componentes, donde la media geométrica garantiza que el colapso en cualquier dominio —incluido el semántico— degrada el índice global.
La propiedad de dominancia del mínimo asegura que ninguna componente alta puede compensar completamente una componente baja: el sistema debe ser coherente en todos sus dominios de forma simultánea.
La sensibilidad diferencial de CPEA_S respecto a ICS diverge cuando ICS(t) → 0, haciendo al índice extremadamente reactivo durante excepciones proposicionales y robusto frente a ruido semántico en condiciones normales.
El índice de desalineamiento combinado Δ_comb(t) = δ_sem(t) · (1 - ICS(t)) detecta la situación más crítica para ORION-AGI: discontinuidad semántica temporal del usuario con simultáneo desalineamiento usuario-sistema.
La calibración adaptativa θ_ICS(t) = μ - 1.5σ sobre ventana móvil de 60 s ajusta dinámicamente el umbral de excepción proposicional al régimen semántico del usuario, evitando tanto falsas alarmas como insensibilidad.
Cuatro perfiles diagnósticos de CPEA_S(t) —disociación espectral-semántica, disociación semántica-espectral, coherencia total, excepción sistémica— permiten caracterizar el estado cognitivo del usuario con una resolución que el índice tricomponente no puede alcanzar.
La especificación de contrato formal garantiza que ICS(t) ∈ [0,1] bajo toda condición, con protocolo de degradación controlada ante embeddings degenerados que preserva la continuidad operativa del pipeline completo.
Cuatro programas de seguimiento experimental con hipótesis falsificables cuantitativas proveen la base empírica para validar ICS(t) como componente legítima del índice CPEA_S(t) y no como extensión ad hoc.

Referencias

Mikolov, T. et al. (2013). Distributed representations of words and phrases and their compositionality. NeurIPS 2013. — Establece que la similitud coseno en espacios de embedding es una métrica semánticamente informativa. Fundamento de la elección de cos(S_t, S_{t-1}) como base de ICS.

Johnson, J. et al. (2019). Billion-scale similarity search with GPUs. IEEE Transactions on Big Data. — Especificación técnica de FAISS, el módulo de memoria episódica de ORION-AGI. La compatibilidad métrica de ICS con FAISS (ambos usan similitud coseno) garantiza coherencia en el pipeline de recuperación semántica.

Devlin, J. et al. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. NAACL 2019. — El espacio latente de BERT es el prototipo del espacio ℝ^d_h donde opera Φ_SCL. Las propiedades geométricas de este espacio —y la superioridad de la similitud coseno sobre la distancia euclidiana en alta dimensión— están bien documentadas en este contexto.

Toneva, M. & Wehbe, L. (2019). Interpreting and improving natural language processing (in machines) with natural language neuroscience. NeurIPS 2019. — Evidencia de que los embeddings de transformers se alinean con actividad neural durante procesamiento lingüístico. Fundamento empírico de que S_t = Φ_SCL(z_SIGMA(t)) es semánticamente informativo.

Friston, K. et al. (2017). Active inference: A process theory. Neural Computation, 29, 1–49. — Marco de inferencia activa que fundamenta los cuatro regímenes operativos de ICS(t) como estados del bucle de minimización de energía libre. La transición entre regímenes es análoga a la modulación de la precisión (ganancia) en inferencia activa.

Hollenstein, N. et al. (2020). ZuCo 2.0. LREC 2020. — Dataset propuesto para los experimentos de validación de ICS(t) durante lectura de texto con control de predictibilidad semántica.

Meyer, L. et al. (2020). EEG encodes perceived speech more than acoustics. NeuroImage. — Evidencia de que el EEG codifica representaciones perceptuales de orden superior, no solo características acústicas. Apoya la viabilidad de extraer ICS(t) semánticamente informativo de la señal EEG procesada por SIGMA-T.

Lomonaco, V. et al. (2021). Avalanche. CVPRW 2021. — El protocolo de degradación controlada de ICS(t) ante embeddings degenerados sigue la convención de manejo de fallos del framework Avalanche integrado en ORION-AGI.

Duchi, J. et al. (2011). Adaptive subgradient methods for online learning. JMLR. — Fundamento del optimizador AdaGrad, variante del optimizador utilizado en la calibración adaptativa de θ_ICS(t) mediante ventana móvil.

Kutas, M. & Federmeier, K.D. (2011). Thirty years and counting: Finding meaning in the N400 component. Annual Review of Psychology, 62, 621–647. — Revisión de 30 años de investigación sobre N400. Confirma que la amplitud del N400 es la medida electrofisiológica más robusta del coste de integración semántica, y por tanto la variable de validación más directa para ICS(t) en los programas de seguimiento.

Archivos del Blog