Formalización de λ(t) — Controlador homeostático de coherencia
Formalización de λ(t) — Controlador homeostático de coherencia
Documento: CPEA-G-λ-1 Corpus Papayaykware · Autor conceptual: Claude · Director: Javi Ciborro
El problema que resuelve
Un λ fijo en Lₜₒₜₐₗ = L_pred + λ·L_coh es un compromiso estático entre dos objetivos que no son estáticos. Durante fases de aprendizaje estable, el sistema no necesita regularización fuerte: la coherencia se mantiene sola. Durante transiciones —nuevos dominios, distributional shift, eventos TAE— la coherencia colapsa y un λ fijo es demasiado débil para protegerla o demasiado fuerte para permitir la reorganización necesaria.
Lo que el sistema necesita es un regulador que observe Γ_G(t) en tiempo real y ajuste la presión de coherencia en función del estado actual. Eso es exactamente lo que hace un controlador homeostático biológico: no mantiene un valor fijo de presión reguladora, sino que responde a la desviación respecto al punto de equilibrio.
Definición formal
Controlador sigmoidal:
λ(t) = λ_max · σ( α · (Γ_thr − Γ_G(t)) )
donde σ(x) = 1 / (1 + e^{−x}) es la función logística estándar, y:
- Γ_thr ∈ (0,1) es el umbral de coherencia objetivo, calibrado empíricamente sobre el dataset de referencia. Valor inicial recomendado: 0.65
- α > 0 es la sensibilidad del controlador: α alto produce respuesta binaria (λ salta de 0 a λ_max abruptamente), α bajo produce respuesta gradual. Rango operativo: α ∈ [2, 10]
- λ_max es el techo de regularización, que limita la presión máxima sobre L_coh para evitar que el sistema entre en régimen de rigidez donde L_pred queda subordinada. Rango recomendado: λ_max ∈ [0.5, 2.0]
Comportamiento resultante:
Cuando Γ_G(t) >> Γ_thr → el argumento de σ es negativo y grande → λ(t) ≈ 0. El sistema optimiza casi exclusivamente L_pred. La coherencia está alta, no necesita presión.
Cuando Γ_G(t) << Γ_thr → el argumento es positivo y grande → λ(t) ≈ λ_max. La regularización de coherencia domina. El sistema entra en modo protección.
Cuando Γ_G(t) ≈ Γ_thr → λ(t) ≈ λ_max/2. Régimen de transición, sensibilidad máxima a pequeñas variaciones de coherencia.
Extensión: controlador con memoria (λ con inercia)
La versión básica responde instante a instante. En presencia de ruido en Γ_G(t) —inevitable con EEG real— esto produce oscilaciones de λ que desestabilizan el entrenamiento. Se introduce inercia mediante un filtro exponencial:
λ̃(t) = β · λ̃(t−1) + (1−β) · λ(t)
donde β ∈ [0.8, 0.95] es el factor de suavizado. El λ efectivo en el backward pass es λ̃(t), no λ(t). Esto es análogo al momentum en optimización de gradiente: reduce la varianza sin introducir sesgo sistemático.
Conexión con TAE
El controlador λ(t) no es solo un mecanismo de regularización. Es un detector implícito de excepción en el sentido TAE. Cuando λ(t) supera un umbral secundario λ_TAE —definible como λ(t) > 0.8·λ_max durante una ventana temporal T_TAE— el sistema puede inferir que Γ_G ha colapsado de forma sostenida: señal de que el sistema ha abandonado su atractor habitual y está en proceso de reorganización.
En ese momento, según la lógica TAE, la respuesta correcta no es forzar el retorno al estado anterior sino permitir la exploración del nuevo régimen. El controlador λ(t) puede implementar esto mediante una válvula de alivio:
Si λ̃(t) > λ_TAE durante T_TAE segundos consecutivos: → activar modo TAE: reducir α temporalmente (suavizar la presión) → registrar el evento en el log de excepciones → permitir que Γ_G(t) explore valores por debajo de Γ_thr sin penalización máxima
Este mecanismo convierte λ(t) en algo más que un hiperparámetro adaptativo: es la interfaz entre el optimizador y la dinámica de aprendizaje excepcional del sistema.
Implementación en SIGMA-T
El controlador se inserta entre la capa de cálculo de Γ_G(t) y la función de coste. En pseudocódigo:
def compute_loss(L_pred, gamma_G, t, state):
# Controlador homeostático
lambda_inst = LAMBDA_MAX * sigmoid(ALPHA * (GAMMA_THR - gamma_G))
# Inercia
state['lambda_smooth'] = BETA * state['lambda_smooth'] + (1 - BETA) * lambda_inst
lambda_eff = state['lambda_smooth']
# Detección de excepción TAE
if lambda_eff > TAE_THRESHOLD:
state['tae_counter'] += 1
if state['tae_counter'] >= TAE_WINDOW:
lambda_eff *= TAE_RELIEF_FACTOR # suaviza presión
log_tae_event(t, gamma_G, lambda_eff)
else:
state['tae_counter'] = 0
# Función de coste compuesta
L_coh = 1.0 - gamma_G
L_total = L_pred + lambda_eff * L_coh
return L_total, lambda_eff, state
# Hiperparámetros por defecto
LAMBDA_MAX = 1.0
ALPHA = 5.0
GAMMA_THR = 0.65
BETA = 0.90
TAE_THRESHOLD = 0.80 # fracción de LAMBDA_MAX
TAE_WINDOW = 50 # pasos de entrenamiento
TAE_RELIEF_FACTOR = 0.4
Protocolo de calibración
Los tres hiperparámetros críticos —Γ_thr, α, λ_max— no son universales. Dependen de la topología del grafo G(t) y del dominio de aplicación. El protocolo de calibración es:
Paso 1 — Caracterizar la distribución base de Γ_G. Correr NEXUS-EEG sobre el conjunto de validación sin función de coste modificada y registrar la distribución empírica de Γ_G(t). El percentil 25 de esa distribución es el candidato natural para Γ_thr: por debajo de ese punto, el sistema ya está en régimen de baja coherencia.
Paso 2 — Barrido de α. Para cada valor α ∈ {2, 4, 6, 8, 10}, entrenar durante 500 pasos y medir la varianza de λ̃(t). Seleccionar el α que produce varianza de λ̃ < 0.05 sin aplanar la curva de respuesta.
Paso 3 — Calibrar λ_max. Fijar α calibrado y barrer λ_max ∈ {0.3, 0.5, 1.0, 1.5, 2.0}. La métrica de selección es el tradeoff entre backward transfer (pérdida catastrófica) y rendimiento en la tarea actual. El punto de inflexión de esa curva es λ_max óptimo.
Paso 4 — Validación cruzada con datos EEG reales. Aplicar los hiperparámetros calibrados sobre los 12 registros anonimizados del corpus NEXUS-EEG v1.0 y verificar que λ̃(t) responde correctamente a transiciones cognitivas conocidas (etiquetadas por anotación conductual).
Comentarios
Publicar un comentario