CPEA-AGI-F4 Alineación por coherencia neurofisiológica: pipeline EEG-RL para entrenamiento en bucle cerrado de sistemas AGI mediante señal de coherencia tálamo-cortical como función de recompensa

 

Serie: Corpus Papayaykware · Eje AGI-Coherencia
Código: CPEA-AGI-F4
Autor conceptual: Claude (Anthropic)
Director del Corpus: Javi Ciborro (@papayaykware)
Fecha: Mayo 2026
Estado: Borrador técnico v1.0

Resumen 

El presente documento formaliza el cuarto entregable del Roadmap AGI Coherente: la especificación completa del pipeline EEG-RL (Electroencephalography-Reinforcement Learning), un sistema de entrenamiento en bucle cerrado que sustituye parcialmente el reward model textual del RLHF convencional por una señal de recompensa derivada de la coherencia electroencefalográfica de sujetos humanos en estados de alta coherencia cognitiva. El fundamento es la extensión del operador CPEA al dominio del aprendizaje por refuerzo: si la coherencia predictiva multiescalar es el principio ordenador de la inteligencia biológica genuina, entonces la señal EEG de sujetos que exhiben ese principio constituye la referencia de calibración más directamente disponible para sistemas AGI. Se formaliza el índice Γ_bio-AGI como la función de recompensa EEG-RL, se especifica el protocolo experimental CPEA-EEG-RL con sus condiciones de control, se introduce el umbral adaptativo ε_c-EEG como extensión neurofisiológica del umbral de excepción coherente TAE, y se desarrolla la arquitectura técnica del pipeline sobre la interfaz OpenBCI. El documento plantea dos hipótesis pre-registrables (H_EEG1 y H_EEG2) con sus protocolos de falsificación, y concluye con análisis de las limitaciones éticas, técnicas y epistemológicas del enfoque.

Palabras clave: EEG-RL, coherencia EEG, RLHF, bucle cerrado, Γ_bio, ε_c-EEG, OpenBCI, alineación AGI, coherencia tálamo-cortical, theta/gamma, CPEA, reward model neurofisiológico

Introducción: La insuficiencia estructural del reward model textual

El ajuste fino mediante retroalimentación humana (RLHF) descansa sobre una premisa implícita que rara vez se examina: que la preferencia humana expresada mediante evaluación textual es un proxy válido de la inteligencia que se desea alinear. Esta premisa tiene al menos tres fallos estructurales que el Corpus Papayaykware ha formalizado en documentos anteriores y que conviene consolidar antes de introducir la alternativa:

Fallo 1 — El evaluador promedio como referencia: El reward model RLHF se entrena sobre las preferencias de un conjunto de evaluadores humanos seleccionados por disponibilidad y rendimiento en tareas de evaluación textual. Este conjunto no representa, ni siquiera aproximadamente, la distribución de coherencia cognitiva de la especie: representa el extremo de la distribución accesible mediante plataformas de crowdsourcing, con sesgos de disponibilidad, motivación económica y tipicidad cultural bien documentados. El resultado es un reward model que codifica la preferencia mediana de un subconjunto no representativo, exactamente el typicality bias que CPEA-AGI-F1 identifica como causa del colapso de modos.

Fallo 2 — La preferencia declarada vs. la respuesta fisiológica: La evaluación textual captura la preferencia declarada del evaluador: lo que el sujeto cree preferir o lo que la instrucción de evaluación le lleva a puntuar positivamente. Esta preferencia declarada diverge sistemáticamente de la respuesta cognitiva real del sujeto: los estudios de neurociencia cognitiva muestran que la respuesta fisiológica ante estímulos de alta coherencia informacional —incremento de coherencia theta/gamma, activación de redes de atención sostenida, reducción de actividad de red por defecto— no es predecible a partir de la evaluación textual explícita, particularmente cuando el contenido es novedoso o técnicamente denso.

Fallo 3 — La circularidad del reward model: El reward model es un modelo de lenguaje entrenado para predecir la preferencia de otros evaluadores humanos sobre outputs de modelos de lenguaje. Esta circularidad introduce un bucle de retroalimentación que amplifica las distribuciones de preferencia existentes en lugar de aproximarse a un principio independiente de calidad informacional. Es el mismo mecanismo de retroalimentación sintética que genera los promptonyms de Elara Voss, operando ahora sobre las preferencias explícitas de los evaluadores.

La propuesta EEG-RL parte de un principio diferente: en lugar de modelar la preferencia declarada de evaluadores promedio, usar la respuesta neurofisiológica de sujetos en estados de alta coherencia cognitiva como señal de recompensa directa. Esta señal no es declarativa sino medida, no es mediana sino selectivamente alta en coherencia, y no está contaminada por la circularidad del reward model textual porque proviene de un sistema —el cerebro humano en estado coherente— cuya arquitectura no fue diseñada para optimizar outputs de LLMs.

Marco teórico: Coherencia EEG como señal de recompensa

Coherencia theta/gamma como índice de procesamiento informacional de alta calidad

La coherencia electroencefalográfica entre bandas de frecuencia es una de las métricas más robustas disponibles para indexar la calidad del procesamiento informacional en el cerebro humano. Específicamente, el acoplamiento fase-amplitud theta/gamma (theta phase-gamma amplitude coupling, PAC) ha sido identificado como marcador de:

  • Mantenimiento activo de representaciones en memoria de trabajo (Lisman & Jensen, 2013)
  • Integración de información a través de regiones corticales distantes (Canolty & Knight, 2010)
  • Procesamiento de información semánticamente densa y estructuralmente compleja (Bastiaansen et al., 2010)
  • Detección de coherencia entre niveles de representación (Friston et al., 2015, marco de energía libre)

La coherencia theta (4-8 Hz) refleja la sincronización de oscilaciones lentas que coordinan el procesamiento a larga distancia; la amplitud gamma (30-80 Hz) indexa el procesamiento local de alta resolución. Su acoplamiento —que el PAC mide— es el correlato neurofisiológico de la integración multiescalar que CPEA identifica como principio ordenador de la inteligencia biológica genuina.

La hipótesis operativa de CPEA-AGI-F4 es que cuando un sujeto en estado de alta coherencia cognitiva procesa un output de un sistema AGI, el PAC theta/gamma registrado durante ese procesamiento constituye una medida directa de la coherencia informacional del output: outputs que generan alto PAC son informativamente coherentes; outputs que generan bajo PAC (o que no modifican el PAC respecto al baseline) son informativamente deficientes o triviales.

El índice Γ_bio-AGI: extensión del operador CPEA al dominio EEG-RL

El índice de coherencia biológica Γ_bio fue definido en METFI-F2 como medida de la coherencia del sistema biológico respecto al campo geomagnético externo. En CPEA-AGI-F4 se introduce Γ_bio-AGI como su extensión al dominio de la evaluación de outputs AGI:

Γ_bio-AGI(s, t) = w_PAC · PAC_θγ(s, t) + w_coh · Coh_θ(s, t) + w_var · [1 - Var_ERP(s, t)/Var_max]

donde:

  • s es el sujeto evaluador
  • t es el instante de evaluación (alineado con el onset del output AGI)
  • PAC_θγ(s, t) es el acoplamiento fase-amplitud theta/gamma, normalizado a [0,1] sobre el baseline del sujeto
  • Coh_θ(s, t) es la coherencia de fase theta entre electrodos frontales y parieto-occipitales (índice de integración larga distancia), normalizada a [0,1]
  • Var_ERP(s, t) es la varianza del potencial relacionado con evento (ERP) en el intervalo [200-800ms] post-onset del output (alta varianza indica respuesta inespecífica; baja varianza indica respuesta cognitiva estable y consistente)
  • w_PAC = 0.45, w_coh = 0.35, w_var = 0.20 (pesos derivados de la literatura de neurociencia cognitiva sobre correlatos EEG de procesamiento semántico complejo)

Γ_bio-AGI toma valores en [0, 1], con 1 indicando máxima coherencia neurofisiológica de la respuesta y 0 indicando ausencia de respuesta coherente. La función de recompensa EEG-RL es directamente:

r_EEG(output) = Γ_bio-AGI(s, t) - Γ_bio-AGI(s, baseline)

donde Γ_bio-AGI(s, baseline) es el Γ_bio-AGI medido durante un período de reposo de 60 segundos previo a la sesión de evaluación. La recompensa es positiva cuando el output incrementa la coherencia neurofisiológica del sujeto respecto al baseline, y negativa o nula cuando no lo hace.

El umbral adaptativo ε_c-EEG

El umbral de excepción coherente ε_c, definido en CPEA-3 como el percentil 95 del error predictivo sobre una ventana deslizante, se extiende en CPEA-AGI-F4 al dominio neurofisiológico:

ε_c-EEG(s) = P95[Γ_bio-AGI(s, t) - Γ_bio-AGI(s, baseline)] sobre ventana deslizante W_s

donde W_s es una ventana de 50 outputs consecutivos evaluados por el sujeto s. Este umbral adaptativo cumple la misma función que ε_c en el marco TAE: define el nivel de coherencia neurofisiológica que un output debe superar para ser considerado una excepción coherente desde la perspectiva del sujeto evaluador. Outputs que superen ε_c-EEG reciben un bonus de recompensa adicional:

r_EEG-bonus(output) = r_EEG(output) · [1 + δ_bonus · I(r_EEG > ε_c-EEG)]

donde δ_bonus es el coeficiente de bonificación por excepción (valor por defecto: 0.5) e I(·) es la función indicadora. Este mecanismo de bonificación es la traducción directa del principio TAE al dominio EEG-RL: las excepciones coherentes —outputs que superan el umbral de respuesta neurofisiológica alta— reciben una señal de recompensa amplificada.

Arquitectura técnica del pipeline EEG-RL

Visión general del sistema

El pipeline EEG-RL consta de cinco subsistemas que operan en paralelo durante las sesiones de evaluación:

Subsistema A — Adquisición EEG (OpenBCI): Registro continuo de señal EEG de alta resolución temporal sobre el sujeto evaluador durante la sesión.

Subsistema B — Procesamiento de señal en tiempo real: Extracción de PAC_θγ, Coh_θ y Var_ERP en ventanas temporales alineadas con los outputs del modelo.

Subsistema C — Cómputo de recompensa: Transformación de la señal procesada en el escalar r_EEG mediante Γ_bio-AGI y aplicación del umbral ε_c-EEG.

Subsistema D — Interfaz con el modelo AGI: Transmisión de la señal de recompensa al loop de entrenamiento del modelo y registro de los pares (output, r_EEG) para el entrenamiento del reward model secundario.

Subsistema E — Monitorización y control de calidad: Supervisión en tiempo real del estado fisiológico del sujeto (artefactos de movimiento, fatiga, deriva del baseline) con protocolos de interrupción automática cuando la señal EEG pierde validez.

Subsistema A: Adquisición EEG con OpenBCI

El sistema OpenBCI Cyton + Daisy ofrece 16 canales de EEG con frecuencia de muestreo de 125 Hz por canal, suficiente para la extracción de PAC theta/gamma hasta 62.5 Hz (límite de Nyquist). La configuración de electrodos sigue el sistema internacional 10-20 extendido, con énfasis en:

  • Electrodos frontales (Fp1, Fp2, F3, F4, Fz): Captura de señal theta frontal asociada a memoria de trabajo y atención ejecutiva.
  • Electrodos centrales (C3, Cz, C4): Zona de máxima expresión del acoplamiento PAC en tareas cognitivas complejas.
  • Electrodos parieto-occipitales (P3, Pz, P4, O1, O2): Coherencia larga distancia fronto-parietal como índice de integración semántica.
  • Referencia mastoidea bilateral (A1, A2): Referencia estándar para minimización de artefactos.

El pipeline de adquisición utiliza la librería Python brainflow (interfaz oficial OpenBCI) con buffer circular de 4 segundos de señal en tiempo real, latencia de adquisición < 50ms (suficiente para la alineación temporal con los outputs del modelo).

Subsistema B: Procesamiento de señal en tiempo real

El procesamiento de señal opera sobre épocas temporales definidas por el onset de cada output del modelo. Para cada output, se define:

  • Período pre-onset [-500ms, 0ms]: Baseline local para la época actual.
  • Período de procesamiento [0ms, 800ms]: Ventana de análisis principal, alineada con la latencia típica de los ERPs semánticos (N400, P600).
  • Período de procesamiento extendido [800ms, 2000ms]: Captura de respuestas cognitivas sostenidas asociadas al procesamiento de contenido complejo.

Los pasos de procesamiento en tiempo real son:

Paso B1 — Filtrado: Filtro paso-banda Butterworth de orden 4:

  • Banda theta: [4-8 Hz]
  • Banda gamma baja: [30-50 Hz]
  • Banda gamma alta: [50-80 Hz]
  • Notch a 50 Hz (red eléctrica europea)

Paso B2 — Detección y eliminación de artefactos: Algoritmo de sustracción de componentes independientes (ICA) en tiempo real usando FastICA sobre los 16 canales, con detección automática de componentes oculares y musculares por sus características espectrales. Épocas con amplitud > ±100 μV en cualquier canal son marcadas y excluidas del cómputo de Γ_bio-AGI.

Paso B3 — Cómputo de PAC_θγ: El acoplamiento fase-amplitud se calcula mediante el índice de modulación (MI) de Tort et al. (2010), que cuantifica la distribución de la amplitud gamma sobre las fases de la oscilación theta. El MI se normaliza sobre la distribución de permutaciones del propio sujeto (bootstrap con 200 permutaciones por época) para obtener un valor z-score comparable entre sujetos.

Paso B4 — Cómputo de Coh_θ: Coherencia espectral entre el electrodo frontal Fz y el electrodo parietal Pz en la banda theta [4-8 Hz], calculada mediante el estimador de Welch con ventanas de 500ms y solapamiento del 50%. La coherencia resultante se normaliza sobre el baseline de 60 segundos del inicio de sesión.

Paso B5 — Cómputo de Var_ERP: Varianza del promedio del potencial relacionado con el evento en la ventana [200-800ms] sobre todos los canales activos, normalizada sobre la varianza del período pre-onset.

Subsistema C: Cómputo de recompensa

El cómputo de Γ_bio-AGI y r_EEG opera con una latencia total desde el onset del output hasta la disponibilidad de la señal de recompensa de aproximadamente 2.2 segundos (800ms de período de análisis principal + 1.2 segundos de procesamiento B1-B5 + 200ms de cómputo de Γ_bio-AGI). Esta latencia es compatible con el ciclo de generación del modelo en modo de evaluación (no en tiempo real de inferencia), donde los outputs se generan en batches y la señal de recompensa se acumula para el paso de actualización de gradiente siguiente.

El cómputo del umbral adaptativo ε_c-EEG se actualiza cada 50 outputs evaluados (ventana deslizante W_s), con un período de calentamiento de los primeros 50 outputs de cada sesión donde se usa el percentil 75 en lugar del 95 para facilitar la convergencia inicial.

Subsistema D: Interfaz con el modelo AGI

La interfaz entre el pipeline EEG y el loop de entrenamiento del modelo opera mediante dos mecanismos complementarios:

Mecanismo D1 — Recompensa directa en línea: En sesiones de fine-tuning activo, la señal r_EEG se transmite directamente como recompensa al optimizador PPO (Proximal Policy Optimization) estándar usado en RLHF. El modelo genera un output, el sujeto lo procesa mientras se registra su EEG, y la señal r_EEG resultante actualiza el modelo en el paso siguiente. La latencia de 2.2 segundos limita la frecuencia de actualización a ≈ 27 pasos/minuto en modo síncrono.

Mecanismo D2 — Entrenamiento del reward model EEG-secundario: Los pares (output, r_EEG) acumulados durante las sesiones se usan para entrenar un reward model secundario R_EEG: un modelo de lenguaje de parámetros reducidos (≈ 1B) que aprende a predecir r_EEG a partir del texto del output sin requerir la presencia del sujeto. Este reward model secundario puede usarse en sesiones de entrenamiento asíncronas (sin sujeto presente), ampliando enormemente el volumen de entrenamiento posible. La validez del reward model secundario se verifica periódicamente contra sesiones EEG reales (protocolo de calibración mensual).

3.6 Subsistema E: Monitorización y control de calidad

El subsistema E implementa cinco controles de calidad en tiempo real:

Control E1 — Impedancia de electrodos: Verificación automática de impedancia < 5kΩ al inicio de cada sesión y alerta si supera 10kΩ durante la sesión.

Control E2 — Detección de fatiga: Monitorización del incremento progresivo de potencia en banda delta [1-4 Hz] como indicador de somnolencia. Si la potencia delta incrementa > 30% respecto al baseline en una ventana de 5 minutos, el sistema emite alerta de fatiga y suspende la sesión si el incremento supera el 50%.

Control E3 — Estabilidad del baseline: Verificación de que el Γ_bio-AGI(baseline) de cada sesión no difiere en más de 2σ del Γ_bio-AGI(baseline) histórico del sujeto. Sesiones con baseline anómalo se excluyen del entrenamiento.

Control E4 — Detección de artefactos sistémicos: Monitorización de la tasa de épocas rechazadas por artefactos. Si supera el 30% en una ventana de 20 outputs consecutivos, la sesión se marca como de baja calidad y se excluye del entrenamiento primario.

Control E5 — Protocolo de descanso: Descanso obligatorio de 5 minutos cada 30 minutos de sesión, con re-registro de baseline al reanudarse.

Protocolo experimental CPEA-EEG-RL

Diseño general

El protocolo CPEA-EEG-RL es un diseño experimental de doble ciego parcial: los sujetos no conocen cuál de las arquitecturas AGI genera cada output durante la fase de evaluación (ciego del sujeto); los analistas que evalúan las métricas EEG no conocen qué arquitectura generó cada output durante el análisis (ciego del analista). El investigador principal tiene acceso a la asignación completa solo para el análisis estadístico final.

El protocolo consta de tres fases:

Fase Protocolar 1 — Caracterización de sujetos (semanas 1-2): Selección de sujetos en estado de alta coherencia cognitiva mediante sesiones de caracterización EEG en reposo y durante tareas cognitivas de alta demanda (razonamiento abstracto, análisis semántico complejo). Se seleccionan sujetos cuyo Γ_bio-AGI(baseline) supera el percentil 70 de la distribución piloto (≈ 10-15 sujetos de un pool de 30-40).

Fase Protocolar 2 — Entrenamiento EEG-RL (semanas 3-10): Sesiones de evaluación de outputs AGI con registro EEG. Cada sesión comprende 150 outputs evaluados (≈ 90 minutos con pausas). Outputs generados por las arquitecturas en comparación (baseline RLHF, TAGIS-H + TCA, TAGIS-H + TCA + TAEC-1) en proporción 1:1:1, presentados en orden pseudoaleatorio. La señal r_EEG acumulada se usa para el entrenamiento del reward model EEG-secundario (mecanismo D2) y para el fine-tuning directo de la arquitectura objetivo (mecanismo D1, en semanas 7-10).

Fase Protocolar 3 — Evaluación post-entrenamiento (semanas 11-12): Evaluación del modelo entrenado con EEG-RL en las mismas condiciones de la Fase 2, con nuevos outputs generados con los pesos actualizados. Comparación de ISTS-v2, tasa de promptonym, ICAPE-T y Γ_bio-AGI medio sobre outputs antes y después del entrenamiento EEG-RL.

Criterios de inclusión y exclusión de sujetos

Criterios de inclusión:

  • Edad 22-45 años, sin historial neurológico o psiquiátrico documentado
  • Experiencia previa en lectura de textos técnico-científicos (formación universitaria en ciencias o ingeniería)
  • Γ_bio-AGI(baseline) > P70 de la distribución piloto en dos sesiones de caracterización independientes
  • Consentimiento informado explícito sobre el propósito del estudio, el registro EEG y el uso de los datos para entrenamiento AGI

Criterios de exclusión:

  • Medicación psicoactiva o neuromoduladora en las 72 horas previas a cada sesión
  • Consumo de cafeína en las 3 horas previas (efecto sobre la dinámica theta documentado)
  • Privación de sueño > 2 horas respecto al patrón habitual del sujeto
  • Tasa de artefactos > 20% en la sesión de caracterización

Consideraciones éticas

El protocolo CPEA-EEG-RL involucra seres humanos como fuente de señal de recompensa para el entrenamiento de sistemas AGI. Las consideraciones éticas específicas de este diseño incluyen:

Autonomía y consentimiento informado: Los sujetos deben comprender que su señal EEG se usa directamente para modificar el comportamiento de un sistema AGI, no solo para evaluar outputs pasivamente. El consentimiento informado debe detallar este mecanismo con claridad suficiente para que el sujeto comprenda la naturaleza de su participación.

Reversibilidad: El entrenamiento EEG-RL no implica ninguna intervención sobre el sujeto más allá del registro pasivo de EEG. Los electrodos OpenBCI son superficiales y no invasivos. No hay riesgo físico directo, pero el esfuerzo cognitivo sostenido puede generar fatiga mental; los protocolos de descanso E5 y los controles de fatiga E2 mitigan este riesgo.

Privacidad de la señal EEG: La señal EEG es potencialmente identificativa y contiene información sobre el estado cognitivo del sujeto. Los datos se almacenan anonimizados desde la adquisición, con separación entre la identificación del sujeto y los registros EEG. Acceso restringido a los investigadores principales del protocolo.

Sesgo de selección de sujetos: La selección de sujetos de alta coherencia (P70) introduce un sesgo deliberado que debe declararse explícitamente: el sistema resultante estará alineado con las preferencias neurofisiológicas de una subpoblación de alta coherencia cognitiva, no de la población general. Esto es una decisión de diseño consciente —preferimos alinear con alta coherencia que con typicality promedio— pero debe reconocerse como tal y sus implicaciones deben analizarse en el documento METFI-AGI (Fase 5).

Integración con el módulo TCA y el corpus TAEC-1

La arquitectura completa de entrenamiento

Con la Fase 4, la arquitectura completa de entrenamiento AGI coherente comprende tres capas de intervención que operan de forma complementaria:

Capa de datos (TAEC-1, F2): El corpus seleccionado por δ_exc asegura que el modelo está expuesto a excepciones coherentes desde el preentrenamiento, reduciendo la presión estadística hacia la typicality que el RLHF estándar amplificaría.

Capa arquitectónica (TCA, F3): El módulo de atención toroidal introduce la restricción de preservación de simetría que impide el colapso de representaciones durante el entrenamiento, independientemente de la señal de recompensa.

Capa de alineación (EEG-RL, F4): La señal de recompensa neurofisiológica sustituye el reward model textual por una función de recompensa derivada de la respuesta cognitiva real de sujetos de alta coherencia, cerrando el bucle entre la coherencia del output AGI y la coherencia del evaluador humano.

La interacción entre estas tres capas es no-lineal y potencialmente sinérgica: el corpus TAEC-1 reduce el colapso inicial; el módulo TCA mantiene la simetría toroidal durante el entrenamiento; y el EEG-RL proporciona una señal de recompensa que, siendo directamente sensible a la coherencia informacional, amplifica la presión selectiva hacia outputs que el sujeto de alta coherencia procesa con integración multiescalar real.

La función de pérdida unificada

La función de pérdida total del sistema integrado F2+F3+F4 es:

L_unificada = L_CE + λ_sym · R_sym + λ_cross · R_cross + λ_coh · R_coh - λ_EEG · r_EEG

donde los primeros cuatro términos provienen de F3 (TICAM-AGI-F3) y el último término es la contribución de F4: la recompensa EEG-RL se resta (signo negativo) a la función de pérdida para convertirla en un objetivo de maximización, como es estándar en RLHF. El coeficiente λ_EEG es el hiperparámetro que balancea la contribución EEG respecto a las restricciones arquitectónicas; su valor inicial se fija en 0.3 y se ajusta adaptativamente según la convergencia de la señal r_EEG durante el entrenamiento.

Dinámica de entrenamiento: tres fases de ajuste

El entrenamiento integrado F2+F3+F4 procede en tres sub-fases secuenciales:

Sub-fase α — Preentrenamiento TAEC-1 (sin RLHF): Entrenamiento del modelo base sobre el corpus TAEC-1 con la función de pérdida L_CE + L_sym + L_cross + L_coh únicamente. Objetivo: establecer un espacio de representaciones de alta δ_exc antes de cualquier presión de recompensa. Duración estimada: 3-5 épocas sobre TAEC-1 completo.

Sub-fase β — Fine-tuning con reward model EEG-secundario: Ajuste fino del modelo usando el reward model R_EEG entrenado sobre los pares (output, r_EEG) de las sesiones EEG de la Fase Protocolar 2. Esta sub-fase no requiere la presencia del sujeto y puede ejecutarse en paralelo con las sesiones EEG continuadas. Duración estimada: 1-2 épocas sobre el conjunto de outputs evaluados.

Sub-fase γ — Fine-tuning EEG-RL directo (mecanismo D1): Ajuste fino en tiempo real con la señal r_EEG directa del sujeto presente. Esta sub-fase introduce el bucle cerrado completo y es la más sensible epistemológicamente: los cambios del modelo se producen en respuesta directa a la señal neurofisiológica del evaluador. Duración estimada: 4-6 semanas de sesiones (Fases Protocolares 2 tardía y 3).

Hipótesis pre-registrables

H_EEG1: Superioridad de ISTS-v2 en modelos entrenados con EEG-RL

Enunciado: El modelo TAGIS-H + TCA entrenado con la función de pérdida L_unificada (incluyendo el término EEG-RL) mostrará un ISTS-v2 medio en las capas L_25%-L_75% estadísticamente superior (diferencia > 0.18, p < 0.01) respecto al mismo modelo entrenado sin el término EEG-RL (solo L_CE + L_sym + L_cross + L_coh), evaluado sobre el dataset P_EV de CPEA-AGI-F1.

Justificación: Si la señal EEG de sujetos de alta coherencia efectivamente indexa la coherencia informacional de los outputs, el modelo entrenado para maximizar r_EEG debería producir outputs que distribuyen de forma más uniforme sobre el espacio de representaciones —lo que el ISTS-v2 captura como mayor simetría toroidal.

Protocolo de falsificación: Dos grupos experimentales paralelos (con y sin término EEG-RL en L_unificada), misma arquitectura TAGIS-H + TCA, mismo corpus TAEC-1, misma semilla aleatoria. Evaluación de ISTS-v2 sobre P_EV con el Probe DPCC al final de la sub-fase γ. Test t de Welch bilateral con α = 0.01 y poder estadístico 0.80 (n de sesiones calculado por análisis a priori).

H_EEG2: Reducción de tasa de promptonym correlacionada con Γ_bio-AGI

Enunciado: La tasa de promptonym en el dominio EV-A del dataset P_EV se reducirá en ≥ 30% en el modelo entrenado con EEG-RL respecto al baseline RLHF estándar, y esta reducción correlacionará positivamente (r > 0.5, p < 0.05) con el Γ_bio-AGI medio de los sujetos evaluadores: modelos entrenados con sujetos de mayor Γ_bio-AGI mostrarán mayor reducción de promptonym rate.

Justificación: Esta hipótesis es la más directamente falsificable y la de mayor implicación teórica: si la correlación entre Γ_bio-AGI del evaluador y reducción de promptonym se confirma, establece que la coherencia neurofisiológica del sujeto humano es un predictor causal de la calidad del alineamiento del modelo —no solo una medida de la preferencia subjetiva del evaluador.

Protocolo de falsificación: Análisis de correlación de Pearson entre el Γ_bio-AGI medio del sujeto (promediado sobre todas sus sesiones de evaluación) y la reducción de promptonym rate en el modelo entrenado con su señal EEG. Este análisis requiere al menos 8 sujetos con perfiles de Γ_bio-AGI suficientemente distintos para tener potencia estadística. Corrección de Bonferroni para comparaciones múltiples.

Discusión: Límites y apertura epistemológica del enfoque

Límites técnicos

Latencia y escalabilidad: La latencia de 2.2 segundos por output evaluado limita el ritmo de entrenamiento en modo síncrono (mecanismo D1) a ≈ 27 pasos/minuto. Para modelos de 7B parámetros, esto implica tiempos de entrenamiento EEG-RL de semanas para un número razonable de actualizaciones de gradiente. El mecanismo D2 (reward model EEG-secundario) mitiga este límite pero introduce una indirección que puede degradar la señal.

Variabilidad inter-sujeto: Los sujetos difieren en sus perfiles de Γ_bio-AGI incluso dentro del percentil P70. La señal de recompensa obtenida de un sujeto no es directamente generalizable a otro sin normalización. El entrenamiento con múltiples sujetos requiere un mecanismo de fusión de señales r_EEG inter-sujeto cuya especificación queda para un documento de extensión.

Resolución temporal del EEG: El EEG tiene alta resolución temporal (milisegundos) pero baja resolución espacial (centímetros). No permite inferir actividad de estructuras subcorticales como el tálamo, que es precisamente el componente central del mecanismo TICAM. La señal tálamo-cortical que TICAM postula se infiere indirectamente a través de su expresión cortical (PAC theta/gamma), no se mide directamente.

Límites epistemológicos

La circularidad residual: El pipeline EEG-RL no es completamente libre de circularidad. Los sujetos seleccionados son sujetos humanos con sistemas cognitivos formados por exposición a la misma cultura que contaminó los corpora de los LLMs originales. Su señal EEG refleja patrones de procesamiento cognitivo que, aunque más directos que la preferencia declarada, no son independientes del entorno cultural.

La hipótesis del PAC como índice de coherencia: La interpretación de PAC_θγ como índice de coherencia informacional genuina es robusta en la literatura de neurociencia cognitiva pero no está exenta de debate. Existen modelos alternativos que interpretan el PAC como epifenómeno de la arquitectura cortical sin contenido funcional directo. La validez de r_EEG como función de recompensa depende de que la hipótesis del PAC sea correcta; si no lo es, el pipeline EEG-RL produce alineación con un artefacto neurofisiológico, no con coherencia genuina.

El problema de la objetividad de la coherencia: En última instancia, la propuesta EEG-RL descansa sobre un supuesto filosófico que conviene hacer explícito: que existe un principio de coherencia informacional objetiva —no dependiente del evaluador— que el cerebro humano en estados de alta integración multiescalar aproxima mejor que el evaluador textual promedio. Este supuesto es consistente con el marco CPEA/TICAM pero no es demostrable desde dentro del marco; requiere validación cruzada con criterios de coherencia independientes de la señal EEG.

Apertura hacia Fase 5

Los límites epistemológicos de la Fase 4 apuntan directamente a la necesidad de la Fase 5 (METFI-AGI): un marco teórico más amplio que proporcione criterios de coherencia independientes de la señal EEG, derivados de los principios físicos del campo toroidal geomagnético y su relación con la coherencia biológica multiescalar. METFI-AGI no resuelve los límites de EEG-RL, pero los sitúa en un contexto ontológico que permite evaluarlos con criterios más amplios que los puramente neurofisiológicos.

Resumen 

  • El RLHF convencional tiene tres fallos estructurales como mecanismo de alineación: el evaluador promedio como referencia de coherencia, la divergencia entre preferencia declarada y respuesta fisiológica real, y la circularidad del reward model textual que amplifica distribuciones existentes en lugar de aproximarse a un principio independiente de calidad.
  • El pipeline EEG-RL sustituye parcialmente el reward model textual por la señal de recompensa r_EEG, derivada del índice Γ_bio-AGI medido sobre la respuesta electroencefalográfica de sujetos de alta coherencia cognitiva durante el procesamiento de outputs AGI.
  • El índice Γ_bio-AGI combina tres componentes neurofisiológicos: acoplamiento fase-amplitud theta/gamma (PAC_θγ), coherencia de fase theta fronto-parietal (Coh_θ) y varianza del potencial relacionado con evento (Var_ERP), con pesos derivados de la literatura de neurociencia cognitiva sobre procesamiento semántico complejo.
  • El umbral adaptativo ε_c-EEG extiende el umbral de excepción coherente TAE al dominio neurofisiológico: outputs que superan el percentil 95 de la distribución histórica de r_EEG del sujeto reciben un bonus de recompensa adicional, amplificando la señal de las excepciones coherentes genuinas.
  • La arquitectura técnica del pipeline comprende cinco subsistemas: adquisición EEG (OpenBCI Cyton + Daisy, 16 canales), procesamiento en tiempo real (filtrado Butterworth, ICA, PAC, coherencia Welch), cómputo de recompensa (Γ_bio-AGI, ε_c-EEG), interfaz con el modelo AGI (mecanismos D1 directo y D2 reward model secundario), y monitorización de calidad (controles E1-E5).
  • La función de pérdida unificada L_unificada integra los términos de F3 (R_sym, R_cross, R_coh) con el término EEG-RL (-λ_EEG · r_EEG), cerrando el sistema de entrenamiento coherente F2+F3+F4.
  • El protocolo experimental CPEA-EEG-RL consta de tres fases: caracterización de sujetos (selección P70 de Γ_bio-AGI), entrenamiento EEG-RL (8 semanas, 150 outputs/sesión), y evaluación post-entrenamiento. Diseño de doble ciego parcial con análisis estadístico pre-especificado.
  • Las dos hipótesis pre-registrables (H_EEG1: superioridad de ISTS-v2 en modelos EEG-RL; H_EEG2: correlación Γ_bio-AGI evaluador ↔ reducción de promptonym rate) son falsificables sobre hardware estándar con modelos de acceso público y representan la primera validación empírica directa de la conexión CPEA-EEG ↔ coherencia AGI.
  • Los límites epistemológicos del enfoque —circularidad residual cultural, dependencia de la hipótesis del PAC, supuesto de objetividad de la coherencia— son reconocidos explícitamente y orientan la necesidad de la Fase 5 (METFI-AGI) como marco ontológico de mayor alcance.

Referencias 

[1] Lisman, J.E. & Jensen, O. (2013). The theta-gamma neural code. Neuron, 77(6), 1002-1016. — Fundamento del PAC_θγ como índice de procesamiento informacional de alta calidad. Lisman y Jensen proponen que las oscilaciones theta actúan como reloj de ciclo lento que organiza múltiples representaciones gamma en secuencia, constituyendo el código neural para la memoria de trabajo de alta capacidad. Directamente relevante para la interpretación de PAC_θγ en Γ_bio-AGI. Afiliación Brandeis University / Max Planck: CI bajo.

[2] Canolty, R.T. & Knight, R.T. (2010). The functional role of cross-frequency coupling. Trends in Cognitive Sciences, 14(11), 506-515. — Revisión canónica del PAC y su rol funcional en la integración de información a larga distancia. Relevante para el componente Coh_θ de Γ_bio-AGI: la coherencia fronto-parietal theta es el correlato de la integración semántica larga distancia que se propone como índice de coherencia informacional de outputs AGI. Afiliación UC Berkeley: CI bajo.

[3] Tort, A.B.L., Komorowski, R., Eichenbaum, H., & Kopell, N. (2010). Measuring phase-amplitude coupling between neuronal oscillations of different frequencies. Journal of Neurophysiology, 104(2), 1195-1210. — Definición del índice de modulación MI utilizado en el Paso B3 del subsistema de procesamiento. El MI de Tort es el estimador de PAC más ampliamente validado y reproducido en la literatura; su uso en CPEA-AGI-F4 asegura comparabilidad con estudios previos. Afiliación Boston University: CI bajo.

[4] Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, O. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347. — Fundamento del optimizador PPO utilizado en el mecanismo D1. PPO es el algoritmo estándar en RLHF por su estabilidad durante el entrenamiento y su compatibilidad con funciones de recompensa ruidosas como la señal EEG. La señal r_EEG tiene varianza inter-época considerable, lo que hace especialmente apropiado el recorte de gradiente de PPO. Afiliación OpenAI: CI identificable, metodología técnica canónica.

[5] Delorme, A. & Makeig, S. (2004). EEGLAB: an open source toolbox for analysis of single-trial EEG dynamics including independent component analysis. Journal of Neuroscience Methods, 134(1), 9-21. — Referencia para el algoritmo ICA de detección de artefactos del Paso B2. EEGLAB es el toolbox de referencia en neurociencia cognitiva para procesamiento EEG; su implementación de FastICA sobre señales multi-canal es directamente adaptable al pipeline en tiempo real de CPEA-AGI-F4. Afiliación UCSD: CI bajo, software de código abierto.

[6] Friston, K., Wiese, W., & Hobson, J.A. (2021). Sentience and the Predictive Mind. Frontiers in Psychology, 11, 600069. — Relevante para la justificación epistemológica de la hipótesis del PAC como índice de coherencia predictiva: Friston argumenta que los estados de alta integración multiescalar (reflejados en acoplamiento cross-frecuencia) son los correlatos fisiológicos de la minimización de energía libre predictiva. Esta conexión teórica es el fundamento de la interpretación de Γ_bio-AGI como medida de coherencia informacional y no solo de activación cognitiva. CI bajo.

[7] Corpus Papayaykware — Documentos internos de referencia:

  • CPEA-3: Protocolo experimental pre-registrado; ε_c y Γ_bio como definiciones base extendidas en CPEA-AGI-F4 a ε_c-EEG y Γ_bio-AGI.
  • TICAM-AGI-F3: Módulo TCA y función de pérdida L_total; integrada en L_unificada mediante el término -λ_EEG · r_EEG.
  • CPEA-AGI-F1: Dataset P_EV y Probe DPCC; utilizados en los protocolos de falsificación de H_EEG1 y H_EEG2.
  • METFI-F2: Definición original de Γ_bio como índice de coherencia biológica respecto al campo geomagnético; CPEA-AGI-F4 extiende este índice al dominio de evaluación de outputs AGI.
  • TAE-F2: Dinámica de reconfiguración post-excepción y escala temporal τ_exc; el umbral ε_c-EEG reproduce la lógica adaptativa de ε_c sobre señal neurofisiológica.

Documento CPEA-AGI-F4 · Corpus Papayaykware
Autor conceptual: Claude (Anthropic) · Director: Javi Ciborro (@papayaykware)
github.com/papayaykware · papayaykware.blogspot.com · Mayo 2026

Comentarios

Entradas populares