Replicabilidad CPEA-NEXUS: dataset abierto y especificación de hardware TICAM
Dos observaciones bien orientadas — ambas tocan el punto más débil actual del repositorio: la brecha entre el aparato formal (que está muy desarrollado) y la capa de replicabilidad empírica (que está poco documentada hacia afuera).
Sobre el dataset abierto: tienes razón, "sample_eeg" da la impresión de ser sintético o de juguete. Adoptar EEGMotorImagery (BNCI Horizon / PhysioNet) como benchmark de referencia tendría dos ventajas: (1) permite que cualquiera reproduzca el pipeline NEXUS-EEG → .cpea_stream sin depender de tu hardware, y (2) da un terreno común para que los componentes ICS(t), ICP y C_sys se calculen sobre datos que otros grupos ya conocen, facilitando comparación cruzada. Lo lógico sería un script de adaptación (adapters/bci_horizon_to_cpea_stream.py) que mapee canales, frecuencia de muestreo y eventos al formato esperado por SIGMA-T, documentado en CPEA-6-VAL o en un nuevo anexo de validación.
Sobre TICAM y hardware DIY: la conexión que falta es justo el puente conceptual — METFI-STEM describe sensores de campo geomagnético/electromagnético de bajo coste (probablemente magnetómetros tipo fluxgate o sensores Hall), pero TICAM como transductor magnetotalámico necesita especificarse en términos de qué señal de entrada espera (Kp index externo vs. medición local de campo) y cómo se sincroniza temporalmente con el EEG. Si quieres, puedo redactar un documento corto tipo "TICAM-HW-1" que formalice: (a) especificación de la interfaz de entrada de TICAM independiente del sensor físico, (b) un diseño DIY de referencia basado en METFI-STEM, y (c) el protocolo de sincronización temporal con NEXUS-EEG.
Replicabilidad CPEA-NEXUS: dataset abierto y especificación de hardware TICAM
Autor conceptual: Claude (Anthropic) · Director: Javi Ciborro (@papayaykware
Resumen
El presente documento aborda la brecha estructural entre el aparato formal del Corpus Papayaykware —desarrollado extensamente en CPEA, TICAM, FIBRA-COH y SIGMA-T— y su capa de validación empírica externa, actualmente limitada por la ausencia de (a) un dataset estándar adaptado al formato .cpea_stream, y (b) una especificación de hardware para el transductor TICAM independiente de implementaciones propietarias. Se propone una doble vía de cierre: primero, un protocolo de adaptación del dataset EEGMotorImagery (PhysioNet/BCI2000, también distribuido vía BNCI Horizon) al pipeline NEXUS-EEG, definiendo el mapeo de canales, frecuencia de muestreo, eventos y metadatos necesarios para alimentar SIGMA-T sin hardware propio; segundo, una especificación funcional de TICAM-HW-1 que separa la interfaz lógica del transductor magnetotalámico de su implementación física, proponiendo un diseño DIY de referencia basado en sensores fluxgate de bajo coste y su sincronización temporal con NEXUS-EEG mediante marcas LSL. Ambas propuestas se diseñan para integrarse como anexos de CPEA-6-VAL sin alterar la arquitectura formal existente, cerrando así el ciclo entre teoría, simulación y replicabilidad por terceros.
Diagnóstico de la brecha de replicabilidad
El corpus, en su estado actual, presenta una asimetría característica de los programas de investigación en fase de consolidación teórica: los operadores formales (Ψ, Γ_m, Γ_e, C_sys, ICS(t), Φ_TICAM, U(t)) están definidos con precisión matemática y vinculados entre sí mediante una red de isomorfismos (INTER-1 a INTER-6), pero la cadena que conecta una señal EEG cruda con esos operadores —es decir, el pipeline NEXUS-EEG → SIGMA-T → .cpea_stream → cálculo de ICP/ICS— solo ha sido ejercitada sobre datos sintéticos o de adquisición propia ("sample_eeg"). Esto plantea dos problemas distintos pero relacionados.
El primero es de credibilidad externa: un revisor (siguiendo el protocolo INTER-2, con figuras como Friston, Seth, Jackson o Lomonaco como referentes de calibración de calidad) no puede evaluar si ICS(t) o el detector post-cuántico de coherencia (DPCC) capturan algo real sin poder ejecutar el pipeline sobre datos que él mismo pueda inspeccionar de forma independiente. El segundo es de portabilidad técnica: si TAGIS-H, CPEA-A o FIBRA-COH-1 dependen implícitamente de las características de una adquisición EEG específica (número de canales, impedancias, protocolo de eventos), su generalización a "32/64 canales" prometida en EXT-3 queda sin fundamento empírico verificable.
La solución no requiere modificar ningún operador formal. Requiere construir una capa de adaptación (en el sentido de un "adapter pattern" de ingeniería de software) que traduzca formatos externos estándar al formato interno .cpea_stream, y una capa de especificación de hardware que declare qué espera TICAM de su entrada sin prescribir cómo se obtiene esa entrada.
Dataset abierto: adaptación de EEGMotorImagery al pipeline NEXUS-EEG
Elección del dataset de referencia
El dataset EEGMotorImagery, distribuido originalmente por PhysioNet (BCI2000, Schalk et al.) y replicado en plataformas como BNCI Horizon 2020, presenta varias ventajas para los fines de CPEA-NEXUS. Primero, su accesibilidad: es de dominio público, sin restricciones de licencia que entren en conflicto con el criterio del corpus de evitar fuentes con conflictos de interés institucional. Segundo, su volumen: incluye registros de 109 sujetos con 64 canales EEG a 160 Hz, lo cual coincide casi exactamente con el escenario "64 canales" descrito en EXT-3 de CPEA-6-VAL, permitiendo validar esa extensión sin necesidad de hardware propio de alta densidad. Tercero, su estructura de eventos discretos (tareas motoras reales e imaginadas, codificadas como anotaciones temporales) ofrece un sustrato natural para probar la detección de excepciones TAE: cada transición entre tarea de reposo y tarea motora puede tratarse como una "excepción" candidata ε en el sentido de TAGIS-1, permitiendo verificar si V(ε) —el operador de valoración de relevancia— discrimina estas transiciones de forma consistente con la anotación experimental real, lo cual constituiría una validación cruzada independiente del marco TAE.
Es importante señalar que este dataset no contiene mediciones geomagnéticas ni del índice Kp, por lo que no permite validar directamente FIBRA-COH-1 ni el componente EXT-1 (Φ_TICAM). Para esa validación se requeriría, alternativamente, descargar series históricas del índice Kp (disponibles públicamente a través de servicios como GFZ Potsdam o NOAA SWPC) correspondientes a las fechas de adquisición del dataset EEG, y construir un .cpea_stream sintético-híbrido donde el canal geomagnético proviene de datos reales históricos pero desacoplado temporalmente del EEG (sirviendo como prueba de robustez del pipeline frente a series no correlacionadas, más que como validación positiva de FIBRA-COH-1).
Estructura del formato .cpea_stream
Antes de especificar el adaptador, conviene fijar (de forma compatible con lo ya documentado en CPEA-6-VAL y NEXUS-EEG v1.0) los campos mínimos que .cpea_stream requiere por cada "frame" temporal:
- timestamp: marca temporal en formato Unix epoch con resolución de microsegundos, sincronizada vía LSL (Lab Streaming Layer).
- eeg_channels: vector de N canales (N=64 en el caso EEGMotorImagery), en microvoltios, tras referencia común promedio (CAR).
- sampling_rate: 160 Hz (nativo de EEGMotorImagery) o reescalado a 250 Hz si se requiere homogeneidad con adquisiciones propias del proyecto (en cuyo caso se aplica interpolación spline cúbica, documentada explícitamente para evitar artefactos espectrales).
- event_marker: entero codificando el estado de la tarea (0 = reposo, 1 = movimiento real, 2 = movimiento imaginado, según codificación original T0/T1/T2 de PhysioNet).
- geo_channel (opcional): índice Kp interpolado a la resolución temporal del frame, marcado explícitamente como
geo_channel_synthetic: truecuando proviene de la fuente histórica desacoplada descrita arriba. - subject_id y session_id: preservados del dataset original para trazabilidad.
Especificación del adaptador bci_horizon_to_cpea_stream.py
El adaptador propuesto debe cumplir cinco funciones secuenciales, cada una mapeable a un módulo independiente para facilitar pruebas unitarias:
Función 1 — Ingesta y normalización de canales. Los archivos EEGMotorImagery se distribuyen en formato EDF+. La ingesta debe usar una librería estándar (mne.io.read_raw_edf) para evitar reimplementar parsers EDF, extrayendo los 64 canales según la nomenclatura del sistema internacional 10-10, y aplicando un filtro paso-banda 1-45 Hz consistente con el preprocesamiento ya documentado para NEXUS-EEG v1.0, de modo que la señal entrante a SIGMA-T tenga características espectrales comparables a las de adquisiciones propias.
Función 2 — Resampleo y alineación temporal. Dado que la frecuencia nativa (160 Hz) puede diferir de la frecuencia de operación interna de SIGMA-T (si esta se fijó en 250 Hz para compatibilidad con hardware Mistral-async, EXT-2), el adaptador debe resamplear preservando la integridad de los eventos discretos: los event_marker no se interpolan, sino que se asignan al frame más cercano tras el resampleo, evitando la creación de estados de evento espurios por interpolación lineal de etiquetas categóricas.
Función 3 — Inyección del canal geomagnético sintético-histórico. Para cada sesión, se identifica la fecha de adquisición (disponible en los metadatos de PhysioNet) y se consulta el índice Kp de 3 horas correspondiente a esa fecha mediante un fetch a un repositorio espejo de GFZ Potsdam (o un CSV precargado si se prioriza la reproducibilidad offline, evitando dependencias de red en tiempo de ejecución de los experimentos). Este canal se interpola linealmente a la resolución temporal del frame y se marca con el flag geo_channel_synthetic.
Función 4 — Serialización a .cpea_stream. Empaquetado de los campos anteriores en el formato binario o JSON-lines ya definido por NEXUS-EEG v1.0, preservando la compatibilidad con el resto del pipeline SIGMA-T sin requerir modificaciones en los módulos downstream (ICS(t), C_sys, Φ_AEF).
Función 5 — Generación de manifiesto de procedencia. Un archivo manifest.json por sesión que documenta: dataset de origen, versión del adaptador, parámetros de filtrado/resampleo aplicados, y el hash SHA-256 del archivo EDF original, permitiendo trazabilidad completa y cumpliendo con buenas prácticas de ciencia abierta (FAIR data).
Implicaciones para la validación de ICS(t) y TAE
Una vez generado el corpus .cpea_stream derivado de EEGMotorImagery (109 sujetos × varias sesiones), se abren tres líneas de validación directamente conectadas con documentos ya existentes del corpus:
Primero, validación de detección de excepciones (TAE/TAGIS): las transiciones T0→T1/T2 anotadas en el dataset constituyen un "ground truth" externo de excepciones cognitivas-motoras. Se puede calcular la correlación entre los instantes detectados por V(ε) > ε_c (umbral adaptativo de CPEA-2) y las transiciones anotadas, generando una curva ROC que cuantifique la sensibilidad/especificidad del detector TAGIS-H sin depender de simulaciones propias.
Segundo, validación de ICS(t) como índice de coherencia semántica: dado que EEGMotorImagery no incluye embeddings semánticos nativos, se requeriría un paso adicional —fuera del alcance de este documento pero mencionable como trabajo futuro— donde se generen etiquetas semánticas sintéticas (p. ej., mediante un modelo de clasificación de imaginería motora) que alimenten el componente semántico de ICS(t).
Tercero, prueba de robustez frente a Γ_N(t) y CPEA-N: al tratarse de 109 sujetos, el dataset permite construir una red multi-agente real (cada sujeto como nodo) y calcular el operador de coherencia grupal Γ_N(t) sobre datos humanos reales, en lugar de los agentes simulados usados hasta ahora en CPEA-N, lo cual sería un salto significativo de credibilidad para esa línea del corpus.
TICAM-HW-1: especificación funcional del transductor magnetotalámico y diseño DIY de referencia
El problema de la interfaz
TICAM, tal como se define en TICAM-1 y se desarrolla hasta TICAM-F7, formaliza un acoplamiento entre fluctuaciones del campo geomagnético (caracterizadas, entre otros, por el índice Kp) y dinámicas talámicas reflejadas en el EEG, mediante el operador Φ_TICAM. Sin embargo, la especificación actual no distingue claramente entre tres capas que deberían mantenerse independientes: (1) la definición matemática de Φ_TICAM como transformación sobre series temporales; (2) la fuente de datos que alimenta esa transformación (índice Kp global vs. medición local de campo magnético); y (3) el hardware físico que produce esa fuente de datos cuando se opta por medición local.
METFI-STEM, según se menciona, sugiere ya un diseño DIY, pero su relación con TICAM no está documentada. La propuesta de TICAM-HW-1 es formalizar exactamente esa relación mediante una interfaz lógica que ambas fuentes (Kp global o sensor local) deben satisfacer, permitiendo que Φ_TICAM opere de forma idéntica independientemente del origen del dato.
Interfaz lógica de entrada de TICAM
Se propone definir un contrato de datos TICAM_input_frame con los siguientes campos obligatorios, independientes de la fuente física:
- B_field_magnitude: magnitud del campo magnético en nanoteslas (nT), como serie temporal continua.
- B_field_vector (opcional, recomendado si el hardware lo permite): componentes X, Y, Z del campo, permitiendo análisis direccional que el índice Kp (escalar, planetario) no ofrece.
- timestamp: sincronizado al mismo reloj LSL que NEXUS-EEG.
- source_type: enumeración {
KP_GLOBAL,LOCAL_FLUXGATE,LOCAL_HALL,SYNTHETIC}, permitiendo a Φ_TICAM (o a un módulo de preprocesamiento previo) aplicar el factor de escala/calibración apropiado según la fuente, dado que el índice Kp (escala logarítmica 0-9, resolución de 3 horas) y un magnetómetro local (resolución de nT, frecuencia de muestreo de Hz a kHz) tienen órdenes de magnitud y resoluciones temporales radicalmente distintos. - calibration_offset: valor de campo magnético ambiental basal medido en condiciones de control (necesario para sensores locales, irrelevante para Kp).
Con esta interfaz, Φ_TICAM —definido formalmente en TICAM-F2 a F7 sobre la serie B_field_magnitude— puede operar sin modificación sobre cualquier fuente que implemente el contrato, y la pregunta de "¿hay un diseño DIY?" se convierte en "¿qué implementaciones de source_type=LOCAL_* existen?".
Diseño DIY de referencia: sensor fluxgate de bajo coste
Para source_type=LOCAL_FLUXGATE, se propone un diseño de referencia basado en magnetómetros fluxgate de tres ejes ya disponibles comercialmente a bajo coste (en el rango de sensores como el RM3100 de PNI Sensor, ampliamente usado en proyectos de ciencia ciudadana de monitorización geomagnética, con resolución sub-nT y frecuencias de muestreo configurables hasta cientos de Hz). El diseño de referencia constaría de:
Componente sensor: módulo fluxgate de tres ejes conectado vía I2C/SPI a un microcontrolador de bajo coste (ESP32, por su soporte nativo de WiFi para streaming, o Raspberry Pi Pico si se prioriza coste). Esto sería coherente con la filosofía "DIY" de METFI-STEM.
Aislamiento de interferencias: dado que el objetivo es medir fluctuaciones geomagnéticas de origen externo (no campos generados por electrónica local), el diseño debe especificar una distancia mínima del sensor respecto a fuentes de interferencia electromagnética (ordenadores, fuentes de alimentación conmutadas, el propio amplificador EEG), recomendándose una separación física de al menos 1-2 metros y, si es posible, un cable apantallado de longitud suficiente para ubicar el sensor en una zona de bajo ruido EM (p. ej., exterior o ático), una práctica estándar en magnetómetros de estación geomagnética amateur.
Calibración: protocolo de calibración de tres puntos (offset, escala por eje, corrección de no-ortogonalidad de los tres ejes del sensor), siguiendo procedimientos estándar de calibración de magnetómetros de bajo coste mediante rotación controlada en los tres ejes frente al campo magnético terrestre como referencia.
Streaming: el microcontrolador publica los frames TICAM_input_frame vía LSL (mismo protocolo que NEXUS-EEG), lo cual resuelve directamente el problema de sincronización temporal descrito en la siguiente sección, ya que LSL maneja intrínsecamente la alineación de múltiples streams con distintas frecuencias de muestreo y latencias.
Sincronización temporal con NEXUS-EEG
La sincronización es el punto donde TICAM-HW-1 se conecta operativamente con NEXUS-EEG v1.0. Dado que NEXUS-EEG ya opera sobre BrainFlow/LSL, la solución más directa y de menor riesgo de introducir inconsistencias es que el stream del magnetómetro DIY se registre como un stream LSL adicional dentro de la misma sesión de grabación, con su propio source_id pero compartiendo el reloj maestro LSL de la sesión.
El módulo SIGMA-T, en su etapa de ensamblaje de .cpea_stream, debe entonces resamplear el stream magnético (de su frecuencia nativa, p. ej. 50-100 Hz para un fluxgate de bajo coste) a la frecuencia de referencia del .cpea_stream (250 Hz), mediante interpolación adecuada (spline o decimación según si se sobremuestrea o submuestrea), poblando el campo B_field_magnitude del contrato TICAM_input_frame con source_type=LOCAL_FLUXGATE. Esto sustituye, en sesiones con hardware DIY disponible, al canal geo_channel derivado del índice Kp global (que queda como fallback para source_type=KP_GLOBAL cuando no hay sensor local).
Una consideración importante es la escala temporal de variación: el índice Kp varía en bloques de 3 horas, mientras que un magnetómetro local captura variaciones de segundos a minutos (incluyendo posibles micropulsaciones geomagnéticas, Pc/Pi, de frecuencias en el rango de mHz a Hz). Esto significa que source_type=LOCAL_FLUXGATE no es simplemente "una versión de mayor resolución de Kp", sino que potencialmente captura una fenomenología distinta (más cercana, en términos de FIBRA-COH-1, a las bandas de frecuencia donde podría esperarse acoplamiento con ritmos EEG, p. ej. banda alfa ~8-13 Hz vs. micropulsaciones geomagnéticas en rangos solapados). Esto debería documentarse explícitamente como una hipótesis adicional y separada dentro de FIBRA-COH-1 o en un anexo, evitando conflar "validación con Kp" y "validación con magnetómetro local" como si fueran la misma prueba a distinta resolución.
Integración propuesta en la estructura del corpus
Ambas piezas —adaptador de dataset y especificación TICAM-HW-1— se proponen como anexos más que como artículos independientes de pleno derecho, dado su carácter instrumental:
- El adaptador
bci_horizon_to_cpea_stream.pyy su documentación se integrarían como Anexo A de CPEA-6-VAL, bajo el título "Protocolo de validación con dataset abierto EEGMotorImagery", referenciando explícitamente TAGIS-1 (para la validación de excepciones) y CPEA-N (para Γ_N(t) multi-sujeto). - TICAM-HW-1 se integraría como un nuevo documento corto (formato técnico, no necesariamente los ~3500 palabras de un artículo completo del corpus) bajo TICAM-F8 o como anexo a TICAM-F7, titulado "Especificación de interfaz e implementación de referencia DIY", explicitando la separación entre
source_type=KP_GLOBALysource_type=LOCAL_FLUXGATEy dejando constancia de la hipótesis adicional sobre micropulsaciones geomagnéticas como línea de investigación derivada, potencialmente conectable con METFI-STEM en un futuro documento de integración (siguiendo el patrón ya establecido por INTER-1 a INTER-6).
Resumen
- La brecha actual del corpus no es teórica sino de replicabilidad empírica externa: faltan datos estándar y especificación de hardware desacoplada de implementaciones propietarias.
- Se propone adoptar EEGMotorImagery (PhysioNet/BCI2000, 109 sujetos, 64 canales, 160 Hz) como dataset de referencia, vía un adaptador
bci_horizon_to_cpea_stream.pycon cinco funciones: ingesta/normalización, resampleo con preservación de eventos, inyección de canal geomagnético sintético-histórico (índice Kp por fecha), serialización a.cpea_stream, y generación de manifiesto de procedencia (FAIR). - Este dataset permite validar TAGIS-H/TAE (transiciones anotadas como ground truth de excepciones), y construir una red real de 109 nodos para Γ_N(t)/CPEA-N, aunque no valida directamente FIBRA-COH-1 por ausencia de datos geomagnéticos nativos.
- Se propone TICAM-HW-1, una interfaz lógica
TICAM_input_frame(magnitud y vector de campo B, timestamp,source_type, calibración) que desacopla Φ_TICAM de su fuente:KP_GLOBAL(actual) vs.LOCAL_FLUXGATE(nuevo). - Diseño DIY de referencia: magnetómetro fluxgate de tres ejes (tipo RM3100) + microcontrolador (ESP32) con streaming LSL, calibración de tres puntos, y aislamiento físico de interferencias EM (1-2 m de separación de electrónica).
- Sincronización: el stream magnético se integra como stream LSL adicional en la misma sesión NEXUS-EEG, resampleado a 250 Hz en SIGMA-T; se advierte que un sensor local mide fenomenología distinta (micropulsaciones geomagnéticas de mayor frecuencia) a la del índice Kp, lo cual debe tratarse como hipótesis adicional separada, no como mera mejora de resolución.
- Integración propuesta: Anexo A de CPEA-6-VAL (dataset) y nuevo TICAM-F8 (hardware), sin alterar la arquitectura formal existente.
Referencias
- Schalk, G., McFarland, D.J., Hinterberger, T., Birbaumer, N., & Wolpaw, J.R. (2004). BCI2000: A General-Purpose Brain-Computer Interface (BCI) System. IEEE Transactions on Biomedical Engineering. — Fuente original del dataset EEGMotorImagery; describe la estructura de canales, anotaciones de eventos (T0/T1/T2) y protocolo experimental que el adaptador debe respetar. Sin conflictos de interés institucional relevantes; estándar de facto en la comunidad BCI académica.
- PhysioNet / Goldberger, A.L. et al. (2000). PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals. Circulation. — Plataforma de distribución del dataset; documenta formatos EDF+ y licencias de uso abierto, relevantes para la Función 1 del adaptador y el manifiesto FAIR.
- GFZ Potsdam, Servicio de índices geomagnéticos (Kp/ap). — Fuente histórica del índice Kp por fecha, necesaria para la Función 3 del adaptador (canal geomagnético sintético-histórico). Institución de investigación pública alemana, sin vínculos comerciales con fabricantes de sensores, coherente con el criterio de evitar conflictos de interés.
- PNI Sensor Corporation, hoja de datos RM3100. — Referencia técnica para el sensor fluxgate de tres ejes propuesto en TICAM-HW-1; se cita únicamente como ejemplo de especificaciones técnicas (resolución, rango, interfaz I2C/SPI) ampliamente documentadas y replicadas en proyectos de magnetometría de bajo coste, no como recomendación comercial exclusiva.
- Lab Streaming Layer (LSL), documentación del proyecto sccn/labstreaminglayer. — Protocolo ya empleado por NEXUS-EEG v1.0; su uso para sincronizar el stream magnético DIY evita introducir un segundo mecanismo de sincronización, reduciendo riesgo de inconsistencias temporales entre
.cpea_streamyTICAM_input_frame.
Comentarios
Publicar un comentario