NeuroLingua: A Language-Inspired Hierarchical Framework for Multimodal Sleep Stage Classification Using EEG and EOG
Mahdi Samaee, Mehran Yazdi, Daniel Massicotte
多梦摄影的自动睡眠阶段分类仍然受到缺乏表现性的时间层次结构,多模态EEG和EOG融合的挑战以及深度学习模型的可解释性有限而受到限制。 我们提出了NeuroLingua,一种受语言启发的框架,将睡眠概念化为结构化的生理语言。 每个30秒的纪元使用基于CNN的标记器分解为重叠的3秒子窗口(“令牌”),通过双级变形金刚实现分层时间建模:本地依赖关系的分段内编码和跨连续七个时代(3.5分钟)的分段间集成,用于扩展上下文。 来自EEG和EOG通道的模态特定嵌入通过图形卷积网络进行融合,促进了强大的多模态集成。 NeuroLingua在Sleep-EDF扩展和ISRUC-Sleep数据集上进行评估,在Sleep-EDF(85.3%精度,0.800宏F1和0.796 Cohen的kappa)上实现最先进的结果,并在ISRUC(81.9%精度,0.802宏F1和0.755 kappa)上达到最先进的结果,在整体和每个指标中匹配或超过已发布的基线。 该架构的注意力机制增强了临床相关睡眠微事件的检测,为睡眠研究中的未来可解释性,可解释性和因果推断提供了原则基础。 通过将睡眠作为一种组合语言,NeuroLingua统一了分层序列建模和多模态融合,将自动化睡眠阶段推向更透明和临床上有意义的应用。
Automated sleep stage classification from polysomnography remains limited by the lack of expressive temporal hierarchies, challenges in multimodal EEG and EOG fusion, and the limited interpretability of deep learning models. We propose NeuroLingua, a language-inspired framework that conceptualizes sleep as a structured physiological language. Each 30-second epoch is decomposed into overlapping 3-second subwindows ("tokens") using a CNN-based tokenizer, enabling hierarchical temporal modeling thr...