近日,浙江师范大学数理医学院Sajid Farooq教授与孔德兴教授等合作,在国际知名期刊《Expert Systems With Applications》上发表了题为“Advanced autism detection and visualization through XGBoost algorithm for fNIRS hemo-dynamic signals”的高水平研究论文。该研究对于推动自闭症谱系障碍及优化算法领域研究具有重要推动作用。浙江师范大学为该论文的第一单位,数理医学院Sajid Farooq教授为论文第一作者。
图1. 实验范式:利用视觉刺激诱发被试的情绪变化,同步采集被试的fNIRS数据。
本研究探讨了XGBoost算法结合功能性近红外光谱(fNIRS)技术在自闭症谱系障碍(ASD)早期诊断中的应用。研究指出,现有的自闭症筛查工具(如改良版儿童自闭症筛查量表M-CHAT)存在局限性,亟需更精准、更具可扩展性的诊断工具。研究对象包括51名儿童,其中24名确诊为ASD,27名正常发育(TD)儿童研究范式如图1所示。通过fNIRS测量双侧颞叶静息血流动力学波动,发现两组之间存在显著的连接差异,如图2所示。XGBoost算法结合方差分析进行特征选择,取得了较高的分类性能,如图3所示,AUC值达到了0.99。
图 2. ASD 组 HbO (a) 和 (b) HbR 的血流动力学响应函数 (HRF),通过跨多个通道的聚集层次聚类 (AgHC) 分析得出,呈现通道特定的血流动力学模式和时间动态
图3. (a)使用嵌套交叉验证和 XGBoost 算法的跨多折 ROC 曲线,AUC平均值为0.99。(b)决策边界可视化显示了 ASD 和 TD 队列之间的分类边界,证明了使用 XGBoost 方法可以有效分离这两个类别,二维投影强调了不同的类别边界。
本研究的方法亮点在于多种先进技术的综合应用,具体如下:(1)将XGBoost算法与fNIRS技术结合,用于解析ASD的神经血管耦合特征,通过集成梯度提升树模型与ANOVA特征选择,显著提升了高维小样本数据下的分类性能(AUC为0.99);(2)引入UMAP技术和PCA技术对高维fNIRS信号特征进行非线性降维,在保留局部与全局数据结构的同时,有效识别了ASD与TD,为神经影像数据提供了更直观的可解释性分析框架;(3)采用聚集分层聚类量化双侧颞叶通道间HbR与HbO的耦合关系,揭示了ASD群体中特定通道(如通道4、5、20等)的功能性连接异常,定位了ASD相关的神经通信障碍,明确了与ASD病理生理相关的神经血管动力学改变。总而言之,这项研究代表了神经影像学和机器学习在ASD早期检测中的应用方面取得的重要进展,凸显了通过精准医疗改善临床疗效的潜力。