使用GPU发现人脑连接,大规模GPU实现了100倍的加速

扩散磁共振成像和纤维束成像能够估测人脑中的解剖连接。然而,如果没有ground-truth验证,不同的纤维束成像算法可能会产生差异很大的连通性估计。尽管流线型修剪技术缓解了这一挑战,但缓慢的计算时间妨碍了它们在大数据应用程序中的使用。

印度科学研究所神经科学中心的研究人员提出了「Regularized, Accelerated, Linear Fascicle Evaluation」(ReAl-LiFE),这是一种基于GPU的最先进流线修剪算法(LiFE)的实现,与以前基于CPU的实现相比,它实现了100倍以上的加速。利用这些加速,研究人员克服了LiFE算法的关键限制,以生成更稀疏和更准确的连接组。

该研究以「GPU-accelerated connectome discovery at scale」为题,于2022年5月30日发布在《Nature Computational Science》。

大脑区域之间完整的解剖连接对认知至关重要。体内解剖连接的准确估计不仅对于揭示人类行为的神经基础至关重要,而且对于了解神经系统疾病的遗传基础也至关重要。

扩散磁共振成像(dMRI),然后是纤维束成像,能够在体内估测人脑中的解剖连接。dMRI测量水分子在大脑白质中的扩散,纤维束成像算法基于受限扩散估测轴突结构。然而,dMRI 和纤维束成像算法容易遇到诸如采集噪声和冗余纤维几何形状等挑战。

最近的一项研究汇集了20个团队的努力,这些团队从模拟的dMRI扫描中估测了全脑连接组,而这反过来又是由模拟的「真实」纤维束生成的。不同团队的不同成功率,反映了这一挑战的重要性。由于大脑中的实际ground-truth连接,通常在体内是不可用的,因此对人脑中的纤维束成像的直接验证仍然难以捉摸。

流线型修剪和评估算法代表了应对这些挑战的最先进的后处理方法。线性分束评估 (LiFE)是一种最新的最先进的模型,它根据对基础扩散信号的拟合质量来修剪杂散纤维。然而,LiFE的算法是在中央处理单元(CPU)上实现的,并且存在速度和内存瓶颈,这妨碍了它在大规模连接组评估中的应用。

印度科学研究所神经科学中心的研究人员,提出了对LiFE的改进——Regularized、Accelerated、Linear Fascicle Evaluation或ReAl-LiFE——用于大规模快速和准确的连接组评估。他们通过在其目标函数中引入显式正则化(稀疏性)惩罚来改进LiFE算法,并提出了一种可扩展图形处理单元(GPU)实现,该实现比通常CPU实现加速了100×的数量级,同时还估计了更稀疏和更一致的连接体。

之后,研究人员展示了ReAl-LiFE在估计具有高重测可靠性的流线方面的表现与其他最先进的方法(例如,SIFT2和COMMIT2)相当,甚至优于其他方法。

同时,该团队应用ReAl-LiFE来识别来自人类连接组项目 (HCP) 数据库的200名参与者的行为的结构连接相关性。研究人员建议将ReAl-LiFE作为一种有效的工具,超越最先进的技术,用于快速、准确地大规模发现连接组。

在早期的研究中,该团队介绍了 ReAl-LiFE 算法的初步版本;这个实现比LiFE的CPU实现加速了50-100倍。新的研究中,研究人员进一步优化算法以实现更大的加速(>100×,最高达 155×)。该团队用三个不同的扩散MRI数据集证明了这些加速。

图示:使用ReAl-LiFE 算法进行快速可靠的连接组评估。(来源:论文)

首先,他们使用来自HCP数据库的最先进的扩散MRI数据集测试了加速。研究人员生成了七种不同大小的连接组,从50,000到200万根纤维。然后使用CPU实现以及LiFE的GPU实现来修剪这些连接组中的流线。GPU实现产生了显著的加速,从具有50,000根光纤的连接组的62倍到具有150万根光纤的连接组的129×。

研究人员还在另外两个独立获取的数据集上评估了这些加速:内部获取的dMRI数据集和原始LiFE研究中使用的数据集。同样,具有150万根光纤的连接组的最大加速为124×和155×。

研究人员还测试了加速如何随着体素数量 (Nv) 和扩散方向数量 (Nθ) 的增加而变化。总体而言,加速比随着扩散方向的数量增长最快,其次是体素的数量。另外,将ReAl-LiFE的收敛时间与其他两种修剪算法SIFT和COMMIT2进行了比较。ReAl-LiFE的性能与SIFT和COMMIT2相当,但是在更大的连接组尺寸下,该团队的方法更具优势。

结合稀疏诱导先验使ReAl-LiFE能够生成更稀疏和更准确的连接组。然而,先前的研究表明,这种导致稀疏的先验可能会增加假阴性的机会,特别是当连接组中出现重复纤维时。研究人员通过构建完全由几乎相同的重复流线组成的人工连接组来解决这一挑战,并表明使用ReAl-LiFE进行修剪在很大程度上改善了这一挑战。此外,与LiFE相比,ReAl-LiFE减少了过度拟合并产生了更一致的连接组。

接下来,研究人员量化了ReAl-LiFE算法的可靠性,并将其与LiFE、SIFT2和COMMIT2的可靠性进行了比较。使用从HCP数据库中抽取的n=5参与者的样本,进行了重测可靠性分析。对于每个参与者,计算成对的半球内连通性,其总变异性被划分为参与者之间和参与者内部的成分。

在使用LiFE进行修剪后,参与者内部和参与者之间的变异性具有可比性,但是,在ReAl-LiFE修剪之后,参与者内部的变异性显著低于参与者之间的变异性。因此,ReAl-LiFE 修剪增加了估计连接权重的重测可靠性。此外,ReAl-LiFE修剪后的参与者间变异性显著低于LiFE修剪后的差异(P < 0.001)。

研究人员进一步用信度指数量化了重测信度。更高的可靠性指数是有效修剪的标志。与LiFE相比,使用ReAl-LiFE进行修剪产生了显著更高的可靠性指数。使用SIFT2修剪产生的可靠性指数与ReAl-LiFE相当,而使用COMMIT2修剪产生的可靠性指数略低于ReAl-LiFE。

接下来,研究人员根据图的每个象限中的连接比例来量化可靠性的提高:与IV象限相比,II象限中的比例越大,表明剪枝效率越高。与未修剪的连接组相比,使用LiFE进行流线式修剪在高可靠性 (6.8%) 中产生的连接比在低可靠性象限 (11.1%) 中产生的连接更少,尽管与偶然性没有区别。

另一方面,与低可靠性象限相比,使用ReAl-LiFE进行修剪在高可靠性(13.2%)中产生了更多的连接。使用SIFT2和COMMIT2进行修剪在高可靠性和低可靠性象限中产生了相当比例的连接。

最后,该团队确定了在ReAl-LiFE修剪后表现出极值重测可靠性的连接。额叶和顶叶之间的远程连接具有最高的重测信度,这些连接与已建立的白质束强烈重叠,包括上、下纵束 (SLF/ILF)、弓状束 (AF) 和 额枕下束(IFOF)。相反,对于短程连接,重测信度最低,尤其是那些连接颞中回与相邻颞枕区域的连接。

作为ReAl-LiFE的实际应用,该团队询问使用ReAl-LiFE进行流线式修剪是否能够识别行为的结构连接相关性。为此,他们预测了200 名参与者的60个行为测试分数,涵盖认知、情感和人格三个类别。行为评分预测是通过使用递归特征消除 (RFE) 的支持向量回归 (SVR) 模型进行的。具体来说,他们使用ReAl-LiFE连接权重作为特征做出的预测,与基于未修剪连接组中纤维数量的预测进行了比较。

图示:使用ReAl-LiFE连接权重预测关键认知分数。(来源:论文)

在一系列显著性阈值中,基于纤维数量和ReAl-LiFE权重的连接组特征显着预测的行为分数数量没有差异。然而,基于ReAl-LiFE权重的预测比基于纤维数量的预测更准确,更高的平均相关性证明了这一点。当分别预测每个类别的分数(认知、情感和个性)时,观察到了类似的趋势。

总之,对于认知和人格得分,在整个显著性阈值范围内,真实生活权重产生的预测准确度(平均r值)始终高于纤维数量。

接下来,询问了哪一组连接组特征——ReAl-LiFE权重或未修剪的连接组纤维——更可靠地预测了行为得分。为此,研究人员结合了两组特征,并量化了RFE算法选择的ReAl-LiFE特征的比例,以对每个行为得分进行最佳预测。对于超过95% (58/60) 的分数预测,与未修剪连接组的特征相比,RFE倾向于更高比例的ReAl-LiFE特征。

研究人员还分析了这些预测背后的解剖特征,重点关注「认知」分数。简而言之,阅读能力与左侧额叶皮层的连通性显著相关,而图片词汇得分与右侧顶叶皮层的连通性显着相关。

研究结果表明,除了产生更准确的连接组外,ReAl-LiFE连接权重还可以对一系列行为分数进行更准确的预测,所有这些都是在扫描仪环境之外获得的。在连接组评估后量化的基于dMRI的结构连接可能为关键认知特征提供可靠的基于神经成像的生物标志物。

ReAl-LiFE算法可以在几个关键方面进行开发和改进,以克服其当前的局限性。

首先,当前版本的ReAl-LiFE算法没有利用跨多个GPU的并行计算。此外,ReAl-LiFE目前还没有与多 CPU 加速方案集成,尽管他们的加速超过了(~8.7 倍)为这些方法报告的最新数字。将这些基于CPU的方案与他们的GPU实现相结合,或在多 GPU上实现并行计算,可能会进一步提高算法的速度。

其次,ReAl-LiFE的优化目标,包括稀疏诱导先验,可能会进一步提高。使用 ReAl-LiFE 进行正则化修剪的一个关键特性是能够使用基于L1范数的正则化生成各种所需稀疏度的连接组,这是原始 LiFE 算法中不具备的特性。

然而,如此严格的正则化增加了假阴性(遗漏纤维)的机会。虽然测试了这种可能性,但需要系统地评估其他类型的正则化(例如,基于L2范数),以识别那些最小化连接组中的假阴性的正则化。尽管如此,加入这种惩罚后,ReAl-LiFE在减少过度拟合、产生更一致的连接组和提高重测可靠性方面优于LiFE。尽管仅在有限数量的参与者(n = 5)中进行了重测信度分析,但具有最高重测信度的 ReAl-LiFE 连接映射到已建立的白质束。在目标函数中加入额外的特征和约束——例如,基于大脑解剖学,与COMMIT2一样——可能会在未来改进ReAl-LiFE算法。

第三,对ReAl-LiFE与其他最先进的算法(SIFT/SIFT2 和 COMMIT2)之间存在差异的原因进行原则性评估仍有待进行。ReAl-LiFE修剪时间在很大程度上与其他方法相当,但对于较大的连接组尺寸表现出边际优势。

此外,ReAl-LiFE与其他方法的不同之处在于修剪后保留的高可靠性连接的比例。这些差异的原因需要仔细调查。最后,需要将ReAl-LiFE与这些竞争方法直接进行比较,就它们各自的成功率而言,将结构连接性映射到行为。这种原则性比较对于识别高阶认知功能(例如注意力、学习和决策)的稳健结构连接基础至关重要。

更一般地说,作为ReAl-LiFE核心的Subspace Barzilai-Borwein非负最小二乘(SBB-NNLS)算法广泛适用于许多实际应用中的优化问题,包括医疗保健。研究人员认为,他们对SBB-NNLS算法的GPU加速实现,具有在连接组修剪之外的不同领域广泛应用的潜力。

论文链接:

https://www.nature.com/articles/s43588-022-00250-z

相关报道:

https://neurosciencenews.com/ai-gpu-brain-network-20955/

文章来源:ScienceAI

IEEE Spectrum

《科技纵览》

官方微信公众平台






往期推荐
十大移动处理器排名
第一个可量产的柔性处理器
英特尔4004处理器问世50周年