英国雪菲尔大学(University of Sheffield)和美国史丹佛大学医学院(Stanford University School of Medicine)的研究人员,近来合作开发了一种新的机器学习模式,称为「区域精密定位」(regional finemapping,RefMap)。利用此工具,研究团队发现了与运动神经元相关的疾病——肌萎缩性脊髓侧索硬化症(amyotrophic lateral sclerosis, ALS),即俗称「渐冻人症」有关的遗传基因,此研究成果於今(2022)年发表在《神经元》(Neuron)期刊。 RefMap是一个层级贝氏网路(hierarchical Bayesian network),负责执行疾病相关基因变化的全基因组监定,而这些与疾病相关的基因主要为非编码基因(non-coding gene)。ALS着名的特性为仅运动神经元表现脆弱(又称为单一细胞选择性脆弱),因此非常适合作为研究主题。由於人体的运动神经元相对稀少,较难以用事後分析的组织进行研究,研究团队藉由诱导性多功能干细胞(induced pluripotent stem cells,iPSC)衍生出运动神经元,对其进行彻底的转录体(transcriptome)与表观遗传(epigenetics)分析,包含RNA定序、染色质开放性定序(ATAC-seq)、组蛋白染色质免疫沉淀定序(histone ChIP-seq)、染色体构象捕获(Hi-C)等方法。研究团队将RefMap应用於ALS的全基因组关联性分析(genome-wide association study, GWAS)数据与分子分析,最後监定出690个与ALS相关的基因。 该篇研究中,找到一个称为KANK1的基因,它在人类神经元中产生的神经毒性,与ALS患者大脑中观察到的情况非常相似。在功能上,KANK1基因与许多在细胞骨架功能上扮演重要角色,且已知与 ALS 相关的基因,包括PFN1、KIF5A、TUBA4A等基因有关。其中,PFN1与KANK1相同,与肌动蛋白的聚合有关;而肌动蛋白聚合的破坏与突触的改变,包括神经肌肉终板(neuromuscular junction, NMJ)的改变有关,也与细胞核与细胞质之间的转运功能缺陷有关。研究团队验证了这些基因的变异,与KANK1基因表现之间的关联性。此外,他们也发现在iPSC衍生的运动神经元中,若KANK1的表达量降低,便会产生毒性,并出现ALS的关键病理特徵,例如TDP-43蛋白沉积。假如ALS 患者带有会破坏KANK1功能的基因突变,只要将KANK1的基因表现量上调,就可能成为其治疗标靶。而在未刻意挑选患者是否带有KANK1突变的情况下,研究团队发现,ALS患者的运动神经元KANK1表现量,与ALS的疾病严重程度具直接相关性。
研究团队表示,RefMap 整合了遗传和表观遗传数据来识别风险基因,这项新工具可帮助我们了解、分析运动神经元疾病的遗传基础。研究团队目前也计画将RefMap应用於其他疾病模式,期望RefMap未来能成为研究疾病遗传风险的新利器。 新闻来源 1. Zhang S et al. Genome-wide identification of the genetic basis of amyotrophic lateral sclerosis. Neuron. 2022:S0896-6273(21)01036-9. 2. New AI model helps discover causes of motor neurone disease,ScienceDaily, 2022/01/18.