bbpScore智能算法
是基于遗传学,生物信息学,及统计学相关理论,结合遗传数据解读专家的分析经验,设计出的一套简化二代测序遗传病变异有害性评分模型。
目前热门的机器学习模型(包括深度学习)都不适用于遗传病目前的数据结构(高维特征/低维样本/稀疏数据),因此通过人工建立的模型是目前经过多次尝试后得到的最优化结果。
1
算法模型(不依赖于表型的算法模型)
算法特征
随机挑选100例临床案例数据,对bpScore智能筛选算法进行测试,结果表明:在超过90%的案例中,致病性变异的致病性打分排名位于前三。
在100例常染色体隐性遗传基因致病的案例中,90%的致病性变异的致病性打分排名第一。
2
案例分享
Case 1:
苯丙酮尿症
bpVast筛选:
bpScore排名前2位突变信息,为PAH基因报道致病性的变异。
Case 2:
双眼屈光不正,双眼视网膜色素变性
bpVast筛选:
bpScore排名第一的位点为CDHR1基因的纯合突变,相关疾病为视锥-视杆营养不良15型。通过变异的类型、所处位置、软件预测、人群携带率、表型符合度相关信息结合ACMG指南的评级确定该变异为可能致病的。
Case 3:
热性惊厥
bpVast筛选:
bpScore排名第一的位点为SCN1A基因的无义突变,在参考人群基因数据库中未有收录,该疾病相关表型和患者症状相符,经家系验证结果表明该变异为新发突变,符合该患者家系共分离证据。
Case 4:
间断抽搐2月余,共5次
bpVast筛选:
bpScore排名第一的位点为ATP1A2基因的错义突变,被HGMD数据库报道为致病性的,在GnomAD数据库中的等位基因频率约为十万分之一,包括Revel、 ClinPred、 SIFT、 PolyPhen多个软件均预测该变异为致病性的,查看该疾病信息发现该变异为该基因最高发的致病性变异。经家系验证结果表明该变异为新发突变,符合该患者家系共分离证据。