近几年内,很多国外测序公司(比如23andMe、FTDNA等),他们将类似于 Illumina Omni Express 芯片或其他的位点集替换成了类似于 Illumina GSA 芯片的位点集,且它们一般体现为定制芯片数据。
特此,我做了一些对比图,以方便查找哪些芯片格式更接近 GSA(Global Screening Array)的位点集。为了方便对比,我也加入了几种近似于GSA位点集的对照格式。
(以下数据皆用DNA Kit Studio V2.8转化)

1.国内格式转国外与 GSA 相关格式的转化率图(按基因位点位置转化)

2.国内格式转国外与 GSA 相关格式的未检出位点数图

3.上述格式跑一些祖源计算器的理想利用率图(这里的原始数据文件第4列都填满了纯合位点,其中“[#ANY]”代表这个系列下的任意一个计算器)

很多祖源计算器大多诞生于8~10年前(从今年2021年算起),其所需位点集更偏向于 Illumina Omni Express,比如,Dodecad K12b、Globe13,Eurogenes K15、K36,LM Genetics K47 等。对了,E11 也是属于这类位点集偏向。
也有部分计算器的所需位点集也会偏向 Affymetrix Human Origins,比如,LM Genetics K47,MDLP K11e,MDLP K16 等。
而偏向 Illumina GSA 位点集的祖源计算器很少,相关的只有 DNA Genics World K4、K7、K8。不过也不必太担心,未来可能会有更多的新祖源算法采用类似于GSA的位点集,甚至类似于 GDA(Global Diversity Array)的位点集,但不一定是祖源计算器。相对国内的话,Illumina 的 ASA(Asian Screening Array) CGA(Chinese Genotyping Array)也是分别被用作各色DNA V2、微基因3.0 的定制芯片的基础位点。


后面的文章将继续对比其他芯片类型的数据。


下图是一些国外测序格式的对应芯片类型,其中 FTDNA 对应的V2版,LivingDNA 对应的V1版,MyHeritage 对应的V1版:

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐