使用可逆终结剂化学精确的整个人类基因组测序

  我们的X染色体研究使我们能够开发一组综合方法,用于快速测序和分析整个人类基因组。我们对来自尼日利亚伊巴丹的男性约鲁巴人的基因组进行了测序(YRI,样本NA18507)。该样...

  我们的X染色体研究使我们能够开发一组综合方法,用于快速测序和分析整个人类基因组。我们对来自尼日利亚伊巴丹的男性约鲁巴人的基因组进行了测序(YRI ,样本NA18507) 。该样本最初是通过社区参与过程为HAPMAP Project17,18收集的,并获得了知情同意,也已在其他项目中进行了研究。20,21。因此 ,我们能够将结果与来自同一样本的公开数据进行比较 。我们构建了两个库:一个简短插入(200 bp) ,具有与先前的X染色体库相似的特性,一个来自长片段(2 kb)的属性(2 kb)提供了较长范围的读取对信息(有关尺寸分布,请参见补充图11) 。我们在8周(2007年12月至2008年1月)的六种GA1仪器中 ,平均每次生产3.3 GB(例如,请参见补充表1),在8周(2007年12月至2008年1月)的时间内生成了135 GB的序列(40亿配对35台读数;请参见补充表6)。大约消耗品成本(基于试剂的全额价格)为250,000美元。我们使用MAQ将97%的读数对齐 ,发现99.9%的人参考(NCBI Build 36.1)覆盖了一个或多个读数,平均深度为40.6倍 。使用Eland,我们将91%的读数与参考序列的93%的读数保持在足够的深度 ,以调用较强的共识(>三个Q30碱基)。映射的读取深度的分布接近随机,对于X染色体数据所见,略有过度分散。我们观察到在广泛的G+C含量上的综合表示 ,仅在极端的末端下降,但是与X染色体相比,分布模式不同(参见补充图12) 。   我们确定了400万个SNP ,其中74%匹配了DBSNP的先前条目(图3)。我们发现了SNP调用与基因分型结果的极好的一致性:基于序列的SNP调用涵盖了HM550的几乎所有552,710个基因座 ,测序与基因分型调用的一致性> 99.5%(表1和补充表7a)。少数分歧主要是低序列深度区域的杂合位置(GT> seq)的呼声,为我们提供了假阴性的率<0.35% from the ELAND analysis (see Table 1). The other disagreements (0.09% of all genotypes) included errors in genotyping plus apparent tri-allelic SNPs (Supplementary Table 7a). The main cause of genotype error (0.05% of all genotypes) is the existence of a second ‘hidden’ SNP close to the assayed locus that disrupts the genotyping assay, leading to loss of one allele and an erroneous homozygous genotype (Supplementary Figs 13 and 14).   To examine the accuracy of SNP calling in more detail, we compared our sequence-based SNP calls with 3.7 million genotypes (HM-All) generated for this sample during the HapMap project (Table 1 and Supplementary Table 7b)18 and found excellent concordance between the data sets. Disagreements included sequence-based under-calls of heterozygous positions in regions of low read depth. The slightly higher level of other disagreements (0.76%) seen in this analysis compared to that of the HM550 data (0.09%) is in line with the higher level of underlying genotype error rate of 0.7% for the HapMap data18. To refine this analysis further, we generated a set of 530,750 very high confidence reference genotypes comprising concordant calls in both the HM550 and HM-All genotype data sets. Comparing the results of the MAQ analysis to this high confidence set (see Table 1), we found 130 heterozygote under-calls GT>SEQ(即假阴性率为0.025%) 。还有130个杂合子过度呼叫seq> gt,但是其中大多数可能是基因型错误 ,因为82个附近的“隐藏” SNP和3个附近的Indel。另外41个是三平台基因座,通过测序最多可以留下4个潜在的错误调用(即,假阳性速率为每529,589个位置4)。最后 ,我们从序列数据中选择了新的SNP调用子集,并通过基因分型进行了测试 。我们发现序列和基因型调用之间的一致性为96.1%(补充表8)。但是,这47个分歧包括10个正确的测序调用(由于隐藏的SNP而导致的基因分型呼叫)和7种测序下接来的呼叫。因此 ,在此基础上,一百万个新型SNP的假阳性发现率为2.5%(1,206个中的30个) 。对于本分析中检测到的四百万个SNP的整个数据集,假阳性和负率均平均<1%.   This genome from a Yoruba individual contains significantly more polymorphism than a genome of European descent. The autosomal heterozygosity (π) of NA18507 is 9.94 × 10-4 (1 SNP per 1,006 bp), higher than previous values for Caucasians (7.6 × 10-4, ref. 12). Heterozygosity in the pseudoautosomal region 1 (PAR1) is substantially higher (1.92 × 10-3) than the autosomal value. PAR1 (2.7 Mb) at the tip of the short arm of chromosomes X and Y undergoes obligatory recombination in male meiosis, which is equivalent to 20× the autosome average. This illustrates a clear correlation between recombination and nucleotide diversity. By contrast, the 0.33-Mb PAR2 region has a much lower recombination rate than PAR1; we observed that heterozygosity in PAR2 is identical to that of the autosomes in NA18507. Heterozygosity in coding regions is lower (0.54 × 10-3) than the total autosome average, consistent with the model that some coding changes are deleterious and are lost as the result of natural selection22. Nevertheless, the 26,140 coding SNPs (Supplementary Fig. 15) include 5,361 non-conservative amino acid substitutions plus 153 premature termination codons (Supplementary Table 9), many of which are expected to affect protein function.   We performed a genome-wide survey of structural variation in this individual and found excellent correlation with variants that had been reported in previous studies, as well as detecting many new variants. We found 0.4 million short indels (1–16 bp; Supplementary Fig. 16), most of which are length polymorphisms in homopolymeric tracts of A or T. Half of these events are corroborated by entries in dbSNP, and 95 of 100 examined were present in amplicons sequenced from this individual in ENCODE regions, confirming the high specificity of this method of short indel detection. For larger structural variants (detected by anomalously spaced paired ends) we found that some were detected by both long and short insert data sets (Supplementary Fig. 17a), but most were unique to one or other data set. We observed two reasons for this: first, small events (<400 bp) are within the normal size variance of the long insert data; second, nearby repetitive structures can prevent unique alignment of read pairs (see Supplementary Fig. 17b, c). In some cases, the high resolution of the short insert data permits detection of additional complexity in a structural rearrangement that is not revealed by the long insert data. For example, where the long insert data indicate a 1.3-kb deletion in NA18507 relative to the reference, the short insert data reveal an inversion accompanied by deletions at both breakpoints (Fig. 4). We carried out de novo assembly of reads in this region and constructed a single contig that defines the exact structure of the rearrangement (data not shown).   We discovered 5,704 structural variants ranging from 50 bp to >与参考基因组相比 ,Na18507基因组缺乏序列的35 kb 。我们观察到这种类型的事件数量稳步减少,大小增加,除了两个峰(补充图18)。在300–350 bp处的大峰代表的大多数事件都包含一系列Aluy家族。这与参考基因组中存在但NA18507基因组中缺少的短散布核元件(SIN)的插入一致 。同样 ,在6-7 kb处的第二个较小的峰是在许多情况下插入长插入式核元件(线)L1 HOMO SAPIEN(L1HS)的结果。我们发现结果与参考数据之间的良好对应关系。23 ,根据异常的fosmid配对端间距,该人在该个体中报告了148个<100 kb的缺失 。我们发现了其中111个事件的支持证据。我们在60-160 bp的范围内检测到另外2​​,345个插入,这是NA18507基因组中存在的序列 ,并且参考基因组中没有(补充图19)。一个示例显示在补充图20中 。事件的任一侧读取的“单身人士 ”读取,其伴侣与参考的伙伴不符,构成了从头组装的一部分 ,这些组件的一部分精确地定义了新的序列和断点(补充图21)。
http://http://www.0517kq.com/news/show-8128.html/sitemaps.xml http://http://www.o-press.com/news/show-272.html/sitemaps.xml http://http://www.o-press.com/news/show-47.html/sitemaps.xml http://http://www.o-press.com/news/show-117.html/sitemaps.xml http://http://www.o-press.com/news/show-375.html/sitemaps.xml http://http://www.0517kq.com/news/show-8381.html/sitemaps.xml http://http://www.o-press.com/news/show-274.html/sitemaps.xml http://http://www.0517kq.com/news/show-8270.html/sitemaps.xml http://http://www.o-press.com/news/show-330.html/sitemaps.xml http://http://www.0517kq.com/news/show-8316.html/sitemaps.xml

本文来自作者[qingdaomobile]投稿,不代表青鸟号立场,如若转载,请注明出处:https://www.qingdaomobile.com/life/202506-27290.html

(7)

文章推荐

  • 联系网红转发价位(转发网红的视频可以涨粉吗)

    抖音粉丝多少可以赚钱1、抖音用户需要达到1000粉丝以上才能开始赚钱。抖音官方不会直接根据粉丝数量支付工资,但粉丝数达到1000后,用户可以通过开设橱窗、直播带货等方式获得收入。持续发布高质量的短视频是吸引粉丝关注的关键。2、以上。广告合作:当抖音粉丝数量达到1000以上时,会有广告主联系,希望

    2025年03月18日
    61
  • 【疫情空调,疫情 空调】

    疫情期,汽车空调需要怎么杀菌消毒?1、在疫情期,汽车空调杀菌消毒需要重点针对空调滤芯、空调管道和蒸发箱进行,同时可以考虑使用臭氧进行全面消毒。空调滤芯:空调滤芯是空气净化的第一道屏障,应定期更换。选择能高效过滤PM5或除甲醛的滤芯,以保障车内空气质量。空调管道:特别是外循环管道,容易积累灰尘和细菌

    2025年04月05日
    47
  • 北京新增1例境外输入疑似病例(北京新增1例境外输入确诊病例)

    北京新增境外输入确诊复阳1例行踪轨迹公布!【北京新增1例境外输入性恢复确诊病例】11月4日0时至24时,北京新增1例境外输入性恢复确诊病例至新冠肺炎;无新增报告本地确诊病例、疑似病例和无症状感染者。据河南省襄城县新冠肺炎疫情防控指挥部办公室消息,2021年9月21日,襄城县发现1例境外〔刚果(金)

    2025年04月18日
    48
  • 盗贼制毒任务(盗贼制毒任务多少级能做)

    TBC怀旧服:盗贼想学毒药技能?想喝菊花茶?先做职业任务吧!级职业任务:当盗贼玩家达到10级后,通过完成一系列职业任务,能够获得首把利器【狡诈之刃】,这把匕首对于早期装备匮乏的盗贼来说非常有用。16级菊花茶配方任务:在16级时,盗贼玩家可以通过完成特定的任务线来获得菊花茶配方。完成任务:完成训练师

    2025年04月22日
    49
  • 【北京疾控公布最新检测阳性率,北京最新阳性患者】

    测艾滋病试纸准确率1、艾滋病检测试纸的准确度,是否能够替代医院检测,甚至达到100%?答案是肯定的。美国雅培四代试纸与国产常用试纸如万孚、艾博、准信、中兴科炬等均采用三代抗体检测技术,只要通过了窗口期,试纸检测结果与医院检测一致,且都得到了国家卫健委的认可与批准,通过了国家部委审批。准确率理论上可

    2025年05月08日
    37
  • 巫师2隔墙有耳/巫师2隔墙有耳任务失败

    巫师2巴尔提摩的噩梦杀不杀3个矮人1、【可疑:托瑞克】在主线【王家之血】进行到发生暴动需要听取各方意见时,与三父城堡内一个身穿蓝衣,外面套着绿夹克的矮人工匠谈话开启,然后需要支线【巴尔提摩的噩梦】中得到的●托瑞克的钥匙●,并从托瑞克的房间中拿到●欧尔康的收据●,了解到欧尔康找托瑞克仿制了萨琪亚惯

    2025年05月18日
    34
  • 全国疫情风险等级地区名单(全国疫情风险等级分布)

    全国中高风险地区最新名单附实时查询入口1、通过国务院官方微信小程序,直接点击进入获取最新风险等级信息。上海本地宝也提供风险专题服务,同样点击进入获取全面数据。请注意,以上数据仅限于中国大陆地区,不包括港澳台。信息权威来源于各地政府和卫健委的官方发布,确保准确性。2、全国中高风险地区名单高风险地

    2025年05月26日
    37
  • 【卧室床头朝东,卧室床头朝东还是头朝西好 风水】

    床头朝东挂什么最吉利1、床头朝东挂花鸟画或寓意吉祥的画最吉利。床头朝东属于东方木属方位,适合挂的画很多。花鸟画是国画题材中的一种,大自然中的花卉草木虫鱼都带着好的寓意和祝福,因此花鸟画是非常合适的选择。2、在床头朝东的位置挂一幅描绘日出或春天的画作,被传统文化认为能够带来好运和财富。这种画作代表

    2025年06月05日
    31
  • 魔兽世界8.0属性换算/魔兽世界各项属性

    魔兽世界8.0射击猎属性选择优先级魔兽世界0射击猎属性选择优先级如下:敏捷:这可是射击猎的首要属性,优先级最高,能加就加,别犹豫!精通:紧随敏捷之后,稳定的收益让你在战斗中更加游刃有余。急速:有4个固定的阈值点,在这些点上急速的收益极高,能超过精通哦,记得根据网络延迟自行调高1%-2%。在魔兽世界

    2025年06月14日
    17
  • 保时捷的车型(保时捷的车型有哪几款)

    保时捷车型有哪些女孩适合开的保时捷车型主要包括以下几款:保时捷718车型定位:入门级跑车。特点:保时捷718以其个性化的外形和高回头率吸引了许多女性消费者。虽然其性能在同级别车型中不算强劲,但作为一款炫耀神器或颜值车型,它无疑是成功的。适合追求时尚与个性,偶尔享受驾驶乐趣的女性。保时捷Mac

    2025年06月15日
    18

发表回复

本站作者后才能评论

评论列表(4条)

  • qingdaomobile
    qingdaomobile 2025年06月17日

    我是青鸟号的签约作者“qingdaomobile”!

  • qingdaomobile
    qingdaomobile 2025年06月17日

    希望本篇文章《使用可逆终结剂化学精确的整个人类基因组测序》能对你有所帮助!

  • qingdaomobile
    qingdaomobile 2025年06月17日

    本站[青鸟号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • qingdaomobile
    qingdaomobile 2025年06月17日

    本文概览:  我们的X染色体研究使我们能够开发一组综合方法,用于快速测序和分析整个人类基因组。我们对来自尼日利亚伊巴丹的男性约鲁巴人的基因组进行了测序(YRI,样本NA18507)。该样...

    联系我们

    邮件:青鸟号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们