人类短串联重复序列 - 范文中心

人类短串联重复序列

05/24

人类短串联重复序列(STR)的研究进展

短串联重复序列( Short tandem repeat ,STR) 又称 微卫星DNA , STR 是一种可遗传的不稳定的并且具有高度多态性的短的核苷酸重复序列. STR 多态性具有种类多, 分布广, 高度多态性等特点, 并按孟德尔遗传规律[ 1 ]在人群中世代相传. 通过对STR 多态性的认识, 极大地推动了人类基因组的研究. 这种多态性标志已广泛用于构建人类遗传连锁图谱、基因定位、遗传病诊断、肿瘤细胞染色体分离与重组以及亲子鉴定等法医学检查.

DNA 遗传标记的多态性研究发展按时间顺序可分为三代[4 ]。第1代遗传标记:限制性片段长度多态性( restriction fragment length polymorphism, RFLP)是Wyman 和White 于1980年偶然发现的, 人类14号染色体上存在DNA 片段长度有变化的区域, 这些区域的结构特点是DNA 由一段序列串联重复、首尾相接而成。重复次数可在几次至数百上千次之间变化。DNA 重复单位长度在数bp 至数十bp 之间, 组成串联重复的DNA 是小卫星DNA 。第2代遗传标记:短串联重复序列是由Holly 等发现的重复单位的长度只有2~6 bp、重复次数一般在数次至几十次之间的串联重复DNA 序列, 即微卫星DNA 。微卫星DNA 的等位基因片段的长度一般在400 bp以下, 故又称为短串联重复序列( STR)。第3代遗传标记:单核甘酸多态性( single nucleotide polymorphism, SNP)是单个碱基的置换、插入或缺失而形成的, 是美国MIT 提出的新一代多态性标记系统[5],近年来成为多种研究的焦点。虽然SNP 的多态性位点是最多的, 能比STR 提供更全面的基因信息, 但是STR 还是以其独特的优点保存下来, 仍被广泛的研究。

1.1 STR 的构成 STR 的核心序列为2~7bp , 呈串联重复排列. 重复次数10~60 次左右, 其总长度常小于400 bp.常见的有一、二、三、四核苷酸重复序列, 约占真核生物基因组的5 %. 人类基因组的STR 单核苷酸重复以polyA ,polyT 多见, 双核苷酸重复以(CA) n ,( GT) n , (AA) n , ( GG) n 常见, ( GC/ CG) 少见, 其原因是由于3′端为G 的C(即CPG) 易于甲基化. 三核苷酸重复以(CXG) n 类型常见, 由于三核苷酸具有高度多态性, 常用作DNA 的标记物.

每个特定位点的STR 均由两部分构成:中间的核心区和外围的侧翼区. 核心区含有一个以上称为“重复”的短序列, 一般该重复单位的碱基对数目不变, 而串联在一起的重复单位数目是随机改变的, 如果用一种不切重复单位的限制性内切酶把DNA 分子切割成限制性片段, 该限制性片段中位于核心区的外围即是侧翼区. 人群中不同个体可表现为侧翼区相同而串联重复单位的数目不同; 也可为相同数目的重复单位, 但侧翼区大小不同, 或者两者均不同. 通过对那些非STR 位点的DNA 限制性片段长度多态性( Rest riction f ragment lengthpolymorphism ,RFL P) 研究表明, 每个位点的RFL P 仅能检测到1 个或数个等位基因. 因此可以推论,STR 位点的侧翼区变异数也仅有少数几个. 这样, 人群中该特定STR 位点的等位基因差异, 主要应来自不同数目的串联重复[2,3]。

1.2 STR 的分布 据GeneBank 等数据库资料统计, 人类23 对染色体上至少分布着7901个STR 位点, 每对染色体的STR 位点分别超过100个, 其中1、2号染色体的位点均超过600个, 性染色体上的已知位点数在264 个以上, 现有的STR 位点覆盖长度达4000cM, 平均间距0. 7 cM 。随着人们对STR 的进一步研究, 其数目还会不断增加。

1.3 STR 的种属特异性 与多种基因座的指纹图不同, 大多数STR 具有人的种属特异性, 至少是具有灵长类的种属特异性。1995年有学者[ 6 ]调查了9个STR 的人种属特异性, 结果在被调查的23种动物中, FES/FPS基因座没有扩增产物, 而CSF1PO 、TOX 、TH01、HPRTB 、vWA 、F13A01等基因座则在灵长类有扩增产物, 但是这些扩增产物的长度均位于这些基因座的STR 的等位基因Ladder 范围之外。此后对更多STR 基因座的调查也得到了相似的结论。

1.4 STR产生的可能机制 目前认为链滑动错配是短串联重复序列突变的主要机制。在DNA 合成过程中, 一条单链DNA 可以发生一过性的脱位, 生成一个中间性的结构后, 再与另一DNA

单链错配, 形成链滑动错配, 继续DNA 的复制和修复。滑动错配可以造成缺失、插入或碱基替换。在STR 中, 一条DNA 单链可以向后折叠后再与另一条单链复性, 在复性的位置形成环状突出,DNA 修复酶可以将环状突出全部或部分切除, 造成缺失。另一方面, 也可以在无突出链相对突出的位置形成一个缺口, 再由聚合酶填补此缺口,DNA 重复的数目增加, 造成插入突变。STR 长度上的差异一般是重复单位的整数。复制滑动、姐妹染色体不等交换和遗传重组都是可导致重复单位数目发生改变的机制, 但目前的研究证明复制滑动时导致STR 重复数目改变是主要机制。链滑动错配还可以发生在一段单链的DNA 片段, 多见于回文序列或回文样序列。如CTGCAG 和GCCNNNNNGGC 。回文序列自身互补形成发夹结构, 也能造成缺失或插入。不过, 仅滑动链复制错配不能解释一些重复序列的特征, 如为什么两性种系的三体重复稳定性有差异? 为什么CAG 重复总在有意义链上等等? 所以, 对STR 产生和拷贝数的变异的遗传机制解释还有滚环扩增、不等交换( unequalcrossover)和碱基置换突变

等。

2 基于STR 的应用研究

单个基因座的STR 的遗传信息是很有限的, 复合扩增可以增加遗传多态性信息, 提高工作效率。在复合扩增中, 多对引物在同一反应管中进行。引物之间的互相作用, 可导致非特异性的扩增产物出现, 影响STR 的分型。经大量的研究证明, 只要复合扩增的条件是适当的, 在绝大多数的情况下, 复合扩增从双基因座扩增、三基因座扩增、四基因座扩增、七基因座扩增, 直至15个STR 基因座和一个性别基因同时复合扩增, 检测方法从银染方法到用荧光标记引物在自动测序仪中自动分型, 单基因座扩增与复合扩增的STR 分型具有相同的结果。

目前STRs- PCR 技术已形成多位点检测方法, 即在同一分析反应中同时扩增来自两个或更多的位点的等位基因, 扩增的重复序列由于重复次数的差异导致STR 基因座的等位基因分型不同, 在电泳分离后, 用放射性同位素、银染或荧光检测可区别不同的基因型。STRs- PCR 产物具有不连续的可分离的长度, 可以用每个基因座的几个或所有等位基因的片段构建成等位基因阶梯( allelic ladder) , 肉眼观察或利用仪器比对同一基因座的等位基因阶梯和扩增样品, 从而快速和准确地确定等位基因座。

2.1 STR 应用于制作人类基因组遗传图谱 遗传图谱( geneticmap) 是指人类基因组内基因和专一的多态性DNA 标记相对位置的图谱。STR 在基因组内分布广泛、多态性程度高、可自动化检测、成为制作基因组遗传图谱的首选遗传标记。STR 作为遗传标记使人类基因组的遗传制图和连锁分析发生了革命性的变化。1996年, 法国Gene-thon 实验室与美国国家卫生研究院几个中心合作, 建立了以6000多个STR 为主体遗传标记、分辨率达194 kb 的高精密度图谱[ 7 ]。STR 的出现使遗传图的精度得到进一步提高, 同时也成为物理图上的标记, 从而促进了遗传图与物理图的融合。利用STR 作为遗传标记, 人类基因组计划中的物理图于2000年也顺利完成[ 8 ]。

2.2 STR 用于法医学个体识别和亲权鉴定 法医检案中, 经常会遇到极少量和较大降解的生物检材, 最好的方法是用PCR 扩增STR 。人体血液、精液、精斑、毛发、指甲、骨和牙齿均可作为分析STR 的DNA 来源[ 9 ]。正是因为STR 广泛存在于人类基因组中, 具有高度多态性、杂合性和稳定性。当把几个STR 位点联合分析后, 可以得到相当高的累积个体识别率和父权排除率。据统计, 两个无亲缘关系的个体基因型完全一致的概率

[ 12 ]。。在由国际刑警组织注册的对性侵犯定罪的立法提案程序中, 所有参与的实验室都必

须检测4 个重要位点, 即: THO1、VWA 、FGA 和D21S11, 他们的个体识别能力强而有效, 已成为欧洲众所周知的核心位点, 1999年后又扩展了另外的3 个位点。最近在北美已经引入以STRs 为基础的DNA 索引数据库, 建立了13 个STRs 位点的复合扩增: THO1、VW A 、FGA 、TPOX 、CSF1PO 、D3S1358、D5S181、D3S820、D8S1179、D13S317、D16S539、D18S51 和D21S11。

2.3 STR用于遗传学多态性研究

STR 标记多位于非编码区, 变异一般不影响人体的结构与功能, 突变在进化过程中受自然选择压力较小, 以近乎稳定的速率传递且不断积累, 形成多样性。通过研究STR 多态性, 变异速率以及比较序列间差异、人群间差异, 分析不同人群间的遗传距离, 就可从分子生物学角度揭示人类的起源、迁徙、进化等历史进程[ 13 ]。目前, 根据mtDNA 、STR 标记、Y 染色体DNA 以及多态性Alu I 序列的研究, 大多数分子遗传学家支持现代人类单起源学说, 认为现代人类起源于20万年前的非洲原始部落, 然后向世界各地迁徙。但也有学者支持现代人类多起源, 认为除非洲外, 亚洲、欧洲也可能是人类发源地。Karafet[ 14 ]等通过Y - DNA创立者单体型的分析揭示存在1个以上的父系创立者单体型, 美洲土著具有亚洲起源。

2.4 STR 在疾病诊断和治疗中的应用 DNA 多态遗传标记的建立为基因染色体定位奠定了基础, 家系连锁分析是目前最常用的基因定位方法。目前连锁分析定位基因所用的遗传标记主要是STR 。STR 等位基因数目较多, 可提供的信息量大, 因而在进行连锁分析时所需的样品数比采用双等位基因标记( SNP)时要少, 适用于致病基因的初步定位[ 15 ]。

2.4.1 STR 与遗传病的诊断 近年来, 发现基因内外的一些STR 与遗传病的发病有关. 目前报道较多的疾病有7 种遗传病与三核苷酸重复片段扩增突变有关:脆性X 综合征、脊髓延髓肌肉萎缩、强直性肌营养不良、Huntington 舞蹈征、脊髓小脑共济失调Ⅰ型、FRAXE 轻度智力低下和齿状核苍白球丘脑下部萎缩. 在脆性X 综合征中,FMR1gene 中的(CGG) 顺序在正常人中的重复次数少于60 次, 携带者60~100 次, 而发病者则多于100 次. 也有人用STR 来研究单基因病, 如苯丙酮尿症等[ 15 ]. 现在,STR 越来越多用于研究多基因病, 如采用STR 对Ⅰ型糖尿病进行全基因组扫描, 发现12 个位点与该疾病高度相关, 其中包括HLA22 抗原位点. 更多的人开始用STR 方法对高血压、哮喘和Ⅱ型糖尿病进行了研究。

2.4.2 STR 与肿瘤的诊断 微卫星DNA 由于复制错误引起简单重复序列改变, 常产生微卫星不稳定性( Microsatelliteinstability ,MSI) , 表现为肿瘤组织与其相应非肿瘤组织DNA 结构性等位基因的大小发生改变. 它在胃肠道肿瘤的发生、发展过程中扮演重要角色, 可能是肿瘤发生的一种新机制. MSI 首先在结直肠癌中观察到,1993 年, 有的学者在研究遗传性非息肉大肠癌中观察到多条染色体均有短的核苷酸重复序列(CA) n 的增加或丢失, 提示MSI 散布于整个基因组中. 后来陆续在子宫内膜癌、肺癌、乳腺癌、食管癌以及慢性髓细胞性白血病中都出现MSI , 人们认为MSI 可能在肿瘤基因调控中起重要作用, 参与肿瘤的发生和发展. 这种基因水平的改变常先于表型的改变, 通过MSI 的检测有助于早期发现某些肿瘤及对高危人群进行早期防治.

2.4.3 STR 用于器官移植 目前, 各种器官移植技术在国内外已有一定发展, 利用基因诊断技术进行术前组织配型, 提高了器官移植的成功率; 而对器官移植后植入状态的检测, 对了解受者治疗疗效、指导医生用药、预后估测等更是有重要意义。朱平[16 ]等认为STR 作为骨髓移植后供者细胞植活的证据是很客观的:供者细胞植活后, 受者外周血出现供者的STR 类型, 而受者口腔黏膜细胞仍为原来类型。因此, 可以长期观察供者细胞在受者体内存活情况。

2.4.4 STR适合于降解、微量检材的检测 STR 的扩增片段大多在400 bp 以下, PCR扩增容易成功, 适用于降解检材的检验。灵敏度也高于VNTR, 达到ng 级。实验已经证明, 实验室条件下, 或模拟的各种环境条件下, 各种斑痕, 如血痕、精斑、阴道液斑, 甚至是自然条件下的骨头, 在数十年后仍能检出正确的STR 基因型。STR 的等位基因长度相差不大, 不易发生优势扩增

或杂合子等位基因丢失的现象。此外, STR还应用于古生物学、民族学、考古学等领域的研究。

3 STR的研究前景

一个良好的遗传标记应高度稳定, 具丰富的多态性, 且在全基因组的分布较均匀, 从简单高效的使用要求出发, 又希望尽可能少的遗传标记基因座, STR 基本符合上述要求,STR 绝大多数位于非编码区, 不转录, 不编码蛋白质和RNA, 不受选择压力的影响。而且STR 还具有容易扩增, 具有高杂合性, 片断小, 序列简单等特点[17]。因此, STR是很有发展前途的一种作为应用于筛选候选目的基因和研究人类进化史的遗传标记。目前, 对于STR 的产生机制和用途还不是很清楚, 对于STR 的产生进化机制和作用还了解很少, 还有许多重要的问题有待阐明, 如导致三核苷酸重复序列不稳定性和扩展的分子机理尚不十分清楚. 虽然目前有众多学说, 如染色体不对等交换、DNA 聚合酶在DNA 复制时的滑动, 具有前突变的始祖染色体DNA 序列的不稳定增加, 重复序列上游DNA 片段的插入等, 但都不能认为是突变的最好解释; 动态突变的致病机理尚未完全阐明. 随着STR 检测分型技术的不断更新和进步以及人类因组后基因时代的到来, STR的作用会日渐清楚, 也将发现更多的基因座及基因型。STR 将会应用于更多方面的研究, 而且在人类学、法医学等领域将体现出难以限量的价值。


相关内容

  • 分子标记的发展及分子标记辅助育种
    分子标记的发展及分子标记辅助育种 分子标记辅助选择育种(Marker Assisted Selection (MAS)或Marker Assisted Breeding)是利用与目标基因紧密连锁的分子标记或功能标记),在杂交后代中准确地对不 ...
  • 现代分子生物学课后答案
    现代分子生物学部分课后习题及答案 第一章 绪论 1. 你对现代分子生物学的含义和包括的研究范围是怎么理解的? 分子生物学是从分子水平研究生命本质的一门新兴边缘学科,它以核酸和蛋白质等生物大分子的结构及其在遗传信息和细胞信息传递中的作用为研究 ...
  • 几种生物新技术的研究进展
    三种生物新技术在微生物研究中的应用进展 摘 要:本文对几种时下比较热门的生物技术的应用原理.存在的问题和研究进展进行了简单阐述,并且结合自己研究的领域,浅析了这些新兴的生物技术在生物防治真菌中研究的实际应用. 关键词:微生物新技术:基因编辑 ...
  • C语言源程序
    C 语言程序设计 C 语言程序设计 1.程序运行从main()函数开始,也从main()函数结束. 2.函数是C 程序的,. 3.C 语言源程序是由函数组成,它们. 4.在C 语言源程序中,是必须有一个函数名为main 的函数.main() ...
  • 艾宾浩斯曲线
    德国心理学家艾宾浩斯(H.Ebbinghaus)研究发现,遗忘在学习之后立即开始,而且遗忘是进程并不是均匀的.最初遗忘速度很快,以后逐渐缓慢.他认为"保持和遗忘是时间的函数",并根据他的实验结果绘成描述遗忘进程的曲线,即著名的艾宾浩斯记忆遗 ...
  • Y1HGold单杂交酵母菌株使用说明
    Y1HGold单杂交酵母菌株  编号  名称 北京华越洋生物NRR00670  Y1HGold单杂交酵母菌株  基本信息: 名称:Y1HGold单杂交酵母菌株 规格:300ul甘油菌 储存温度:-­‐80℃ 基因组: MATα,  ura3 ...
  • 老男人们,生娃要抓紧啦!
    人常说女人年纪大了生孩子不好,但男人无论多少岁生孩子都没关系.要是你真的这样认为,就大错特错了.研究发现,大多数遗传突变都来自父亲,父亲年龄越大,孩子的基因突变率就越高,而母亲的年龄却对此没有影响.老男人们,生娃真的要抓紧啦! 迄今最大的人 ...
  • 2电子克隆技术及其在植物基因工程中的应用
    电子克隆技术及其在植物基因工程中的应用 王冬冬 朱延明 李勇 李杰 柏锡 ( 东北农业大学生命科学学院,黑龙江哈尔滨150030) 摘要:电子克隆是随着基因组计划和EST 计划的实施而发展起来的, 是利用生物信息学手段进行基因克隆的新方法. ...
  • 遗传多样性概述_沈浩
    文章编号:1008)9632(2001)03)0005)03 遗传多样性概述 沈 浩,刘登义 (安徽师范大学生物多样性研究中心,芜湖 241000) 摘 要:遗传多样性作为生物多样性的重要组成部分,是物种多样性.生态系统多样性和景观多样性的 ...
  • 蛋白质研究在植物发育过程中的应用
    广东林业科技 2008年第24卷第5期69 蛋白质研究在植物发育过程中的应用 祝 岩 姜春宁123 (1. 广东省林业种苗与基地管理总站 广州 510173; 2. 华南农业大学林学院) 摘要 蛋白质组学伴随后基因组学发展的需要而诞生, 其 ...