RNA-seq名词解释(1)

如题所述

RNA-seq,即转录组测序技术,利用高通量测序方法分析mRNA、smallRNA、noncodingRNA等RNA分子的表达水平。这项技术常用于识别差异表达基因(DEG)。
转录组是指一个生物体或特定细胞类型产生的所有转录本的集合。研究转录组能够从整体上分析基因功能和结构,揭示生物学过程和疾病发生中的分子机制,并在基础研究、临床诊断和药物开发等领域得到广泛应用。
基因是具有编码蛋白质或决定生物性状作用的一段DNA序列。
在测序质量评估中,Q20和Q30表示Phred评分大于20和30的碱基所占的百分比。Phred评分是负对数概率评分,用于表示测序错误率。
内含子是真核生物DNA中的非编码序列,存在于前体RNA中,但在成熟RNA中被剪接去除。
外显子是真核生物基因的一部分,在剪接过程中被保留并在蛋白质合成过程中表达。外显子是成熟RNA中存在的基因序列,也是转录产物的组成部分。
基因间区(intergenic)是指基因之间的非编码区域,这些区域不直接决定氨基酸序列,但可能通过转录后调控影响性状。
UTR是非翻译区域(Untranslated Regions),位于mRNA分子的两端,包括5'-UTR和3'-UTR。
转录本(transcript)是由基因转录产生的mRNA分子,它们可能是由不同的内含子剪接方式产生的不同形式。
同一种基因通过可变剪接或内含子选择机制可以产生不同的转录本,这些不同的转录本被称为isoforms。
基因家族(gene family)是指在真核生物中,相关的基因按功能分组,它们来源于同一祖先,通过基因重复产生的一组基因,这些基因在结构和功能上具有相似性。
GTF(gene transfer format)和GFF(general feature format)是基因结构注释文件,分别用于记录基因特征和基因组特征。
开放阅读框(ORF)是基因的连续核苷酸序列,从起始密码子到终止密码子,可以编码多肽链。
参考基因组(reference genome)是RNA-seq分析中使用的已知基因组序列。
小RNA(small RNA)是一类长度大约在18-30bp的非编码RNA分子,包括microRNAs、siRNAs和piRNAs,它们在基因表达调控等方面发挥重要作用。
非编码RNA(ncRNA)是指不编码蛋白质的RNA,包括rRNA、tRNA、snRNA、snoRNA和microRNA等多种已知功能的RNA以及未知功能的RNA。
长链非编码RNA(lncRNA)是一类长度在200-100000nt之间的不编码蛋白质的转录本。根据与编码基因的位置关系,它们可以分为多种类型。
以上内容是对原始文本的修改和润色,以确保语义清晰、条理正确,并纠正了可能的错误。
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜