太原定制化KEGG通路注释服务

时间:2022年04月01日 来源:

富集分析的NT法:网络拓扑结构,目前NT法有一些不同的思路:基于生物网络拓扑结构的富集分析方法,利用数据库中的基因相互作用关系来间接地把基因的生物学属性整合入功能的富集分析。利用网络拓扑结构来计算基因对特定生物通路的重要性并给予相应的权重, 然后再利用传统的ORA 或 FCS 方法来评估特定生物通路的富集程度,如 GANPA 和 LEGO 等;直接把基因列表中的功能富集问题利用网络转化为基因对的功能富集问题,如 NOA 等。优点:与传统方法相比,基于网络的基因功能富集分析方法加入了系统层面的基因重要性程度及关联信息,使得预测结果更加准确可靠。缺点:算法过于复杂,计算速度较慢。富集是指将基因按照先验知识,也就是基因组注释信息,对基因进行分类的过程。太原定制化KEGG通路注释服务

富集分析是将基因根据先验的知识(也就是常见的注释)进行分类的过程,很常见的富集分析是GO与KEGG富集。KEGG 是从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,可以了解生物系统中基因、蛋白及代谢物的功能和相互作用关系,可以查询到与代谢物相关的代谢通路、人类疾病及药物研发等信息。其中很为重点的数据库为KEGG PATHWAY和KEGG ORTHOLOGY 数据库。而在KEGG PATHWAY数据库中,将生物代谢通路划分为7类,分别为:新陈代谢、遗传信息加工、环境信息加工、细胞过程、生物体系统、人类疾病、药物开发。可以基于KEGG数据库对差异代谢物进行代谢通路富集分析,有助于理解在差异样品中代谢途径变化机制。在一些高分文献中会使用高效的气泡图(Bubble图)来展示富集分析结果。气泡图属于散点图的一种,它是在散点图的基础上改变点的形状、大小和颜色,而富集分析气泡图就是在笛卡尔坐标系中加入数量、p值等参数表示三个变量关系的图形。太原定制化KEGG通路注释服务选择合适的基因集大小:对于那些基因数不怎么多的通路,建议在分析中排除。

过分析(ORA)方法:算法原理.作为很早出现的一类基因功能富集方法,ORA针对的数据是一组感兴趣的基因(基因列表),其目的是在这组基因中发现有明显统计学上富集的基因功能集﹒其基本步骤包括先将给定的基因列表与待测功能集做交集﹐找出其同的基因并进行计数(统计值),利用统计检验的方式来评估观察的计数值是否明显高于随机,即待测功能集在基因列表中是否明显富集.常见的统计学方法有卡方检验,Fisher精确检验和二项分布检验,而其中很为较广使用的是Fisher精确检验,即利用2×2的列联表,根据超几何分布来检验基因列表中的基因在待测功能集中是否明显富集。常用方法和工具.目前有许多工具及数据库提供ORA的使用,包括DAVID, GOstat, Gen- MAPP 等.其中 DAVID提供的基因功能集数据库很为,不但包含大量不同物种的基因功能注释信息,也涵盖了主流的生物通路注释库如GO条目和KEGG通路而且还提供了基因名称转换功能,及良好的结果展示界面.因而, DAVID已成为目前应用很较广的ORA分析工具。

依据富集分析过程中基因选择、注释数据库的不同,常用的富集分析可以分为以下四种类型:GO term功能富集、KEGG pathway通路富集、MSigDB基因集富集和单基因富集等等。GO term功能富集:基因本体(gene ontology, GO)数据库是GO组织在2000年构建的一个结构化的标准生物学模型,涵盖了细胞组分、分子功能、生物学过程三个方面,是目前应用很较广的基因注释体系之一。GO的注释体系是一个有向无环图,包含三个分支,注释系统中每一个节点都是基因或蛋白质的一种描述,节点之间保持严格的“父子”关系。因此,一个基因或蛋白质可以从三个层面得到注释。基因集富集分析用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势。

选择基因标识符:在不同的数据库中,基因可能会有不同的标识符(ID)。这些基因标识符可能会出现,甚至还会过期。对于人类,作者推荐使用Entrez基因数据库的编号,或者是HUGO Gene命名委员会的官方符号。由于基因符号会随时间变化,因此要对同时维护基因符合和Entrez基因iD。g:Profiler和g:Convert工具能够实现多种基因编号到标准标号的转换。如果在你的通路分析中得到一些意外结果,这或许意味着你的试验设计、生成数据或分析出现了问题。举个例子,细胞凋亡(apoptosis)通路富集意味着实验的某些步骤导致了过多的细胞死亡。因此,你需要对你的实验过程进行调整,重新获取数据,用于后续分析。基因通路富集分析一般通过柱状图或者气泡图也就可以进行展示了。太原定制化KEGG通路注释服务

GO富集分析基本概念:利用GO数据库中的基因注释信息进行基因富集分析。太原定制化KEGG通路注释服务

NEA和 EnrichNet是两个基于网络距离的富集分析方法.它们的主要思路都是去检验一个给定基因列表在网络中与待检测的生物通路的基因功能集相对于随机是否具有明显短的网络距离.这两个方法的区别是NEA直接计算了给定基因列表与待检测基因功能集在网络中的平均连接度,并通过对网络进行随机重调的方式,来评估该统计量的明显程度;而EnrichNet采用重启型随机游走(random walk with restart,RWR)的算法来计算给定基因列表与待检测基因功能集在网络中的距离.然后利用随机网络与背景统计值进行比较来评估统计明显水平.但由于网络的复杂性及对网络进行随机重调的计算效率问题,这两个方法在实际应用过程中具有计算效率低的缺点。太原定制化KEGG通路注释服务

广州市智汇基因科技有限公司是一家技术服务生信分析、生物信息分析、多组学分析、生物信息个性化分析、数据挖掘、质量保证。常见数据库挖掘:TCGA、GEO、ICGC等数据库下载、整理与挖掘,差异分析,预后分析,生存分析,WGCNA,免疫浸润分析,蛋白互作分析。R可视化分析,画图(热图,火山图,气泡图,韦恩图,相关性图。的公司,致力于发展为创新务实、诚实可信的企业。公司自创立以来,投身于生信分析,SCI,TCGA,GEO,,单细胞测序,网络药理学,WGCNA,KEGG,是商务服务的主力军。智汇基因始终以本分踏实的精神和必胜的信念,影响并带动团队取得成功。智汇基因始终关注商务服务市场,以敏锐的市场洞察力,实现与客户的成长共赢。

信息来源于互联网 本站不为信息真实性负责