南京初级WGCNA

时间:2022年06月18日 来源:

WGCNA的目的:先给大家讲讲WGCNA的精髓,其实就一句话:关联表型和基因。WGCNA通过将基因进行分组(module),把基因模块和表型进行关联,实现了快速锁定基因的目的。WGCNA的步骤:WGCNA需要读入的数据有两个:基因表达谱数据样本表型数据我们采用WGCNA的示例数据来给大家进行解读。整体来讲,WGCNA的分析流程是很繁琐的,一个全套的分析可能会涉及8-9个步骤,但是,这里面有很多步骤其实无关紧要,跟分析的主线,也就是“筛选与表型相关的基因”是脱离的。WGCNA(Weighted Gene Co-Expression Network Analysis)就是一种适合进行多样本复杂数据分析的工具。南京初级WGCNA

生信分析加权基因共表达网络分析(WGCNA,Weightedcorrelationnetworkanalysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治于靶点。生信分析共表达基因指的是表达量具有协同变化趋势的基因集中,通常认为这些基因参与相同的生物学过程,比如参与同一个代谢通路,正是由于功能上的协同作用,导致表达量呈现出高度相关性。南京初级WGCNAWGCNA主要运用于在大样本基因表达数据。

GenesignificanceGS:将指定基因的表达量与对应的表型数值进行相关性分析,终的相关系数的值就是GS,GS反映出基因表达量与表型数据的相关性,GS越高表明指定基因与研究表型越相关。Modulesignificance:给定module中所有基因的GS平均值。反应了指定module与表型数据的相关性,Modulesignificance越高表明指定module与研究表型越相关。Eigengenesignificance:模块特征(ME)与样本性状的相关性。跟Modulesignificance表明的一样,也是指定module与表型数据的相关性,值越高表明指定module与研究表型越相关。Connectivity:在加权共表达网络中,由于每条边两个基因间的相关性的大小,对应一个数值,所以一个基因在共表达网络中的Connectivity定义为与该基因相连的所有边的数值之和。另外,根据相连的基因是否和该基因位于同一个module,又可以将边分为两类,和该基因位于同一个module内,定义为within,位于不同的modules,定义为out。可根据within的connectivity来确定该module的hub基因。Hubgene:这个定义是“highlyconnectedgene”的缩写。表示在共同表达模块内的具有高Connectivity的基因

Adjacency Matrix 邻近矩阵:是图的一种存储形式,用一个一维数组存放图中所有顶点数据;用一个二维数组存放顶点间关系(边或弧)的数据,这个二维数组称为邻接矩阵;在WGCNA分析里面指的是基因与基因之间的相关性系数矩阵。 如果用了阈值来判断基因相关与否,那么这个邻近矩阵就是0/1矩阵,只记录基因相关与否。但是WGCNA没有用阈值来卡基因的相关性,而是记录了所有基因之间的相关性。Topological Overlap Matrix (TOM) WGNA认为基因之间的简单的相关性不足以计算共表达,所以它利用上面的邻近矩阵,又计算了一个新的邻近矩阵。一般来说,TOM就是WGCNA分析的终结果,后续的只是对TOM的下游注释。WGCNA共表达网络分析-让你的文章闪耀起来。

WGCNA的出发点是基于系统的基因表达水平来构建一个网络,目的是显示出基因间的共表达关系,那么相似表达模式的基因可能存在共调控、功能相关或处于同一通路;即如果某些基因的表达趋势随着不同处理之间的变化而有相同的变化趋势(表达模式),那么我们认为这些基因很可能在一个通路上,或者在相互调控的通路上富集。WGCNA其译为加权基因共表达网络分析。该分析方法旨在寻找协同表达的基因模块(module),并探索基因网络与关注的表型之间的关联,以及网络中的基因。适用于复杂的数据模式,推荐15个样品以上的数据。现在测序价格越来越便宜,得到15个样品数据的成本很低,如果再结合样品性状数据进行模块基因与表型的关联分析,一定能给你的文章增色不少!如果自己手里没有数据,利用公开的数据挖掘分析也是不错的选择。WGCNA(加权基因共表达网络分析)这一利器,可以用来寻找基因将有相同或相近表达模式的基因。西安WGCNA数据库分析

WGCNA分析+公共数据库挖掘你感兴趣的。南京初级WGCNA

    共表达网络:定义为加权基因网络。点基因,边基因表达相关性。加权是指对相关性值进行冥次运算(冥次的值也就是软阈值(power,pickSoftThreshold这个函数所做的就是确定合适的power))。无向网络的边属性计算方式为abs(cor(genex,geney))^power;有向网络的边属性计算方式为(1+cor(genex,geney)/2)^power;signhybrid的边属性计算方式为cor(genex,geney)^powerifcor>0else0。这种处理方式强化了强相关,弱化了弱相关或负相关,使得相关性数值更符合无标度网络特征,更具有生物意义。如果没有合适的power,一般是由于部分样品与其它样品因为某种原因差别太大导致的,可根据具体问题移除部分样品或查看后面的经验值。Module(模块):高度內连的基因集。在无向网络中,模块内是高度相关的基因。在有向网络中,模块内是高度正相关的基因。把基因聚类成模块后,可以对每个模块进行三个层次的分析:1.功能富集分析查看其功能特征是否与研究目的相符;2.模块与性状进行关联分析,找出与关注性状相关度比较高的模块;3.模块与样本进行关联分析,找到样品特异高表达的模块。南京初级WGCNA

广州市智汇基因科技有限公司位于元岗横路31号4层B1412,B1413房,是一家专业的技术服务生信分析、生物信息分析、多组学分析、生物信息个性化分析、数据挖掘、质量保证。常见数据库挖掘:TCGA、GEO、ICGC等数据库下载、整理与挖掘,差异分析,预后分析,生存分析,WGCNA,免疫浸润分析,蛋白互作分析。R可视化分析,画图(热图,火山图,气泡图,韦恩图,相关性图。公司。致力于创造***的产品与服务,以诚信、敬业、进取为宗旨,以建智汇基因,科研风暴产品为目标,努力打造成为同行业中具有影响力的企业。我公司拥有强大的技术实力,多年来一直专注于技术服务生信分析、生物信息分析、多组学分析、生物信息个性化分析、数据挖掘、质量保证。常见数据库挖掘:TCGA、GEO、ICGC等数据库下载、整理与挖掘,差异分析,预后分析,生存分析,WGCNA,免疫浸润分析,蛋白互作分析。R可视化分析,画图(热图,火山图,气泡图,韦恩图,相关性图。的发展和创新,打造高指标产品和服务。自公司成立以来,一直秉承“以质量求生存,以信誉求发展”的经营理念,始终坚持以客户的需求和满意为重点,为客户提供良好的生信分析,SCI,TCGA,GEO,,单细胞测序,网络药理学,WGCNA,KEGG,从而使公司不断发展壮大。

信息来源于互联网 本站不为信息真实性负责