生物信息学的Home for Researchers

发布时间:2023-03-01文章作者:转载审核:阮丽红浏览次数:904

                  作者:转载至科研者之家   审核:阮丽红   编发:赵则月

作为科研者,如果你到现在还不知道生物信息学,那真的太out了,生信有多火?拿最有名的数据库TCGACancer Genome Atlas)来说,目前已经收录了来自1万多例病人的33种癌症的数据,2.5PB的数据量。pubmed中随便搜一个TCGA,就可以发现近年来相关文献发表量在成指数级增长。

这其中,一部分是利用TCGA数据库发表的纯生信文章,比如发表在Cell上的一篇Comprehensive Characterization of Cancer Driver Genes and Mutations


也有很多利用TCGA数据库的图片给文章增色的,比如201934,耶鲁大学陈列平教授团队在Nature Medicine上发表题为Siglec-15 as an immune suppressor and potential target for normalization cancer immunotherapy 的文章,里面就利用TCGA数据库分析了Siglec-15 T cell signature genes (CD3E, IFNG, GZMA and GZMB) 在膀胱癌中的关系。



而这些都不需要额外的湿实验,大大提高了临床医生的科研效率。这也是生信之所以火的原因了。

但你可能要问,如果不会R语言,不会代码,怎么利用利用生信来提高科研效率呢?

或许参加过好几千一次的培训班,但结果就是,课堂上什么都会,一回去自己弄马上就被各种报错打败,自学视频,同样是困难重重。

科研界一直需要一个功能强大,不需要代码,可视化分析工具。

国内知名科研工具箱平台——科研者之家(Home for Researchers上有一个生信零代码版块:

已经有数十种分析模块,整合了TCGA,GEOTargetICGCCCLE五大公共数据库的样本数据,可以直接拿来用。

平台是由几个临床医生联合生信大拿一起搭建,界面极其简介。

比如在TCGA模块,左侧栏就是TCGA上所有33种肿瘤类型,之后第二期会纳入非肿瘤的疾病。顶部是各种分析模块。首页特别注明了,所有数据均由R v4.0.3分析完成, 意思就是说在平台上分析的结果和拿R语言敲代码分析的结果是完全一样的。


别看界面简单,该平台功能极其强大,比如想分析下“某个基因在肺腺癌里EGFR突变和野生型病人中表达水平和预后差异”就轻而易举。


平台有极其强大的样本筛选功能,可以对样本进行除了临床信息,治疗信息的进一步筛选外,比如可以根据某一个基因是否突变筛选,某一个基因的表达量水平进行筛选,比如近年来火热的肺腺癌EGFR野生型伴PDL-1低表达相关研究,就完全没问题了。这也是目前已知所有第三方网站无法实现的。


样本筛选好后,就可以选择需要的功能模块进一步分析啦。单样本分析,顾名思义就是针对某一个样本的分析,里面的工具目前包括了临床信息比较,批量生存分析,基因与生存,基因与TMB/MSI,桑基图,两基因相关性。


而多样本分析,就是针对某几个样本之间差异的比较,目前包括以下工具:

多组生存,基因表达比较,miRNA比较,突变比较,免疫评分,免疫检查点,甚至铁死亡,m6A

在复杂分析里,集成了以下耳熟能详的分析模块,比如亚组分型,基因突变景观,差异基因分析,预后模型(列线图),预后模型(Signature),泛癌分析。


然后,在思维导图和视频教程里,讲解了如何使用“十字研究法”,交叉运用单样本和多样本工具,让课题设计思如泉涌。


这些分析如果让公司去做,估计要几百上千甚至上万了,而这个平台鼠标点击几下,就可以生成所有的高清矢量图,更重要的是还有对应的原始数据下载,这个相当重要。不仅如此,平台还针对每一个分析结果,给出了对应图例,方法学,结果的中英文对照,和参考文献,这个对我们写文章也很重要。