生物信息在生物研究中应用越来越多,生物各个分支的学生和教师不可避免与生信打些交道,简单到使用在线工具查找基因的功能,在线工具做些常规分析,到设计一个高通量测序实验,从公司提供的报告中分析结果,再到自己用写好的流程进行生信分析,或自己写代码独立进行生信分析。

但生物实验者和生信分析者之间总隐约存在一个小沟,迈过去了,沟通愉快,合作无碍;迈步过去,矛盾重重,难以调和。这里面没有谁对、谁错,问题出在各自的常识 (知识背景)不同。

实验科学家以为 “你们做生信的不都是写好pipeline的吗?怎么那么久还没分析好?”,”计算机不是很厉害吗?我随便给个文件名都找不到?我这个ID也是基因ID,为啥不能做富集分析,电脑不会自己匹配吗?”,”给你个差异基因列表,给我做个GSEA”,”从(常规)转录组中找下miRNA的表达”, “我测了CTCF的ChIP-seq,给我预测下增强子”,”我不做重复了,直接比吧”, “来,咱做个网络吧” … 通常实验科学家的大部分问题,对分析人员来说都是一个课题

当然这个小沟,对想学习生信的朋友也是不可绕过,又难以逾越的。生信中的每一个基本概念,每一个原理,小到热图的行列代表什么,火山图的横轴纵轴代表什么,到GO富集分析的原理,GSEA的原理,序列比对的原理,基因定量的规则,差异基因鉴定的原理,ATAC-seq的原理,再到GSEA需要什么样的输入数据,结果应该如何解释,共表达网络和调控网络的区别,染色质三维结构能帮我做什么,肠道菌群分析怎么设计,再到代码如何写,写在哪,在哪运行,常见错误是什么,软件怎么装,装不上是为什么,再到如何能更快的进行任务并行化和流程化。通常生信初学者的大部分问题, 对入门早的人来说都是一个伪命题

为此,我们特开设一门生物信息通识课,也算作生信入门课,希望能为生物实验着更好的理解生信工具和技术提供一个方便,为生信初学者快速入门提供一个方向。

课程涉及主要内容如下:

生物信息基本知识和概念

  1. 生物信息是什么,能解决哪些问题,有哪些应用
  2. 高通量测序有哪些类型和应用,smRNA-seq,RNA-seq, GRO-seq, ChIP-seq, ATAC-seq, Hi-C,scRNA-seq, ChIA-PET, FAIRE-seq, Ribo-seq, ChIRP, CAGE-seq, Clip-seq等等很多为解决特定问题而生的技术。
  3. 不同代次高通量测序技术的原理和优缺点
  4. 从细胞和DNA结构阐释生信在解析生物分子调控中的应用
  5. 其它您想了解的生信知识 (可报名时提出,也可现场提出)

生物信息文章解读

  1. CNS多组学文章2篇解读 (转录组、表观修饰组和突变组)
  2. 微生物物种和功能组成CNS文章套路解读
  3. CNS常见生物信息图形含义解读、适用范围和在线绘制

常见数据库使用

  1. 利用常见数据库挖掘基因的功能、表达模式和互作蛋白
  2. 从在线数据库获取细胞类型特异高表达的基因
  3. 在线数据库挖掘基因的转录因子调控信息和表观修饰信息
  4. 在线基因组浏览器加载公共数据解析多组学数据, 联合发布的转录组、表观修饰和三维结构数据查找基因的调控关系

常见本地软件使用

  1. Cytoscape绘制网络图
  2. Cytoscape绘制KEGG/Reactome通路图并进行表达属性可视化
  3. Cytoscape绘制转录调控网络和蛋白蛋白互作网络
  4. Cytoscape进行GO富集分析和可视化
  5. Cytoscape进行文献挖掘,探索基因功能
  6. GSEA本地软件使用和结果解读
  7. 其它软件后续补充

R语言基础和图形绘制,在线绘图和图形排版

  1. 在线绘图工具介绍
  2. 图形修改和排版
  3. R语言数据处理和绘图入门

生信Linux基础和常用软件介绍

  1. 生信软件安装基本概念和操作
  2. 生信Linux基础学习
  3. 在windows下如何利用简单命令转换文件格式,提取序列,ID匹配,为常用软件提供数据输入格式等
  4. 生信分析软件举例和适用范围介绍

当然,以上列出的也只是一部分内容,更多的还希望各位朋友踊跃提出,定制专属课程。