单细胞分析聚类得到各个分类群后,通常我们需要依赖Marker gene来定义每一个类群;

在使用Monocle进行发育轨迹分析或细胞聚类时,如果有Marker gene也可以更好的进行结果分析。

那么如何获取这些对应的Marker gene呢?

上次单细胞培训时,一位老师给推荐了CellMarker数据库,是哈尔滨医科大学 Yun Xiao老师等在2019年1月份发表于核酸研究 (NAR)数据库专刊的工作。

该团队通过梳理100,000+发表的文献,梳理出人的158个组织 (亚组织)的467个细胞类型的13,605个Marker基因,和鼠的81个组织 (亚组织)的389个细胞类型的9, 148个Marker基因。

Marker gene可以很方便的通过左侧层级树浏览查看, 支持该基因为Marker的文献越多,词云图中的字体就越大。来源于单细胞测序实验验证, 综述文章公司数据的支持分别列出。点击More details可以查看更详细的名字、数据库外链、来源的文献或其他支持信息等。

同时支持直接搜索组织、细胞系类型或癌症相关的Marker,或搜索一个基因是否为特定的Marker基因。搜索结果以散点图形式展示,点的大小表示横纵轴联合标记的细胞类型的Marker基因的多少。点越小,搜索的基因作为Marker的属性越特异。

所有数据都可以全部下载。更希望大家能提交新的数据到数据库以维持其数据的更新和构建更好的数据资源。

如果您也想做类似的数据库,欢迎与我们联系,已成功在NAR发表两篇数据库文章。

Ref:

  • CellMarker: a manually curated resource of cell markers in human and mouse. Nucleic Acids Research. 2018.

单细胞系列分析教程