题目:Meta-Analysis of Human Cancer Single-Cell RNA-Seq Datasets Using the IMMUcan Database

期刊/时间:Cancer Research / February 1, 2023

DOI:doi.org/10.1158/0008-5472.CAN-22-0074

简介:来自法国巴黎圣路易斯研究所的研究团队建立了一个综合肿瘤微环境数据库平台(IMMUcan,https://immucanscdb.vital-it.ch)。该平台基于大量的单细胞数据收集与整合分析,为挖掘肿瘤免疫微环境单细胞特点提供了便捷的工具。

1、平台建立

1.1 数据收集

(1)共收集到人类肿瘤微环境单细胞测序的103篇文献、144个数据集,涉及56种癌症类型;

  • 文献查询:Pubmed,bioRxiv (2016~2021)
  • 原始数据下载:GEO, ArrayExpress, EGA, BioProject

(2)对数据集多角度的注释:文章相关信息、样本/患者相关信息、测序相关信息

image-20230202170213106

1.2 数据处理

基于进一步的筛选,文章对其中的73(现今更新为78)个数据集进行整合分析;主要使用R包Seurat编写一套代码脚本,以对每个数据集批量分析(scProcessoR,https://github.com/ImmucanWP7/immucan-scdb),其中要点如下:

(1)标准化、高变基因、降维、分群等基本操作;

(2)根据Shannon entropy香农熵判断批次效应,如有则使用Harmony校正;

(3)使用CHETAH包分3个深度注释细胞类型:major、immune、minor;

(4)使用copyKAT包判断恶性肿瘤细胞;

(5)使用sceasy包,将上述seurat对象储存为h5ad格式(标准化表达矩阵+注释信息);

(6)使用genesorteR包分析每种细胞类型的marker基因。

2、应用示例

2.1 细胞类型分析

假设问题:文章以MEL_IMM_SS2_GSE120575数据集为例,分析经免疫治疗前后,细胞比例发生明显变化的细胞类型

初步结论:对anti-PD-1疗法有响应的黑色素瘤患者经治疗后的B细胞比例显著增加。

image-20230202180927161

2.2 特定基因分析

  • 假设问题:已知CXCL13与CXCL9是预测ICB治疗的marker。哪些肿瘤的细胞类型高表达这两个基因?
  • 初步结论:基底细胞癌(BCC)等肿瘤的Tfh,CD8Tex高表达CXCL13;肝细胞癌(HCC)等肿瘤的myeloid高表达CXCL9。
image-20230202181833971

2.3 共表达基因对分析

  • 假设问题:CXCL13与PD1在哪种细胞类型存在共表达关系?
  • 初步结论:在BCC_BIA_10X_GSE123813数据集的exhausted CD8T细胞群中,二者存在显著的共表达。

image-20230202182349106

2.4 样本表型分析

  • 假设问题:在细胞恶化前后,T细胞与巨噬细胞发生哪些变化?
  • 初步结论
    • 筛选得到25个同时包含tumor与normal样本的数据集;
    • 首先分析与tumor与normal组间细胞比例发生显著变化的T细胞亚型;
    • 然后分析tumor与normal相比CD4T、CD8T与巨噬细胞的上调/下调基因。
image-20230202183214950