文献--基于泛癌scRNAseq的T细胞图谱整合分析

题目：Pan-cancer T cell atlas links a cellular stress response state to immunotherapy resistance

期刊|日期：nature medicine | 26 April 2023

DOI：https://doi.org/10.1038/s41591-023-02371-y

简介：来自德克萨斯大学安德森癌症中心的Linghua Wang研究团队收集了16种肿瘤类型的>30W个T细胞表达数据，对多种T细胞亚型及其分子、临床特征展开了深入地分析。值得一提的是文章发现了一种曾被忽视的Tstr亚型，并揭示了其与免疫治疗抵抗的关系。

1、数据整体概况

（1）数据规模

27个单细胞数据集(10个为内部测序数据，其余17个来自公共数据)，涉及16种癌症
测序样本根据病理情况可分为healthy, 癌旁的uninvolved, primary以及metastatic tumor

（2）初步分析

经合并、过滤处理(method部分有详细介绍)后，共得到308,048个T细胞表达数据
初步分群注释后共得到6种主要的T细胞类型
- CD4+, CD8+, γδ T, NKT, MAIT,以及proliferative T cells
- 其中CD4+, CD8+占比最多，分别达55.76%与35.78%

2、T细胞亚型注释

（1）CD8+ T细胞亚型分析

亚群分析得到14个 clusters/states，其中可分为Naive，Effector，Memory， Exhausted以及其它；
在其它类中的c4_Tstr特异性高表达应激相关的热休克基因（例如HSPA1A和HSPA1B）；
在拟时序分析中，鉴定出以Naive为发育起点的3条发育轨迹，其中一条的终点是Tstr；
进一步观察了特定亚型在不同样本病理状态下的比例分布差异。

（2）CD4+ T细胞亚型分析

群分析得到12个 clusters/states，其中可分为Naive，Memory，Cytotoxic， Regulatory，Helper以及其它(也包括一类Tstr)；
同样观察了特定亚型在不同样本病理状态下的比例分布差异；
考虑到Treg与Tfh类亚型的异质性，进一步对这二者进行亚群分析，分别得到7、5个cluster。

（3）其它类型T细胞

最后同样对γδ T, NKT, MAIT,以及proliferative T cells进行亚型注释以及分析。

3、亚型特征相关分析

（1）T细胞亚型间相关性

使用层次聚类，将上述31种T细胞state可分为4大类；
基于样本水平亚型比例相关性，分析存在正相关或负相关的 state-pairs

（2）T细胞亚型与样本表型相关性

使用特定肿瘤的scRNA-seq数据集，分析特定亚型在normal/primariy/metastase状态下的分布差异；
使用TCGA预后数据以及特定亚型的signature，分析生存相关的亚型；
使用CPI1000数据集，分析与突变、ICB治疗相关的亚型。

4、Tstr亚型临床意义

（1）验证Tstr亚型的存在，而非细胞裂解时的人为刺激因素

通过黑色素瘤的situ hybridization验证HSPA1B的表达
通过MSCLC的空间分子成像验证HSPA1A，HSPA1B的表达
通过多种癌症的空间转录组学验证HSPA1A，HSPA1B的表达

（2）Tstr亚型与免疫治疗的关系

另外收集了6个肿瘤scRNA-seq数据，涉及到经anti-PD-1/PD-L1治疗有或者没有响应的样本；
观察发现在Tstr均相对富集在non-response的样本组中，提示其与ICB resistance可能有关。

小结：

**（1）**文章本身对于肿瘤T细胞方面深入探索的意义是一方面，其对特定细胞类型在肿瘤（其它疾病）中的多角度分析思路也可以给我们提供一些参考价值。

**（2）**这篇文章在前期的数据收集与前期处理方面下了一番功夫。虽然作者提及将数据整理成了一个网页(https://singlecell.mdanderson.org/TCM/) ，但好像并不提供数据下载。在原文中也仅是提供了公共数据来源(部分还需要申请)，所以想直接使用文章数据有一定门槛；

**（3）**在method方法部分，文章较为详细交代了数据前期处理的方法（Seurat），可供借鉴。文章提到对harmony与Seurat-rPCA两种批次整合方法进行了比较，结合silhouette score轮廓分数治疗最终选择了后者。

**（4）**最后作者也在Github上提供了部分绘图R语言代码(https://github.com/Coolgenome/TCM)，如对文章某一张图感兴趣，可以学习一下。例如其在比较细胞亚型在不同分组样本的分布差异时，绘制了一种特殊的DimPlot点图。如下所示。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60


# 参考Github代码，结合10X示例数据绘制如下
library(TENxPBMCData)
library(Seurat)
library(patchwork)
tenx_pbmc3k <- TENxPBMCData(dataset = "pbmc3k")
counts = as.matrix(assay(tenx_pbmc3k, "counts"))
rownames(counts) = rowData(tenx_pbmc3k)$Symbol_TENx
colnames(counts) = paste0("cell-",1:ncol(counts))
sce = CreateSeuratObject(counts = counts)
sce = sce %>%
  NormalizeData() %>%
  FindVariableFeatures(nfeatures = 2000) %>%
  ScaleData()  %>% 
  RunPCA() %>% 
  RunUMAP(dims = 1:30) %>%  
  FindNeighbors(dims = 1:30) %>% 
  FindClusters(resolution = c(0.01, 0.05, 0.1, 0.2, 0.3, 0.5,0.8,1))

Idents(sce) <- sce$seurat_clusters
coord = Embeddings(object = sce, reduction = "umap")
coord = coord[,c(1,2)]
colnames(coord) = c("UMAP_1", "UMAP_2")
coord = data.frame(ID = rownames(coord), coord)
meta = sce@meta.data
meta = data.frame(ID = rownames(meta), meta,stringsAsFactors = F)
meta = left_join(meta, coord, by = 'ID')


theme_black <- function(base_size = 12, base_family = "") {
  theme_grey(base_size = base_size, base_family = base_family) %+replace%
    theme(
      axis.line = element_blank(),
      axis.text = element_blank(),
      axis.ticks = element_blank(),
      axis.title = element_blank(),
      legend.position = "none",
      panel.background = element_rect(fill = "black", color  =  NA),
      panel.border = element_blank(),
      panel.grid = element_blank(),
      panel.spacing = unit(0, "lines"),
      strip.background = element_rect(fill = "grey30", color = "grey10"),
      strip.text.x = element_text(size = base_size*0.8, color = "white"),
      strip.text.y = element_text(size = base_size*0.8, color = "white",angle = -90),
      plot.background = element_rect(color = "black", fill = "black"),
      plot.title = element_text(size = base_size*1.2, color = "white"),
      plot.margin = unit(rep(0, 4), "lines")
    )
}

p1 = DimPlot(sce, reduction = "umap", group.by = "RNA_snn_res.0.5",
             label = T, label.size = 5) + theme_void() +
  theme(legend.position = "none", plot.title = element_blank()) +
  theme(panel.border = element_rect(fill=NA,color="black"))
p2 <- ggplot(data = coord, mapping = aes(x = UMAP_1, y = UMAP_2)) +
  stat_density_2d(aes(fill = ..density..), geom = "raster", contour = F) +
  geom_point(color = 'white', size = .05) +
  scale_fill_viridis(option="magma") +
  theme_black()

p1 + p2

1、数据整体概况#

2、T细胞亚型注释#

3、亚型特征相关分析#

4、Tstr亚型临床意义#

1、数据整体概况

2、T细胞亚型注释

3、亚型特征相关分析

4、Tstr亚型临床意义