首发于 乐活魔方
个体化治疗性癌症疫苗的新抗原鉴定

个体化治疗性癌症疫苗的新抗原鉴定

最近,关于肿瘤新生抗原的研究日新月异。国外大佬也做了系统的综述,对在进行肿瘤个体化疫苗研究和应用的盆友们很有帮助。
特将此文翻译和校对后发布,希望对同行有所启迪,也期望neoantigen能尽快走向临床应用,造福患者。

摘要

肿瘤细胞的体细胞突变可以产生肿瘤特异性的新表位,被宿主体内的自体T细胞识别。由于新表位不受中央免疫耐受的影响,也不在健康组织中表达,它们是治疗性癌症疫苗的有吸引力的目标。因为绝大多数的癌症突变对个体患者来说都是独一无二的,所以要充分利用这种丰富的靶点来源的潜力,就需要采用个体化的治疗方法。已经开发了许多计算算法和机器学习工具,以识别序列数据中的突变,优先考虑那些更可能被T细胞识别的突变,并为每个患者设计量身定制的疫苗。

在这篇综述中,我们填补了在了解T细胞识别新抗原的基本机制和发现体细胞突变和癌症免疫治疗预测新抗原的计算方法之间的空白。我们提出了一种新抗原的新分类,区别于保守的、抑制的和忽略的新抗原,基于它们如何在给定的临床背景下授予高效的抗肿瘤免疫。这种基于环境的分化将有助于建立一个框架,将新抗原生物学与癌症的临床环境和医学特性联系起来,并将使未来的新抗原疗法提供更大的临床效益。

引言

突变的基因产物在其肽产物分解后可作为肿瘤的新抗原,表现为患者主要组织相容性复合体(MHC)分子上的新抗原表位,并被CD4+或CD8+ T细胞【1 - 4】识别。识别新表位的T细胞可以促进癌症免疫治疗的效果,如免疫检查点阻断(ICB) 【5-10】和过继T细胞转移【11,12】。肿瘤中体细胞突变的数量与T细胞浸润相关,并预测各种癌症类型的免疫疗法的总反应率和生存延长【13】。

由于体细胞癌症突变在健康细胞中不表达,并且可能识别它们的T细胞不受中枢免疫耐受的影响,因此新抗原被认为是基于T细胞的免疫疗法安全有效的靶点【14 - 17】。由于发生的随机性质,体细胞癌症突变是高度个体化的。每个癌症患者都有一个独特的突变谱,并在他们的癌细胞上呈现一个独特的新表位- mhc复合体(称为“新抗原组”)的组成【18】。虽然已经确定了少数共享的新抗原(表1),但更广泛的癌症突变的临床应用需要一个真正个性化的方法,这与多方面的挑战有关。

** 表1 |来自共享突变的新抗原 **



主要组织相容性复合体(MHC)等位基因频率来自国家生物技术信息中心(NCBI)dbMHC数据库。插入或删除。A列“MHC限制”显示了欧洲/北美人群中限制性MHC等位基因的频率,以及相同MHC等位基因比例次高的人群和相应比例;(−) 表示缺失等位基因频率信息。

    个性化癌症疫苗的工程设计(图1)首先通过比较来自患者肿瘤和健康组织的下一代测序(NGS)数据来识别蛋白质编码基因中的肿瘤特异性非同义突变。只有一部分突变出现在患者的HLA分子中,并不是每一个出现的突变都会引起免疫反应。自发发生的T细胞识别的新表位仅反映单个肿瘤中1-2%的突变。此外,并不是所有的新表位在介导T细胞介导的肿瘤细胞杀伤和抗肿瘤作用方面的能力是相同的。


    图1 |工程化个体化新抗原疫苗。对患者健康组织(如外周血单个核细胞(PBMC))和肿瘤活检样本进行下一代测序。比较肿瘤和正常DNA的测序数据,以确定肿瘤特异性突变。根据突变通过主要组织相容性复合体(MHC)结合预测、突变转录表达定量、突变克隆性和其他特征等计算方法引发T细胞反应的可能性,将突变作为候选疫苗进行优先排序。使用所选的疫苗平台(如mRNA或长肽),在良好生产规范(GMP)条件下按需生产个体化和多特异性新抗原疫苗。新抗原疫苗旨在通过诱导新的T细胞反应,诱导肿瘤杀伤,并支持从无知向抗肿瘤免疫的转变,从而恢复癌症免疫循环。抗原提呈细胞;杂合性缺失;TCR,T细胞受体。


    多组分计算管道评估突变肽区域与患者HLA等位基因结合的能力,并评估突变区域的其他特征(如转录表达水平,克隆性和与自身的不同)可能有助于新抗原候选细胞诱导有效和有临床意义的抗肿瘤T细胞的能力。根据这些数据,可以选择一套量身定制的新抗原候选者,按需生产针对每个患者的独特成分的疫苗【17,21 - 23】。因此,在生物学知识的指导下,准确识别突变和选择相关的新抗原候选是临床成功的个体化新抗原疫苗接种的罗塞塔石。类似地,新抗原表位的预测在细胞治疗领域的临床应用中也很有价值,如体外刺激自体T细胞以富集新抗原表位特异性【11、17、24】或克隆新抗原特异性T细胞受体(TCRs)用于T细胞重编程【25 - 29】。为了达到这个目的,对算法的需求创造了一个新的、快速发展的、高度跨学科的研究领域。

    本文综述了新抗原疫苗的作用模式所涉及的基本免疫机制。它给出了一个全面的概述,目前使用的算法和计算管道来预测候选新抗原表位,他们评估的生物学特征和他们的实现从临床转化的角度。它提出了一个基于临床背景对新抗原进行分类的新概念,他们是感兴趣的。最后,我们讨论当计算方法成为高度管制的药物开发过程的一部分时,新表位癌症疫苗临床转化的挑战,以及该领域的未来方向。

    新抗原表达和提呈

    新抗原特异性T细胞免疫遵循T细胞启动、激活和效应功能的基本原则,其机制发生在两个区域,即肿瘤和淋巴组织(图2)。

    新抗原的表达

    像任何其他内源性细胞蛋白一样,在癌细胞中表达的新抗原经过蛋白酶体降解成更小的肽段。多肽在内质网中加工,并装载在MHC I类分子上。由此产生的肽- mhc - i复合物,包括含有新表位的复合物,被呈现在癌细胞表面,以供CD8+ T细胞识别。肿瘤细胞可以表达MHC-ii分子或组成(这是很少的情况下)或诱导干扰素γ (IFNγ)【30】。MHC-II分子优先呈现来自外源性蛋白的多肽或来自进入分泌和内吞室的内源性蛋白的多肽。与MHC-II结合所需的肽段序列和长度比与MHC-I结合时要短。因此,MHC-II上出现突变多肽的可能性和新表位- MHC-II复合物的多样性更高,突变体特别容易被CD4+ T细胞免疫识别【23,31,32】。当MHC-I和MHC-II各自的新抗原进入这两种加工途径时,以及当患者具有MHC-I和MHC-II等位基因,能够以足够的亲和力结合各自的突变肽时,MHC-I和MHC-II都会出现相同的突变【22,23】。

    肿瘤浸润免疫细胞,包括树突状细胞(DCs)、巨噬细胞和B细胞,它们可以作为专业的抗原呈递细胞(APCs)。这些APCs对抗原的摄取是通过以下机制发生的:可溶性抗原的巨饮吞噬【33】、DCs【34】受体介导的凋亡小泡的摄取、肿瘤相关巨噬细胞对肿瘤细胞的吞噬【35】或fc受体介导的免疫复合物的摄取【36,37】。肿瘤浸润性APCs激活抗原特异性记忆CD4+和CD8+ T细胞,这些细胞之前经历过同源启动。

    然而,无论是癌细胞还是肿瘤浸润性apc都不能直接激发naive T细胞。初始T细胞的启动几乎只发生在淋巴结(LNs),通过高度专门化的ln常驻dc。这些专业的apc通过从肿瘤组织淋巴管抽走的细胞外液中抽取可溶性的新抗原【38,39】,或者通过迁移的apc主动转移接受新抗原,这些apc在周围肿瘤组织中吸收了相应的新抗原【40 - 45】(图2)。内吞的抗原被处理和呈现CD4+ T细胞扫描MHC-II复合物。树突状细胞还能够将胞吞的抗原路由到细胞质室中进行蛋白酶体降解并在MHC-I分子上呈现。这个过程被称为“交叉呈现”,对抗原特异性细胞毒性CD8+ T细胞的启动和刺激至关重要【46,47】。


    • 图2 |新抗原介导的肿瘤控制机制。死亡的肿瘤细胞释放新抗原,这些新抗原以可溶形式在细胞外液中或通过迁移性抗原呈递细胞(APC)从肿瘤部位运输而到达引流淋巴结(LN)。在LN中,高度特化的树突状细胞(DC)将主要组织相容性复合体I类(MHC-I)或MHC-II分子上的新抗原呈递给幼稚T细胞以进行启动和激活。*


    活化的新抗原特异性CD4+和CD8+T细胞离开淋巴结,进入肿瘤并发挥抗肿瘤活性。肿瘤微环境中的APC可以激活抗原特异性记忆CD4+和CD8+T细胞,包括交叉反应性记忆T细胞。

    新抗原特异性T细胞反应的启动

    新抗原特异性T细胞的启动、激活、扩增和随后的命运受到微调机制的严格控制,并受APC上肽-MHC复合物的密度和稳定性、抗原特异性T细胞的前体频率和亲和力以及共刺激信号的存在等参数的影响。幼稚T细胞库由胸腺发育过程中建立的中枢免疫耐受形成,包括消除识别MHC-I和MHC-II的高亲和力自身反应性T细胞来自种系编码自身抗原的表位。由于新表位是非自身的,并且在生命后期出现,因此它们的识别不受这种机制的影响。识别新抗原的幼稚T细胞仍然容易受到外周耐受机制的影响,包括克隆缺失、转化为调节性T(Treg)细胞或诱导无能和衰竭等功能障碍状态。初始T细胞的启动需要高水平的肽-MHC复合物以及共同刺激。一旦它们在LN中被启动并过渡到记忆状态,T细胞的识别激活可以通过低水平的新抗原呈递来实现。肽-MHC复合物的数量决定了表位呈现的水平,并取决于基因表达、肽-MHC结合的亲和力和肽-MHC复合物的稳定性。因此,在肿瘤中以稳定水平表达并提供与MHC-I或MHC-II具有足够高亲和力的抗原表位的新抗原具有更高的内吞抗原有效交叉呈现和初始T细胞启动的可能性。低于临界水平时,新抗原既不会诱导T细胞免疫,也不会诱导耐受。


    TCR多样性和TCR退化

    TCR通过与从MHC凹槽伸出的肽侧链上的几个接触点相互作用,与肽-MHC复合物结合(参ReFS56,57)。相同的新表位- mhc复合体可以使T细胞与不同的tcr结合,tcr可能由分子上不同的α-链和β-链组成s23, 58-61(图3a,b)。TCR的多样性有望在与来自自身抗原的MHC配体有更高差异的新表位中得到更广泛的应用,例如将非结合肽转化为结合新表位的突变,或由插入或缺失(indel)和基因融合创建的新的开放阅读框。它改变的不仅仅是一个氨基酸。此外,自我差异越大,潜在的高亲和力结合物的可能性越大,因为这些可能没有被中枢免疫耐受机制删除。

    考虑到功能性TCR - peptide-MHC相互作用的低亲和力,单个TCR能够结合各种肽- MHC复合物,包括不一定具有序列同源性且结构不同的表位【63 - 65】。由于TCR的简并,突变的肽可以被交叉反应性记忆T细胞识别,这些T细胞被启动来对抗不相关的抗原,例如来自共生细菌或微生物病原体【66,67】。由不相关抗原启动的T细胞对疾病的调节称为异源免疫(图3b,c)。


    图3:TCR多样性和退化

    相同的新表位(蓝色,红色的突变氨基酸)可以被具有分子不同的T细胞受体(TCR)α-和β-链的不同T细胞识别(a, b部分)。TCR -新表位接触残基(深蓝色)对于识别相同的新表位的单个T细胞可能是不同的。对于由突变导致的新抗原,将非结合的野生型多肽转化为结合的突变多肽,情况尤其如此。一个单一的TCR可以识别不相关的主要组织相容性复合体(MHC)肽表位(b, c部分)。例如,一个T细胞对一个病原体来源的表位(紫色,c部分)启动,可以交叉识别一个肿瘤细胞上的新表位(b部分)。

    新抗原驱动的免疫效应机制

    在共刺激条件下遇到抗原时,初始的CD8+和CD4+ T细胞被激活,通过重复的细胞分裂周期扩大,离开LN并分化为效应T细胞和记忆T细胞,表达程序性细胞死亡1 (PD1),并能够浸润肿瘤。在有利的肿瘤微环境(TME)存在下,激活的新抗原特异性T细胞通过识别肿瘤内apc和肿瘤细胞的抗原来显示其效应功能,并可能间接或直接促进肿瘤控制【11,17,68 - 71】。CD4+和CD8+ T细胞协同消灭肿瘤。CD8+ T细胞可直接杀伤癌细胞,而新抗原特异性CD4+ T细胞具有多种作用,可能促进TME的深刻炎症重塑。CD4+ T细胞也可能对表达MHC-II【70, 72-76】的肿瘤细胞表现出直接的细胞毒性。CD8+和CD4+ T细胞在同源抗原识别后分泌IFNγ,诱导肿瘤细胞和apc上MHC-I和MHC-II呈递上调,从而进一步增强对新抗原的识别。炎症支持新抗原特异性CD8+ T细胞的细胞毒活性。杀死肿瘤细胞和释放肿瘤抗原可能导致抗原扩散【68、77-80】,并进一步刺激和扩大记忆CD4+和CD8+ T细胞。这个被称为癌症免疫周期【68】的序列的迭代被许多免疫抑制机制所抵消,这些机制已经进化到保护自身免疫【81,82】。

    癌症疫苗的最终目标是通过启动新型的新抗原特异性T细胞或激活预先形成的T细胞来重新点燃癌症免疫周期,从而培养持续的适应性抗肿瘤免疫反应,直到肿瘤细胞被完全消灭。

    早期证据表明,肿瘤内出现MHC-II新表位能够刺激并克隆扩展表达叉头盒蛋白P3 (FOXP3+)的新抗原特异性CD4+ T细胞,这是Treg细胞表型的特征【83】。肿瘤内扩展寡克隆Treg细胞群的TCR库与外周血Treg细胞群重叠,但与常规FOXP3−CD4+ T细胞群的肿瘤内TCR库明显不同【83,84】。这表明肿瘤内Treg细胞要么是特异性的新抗原,与传统的CD4+辅助T细胞识别的新抗原不同,要么来自不同的T细胞池。目前还不清楚这些新抗原特异性Treg细胞是由于在非炎症性耐受性条件下暴露于新抗原引起的初始CD4+ T细胞的次优启动,还是来自已经建立的交叉反应性Treg细胞群【86】。可以想象,新抗原特异性Treg细胞可以以抗原特异性的方式减弱抗肿瘤免疫,而不管它们的来源如何,更好地了解它们的特异性可以帮助改进新抗原预测算法。

    免疫监视、免疫逃逸和免疫编辑

    肿瘤的遗传进化是由具有适应度优势的克隆的选择驱动的。免疫监测和肿瘤进展之间的动态相互作用【67】导致了不同克隆成分的原发性和转移性病变(图4)。T细胞免疫的逃避发生在肿瘤的自然进化过程中以及治疗过程中,肿瘤逃避免疫监测有各种机制。

    肿瘤可能通过上调PD1配体1 (PDL1)【87】、转化生长因子-β (TGFβ)【88】或促进Treg细胞【89】的表达来产生免疫抑制TME。Treg细胞【89】可以保护肿瘤免受新抗原特异性T细胞免疫攻击。

    此外,被有功能的新抗原特异性T细胞识别的肿瘤克隆可能会受到免疫编辑【67】。新抗原丢失变异的选择似乎经常发生在初治疗患者的免疫浸润性肿瘤中【90 - 92】,但很少发生在免疫细胞浸润不足的肿瘤中【89,93】。在一种疫苗中结合多种新抗原而不是依赖单一抗原可降低因抗原丢失而逃逸的风险。

    另外,也可能选择在抗原处理或呈现机制上有缺陷的癌细胞克隆,如MHC基因杂合性缺失(LOH)、MHC分子下调和突变【94】、抗原呈现转运体功能障碍(TAP)【95】或β2-微球蛋白(β2m)【96】突变。这些改变从根本上使同源抗肿瘤免疫功能丧失,并使肿瘤对任何基于新抗原特异性T细胞活性的治疗产生抗性。这就是联合治疗发挥作用的地方,目的是将治疗性疫苗与行动模式不重叠的治疗模式相结合。


    图4:克隆性对新抗原识别的影响。

    单个肿瘤疾病的每个病变(原发或转移)由不同的亚克隆组成,每一个亚克隆都可能为患者的新抗基因组贡献不同的新抗原集。根据新抗原是截断克隆的(新抗原A)、截断克隆但在转移过程中通过缺失或基因沉默丢失的(新抗原B)、在某个转移过程中是克隆的(新抗原C)或在单个转移过程中针对某个亚克隆的特异性(新抗原D),新抗原表位特异性T细胞可以靶向所有的肿瘤细胞(新抗原A),只针对选定病灶的所有肿瘤细胞(新抗原B或C),或者仅仅针对单个肿瘤亚克隆(新抗原D)。

    肿瘤免疫逃逸的风险在转移性疾病中较高。每个转移病灶可以被视为一个独立的岛屿,具有自己的免疫微环境、免疫逃逸策略、进化动力学和新抗原【97 - 99】(图4)。

    经ICB治疗后,死亡的肿瘤细胞释放的新抗原被apc吸收,可能导致T细胞的启动,并进行有效的激活和扩张。因此,ICB可间接促进抗原扩散,从而扩大和丰富抗肿瘤T细胞的反应库。患者可能会对ICB产生耐药性,原因是亚克隆体的生长不表达被ICB动员T细胞识别的新抗原。

    新抗原的分类

    对新抗原进行分类的一种方法是根据产生改变的表位并定义其分子特征的体细胞突变类型(框1)。临床研究中研究得最好的突变类型是编码区域的单核苷酸变异(SNVs)。一个重要的未来领域是开发发现工具,发现由癌症特异性的indel、融合基因和剪接变异产生的新抗原,这些新抗原与自身抗原的相似性低于snv衍生的新抗原。

    我们提出了新抗原的正交分类(图5;表2),这可能有助于识别相关的新抗原,传递有效的抗肿瘤免疫。我们认为,突变的效用可能因临床环境而异,需要考虑机制和癌症生命周期影响的多样性,这些可能驱动新抗原特异性免疫应答的形成。 目前还不清楚为什么一些新抗原会自发地诱导功能性T细胞反应,而另一些则需要干预。另一个未知是,为了设计出更好的新抗原疫苗,应该寻找什么样的新抗原计算管道。 在这方面,我们可以从新抗原中学习,这些新抗原被最丰富的免疫显性T细胞特异性所靶向,与良好的预后相关,或者从那些与从ICB治疗获得临床益处相关的T细胞应答中学习。

    此外,“肿瘤排斥抗原”一词已经被用来指代相关的抗原,这些抗原可诱导高效免疫,在小鼠模型中也报道了几种这种新抗原,这些肿瘤排斥的背景不同,这些个别研究对疫苗设计的影响也不同(图6)。

    下面的分类区分新抗原的基础上,在临床环境中,他们获得相关性。我们称其为“情境型”,以区别于通常的基于分子结构的分类,因为它需要对特殊疾病和治疗背景进行解剖。这一命名方法旨在提供一个框架,指导新抗原的发现和特性研究,并帮助构建和分析新的和现有的数据集,以弥补我们在理解方面的差距,并制定一种量身定制的方法,为疫苗设计和其他方面确定新抗原候选特征。

    保护性新抗原(Guarding Neoantigens)

    肿瘤受到T细胞的监视。因此,新抗原特异性CD4+和CD8+ T细胞可在未接受治疗的癌症患者中发现【20,58,67,101】。这种新抗原可能具有一种保护功能,可以在肿瘤出现临床症状前介导早期肿瘤排斥反应,或者可以减缓肿瘤生长,抑制转移性扩散,并防止原发肿瘤手术切除后的复发。保护新抗原的特点是,在没有免疫治疗的情况下,它们在肿瘤中的表达足以驱动临床相关的抗肿瘤免疫。保护新抗原可能有两种。第一种是强抗原(“supreme”)新抗原,在肿瘤细胞中强烈表达,形成具有极高亲和力MHC结合【102】和稳定性的新抗原表位(图5)。这些特征促进早期启动和快速强扩张的新抗原特异性细胞毒性T细胞,浸润和抑制原发肿瘤生命周期早期的生长和转移播散,直至完全表现为免疫抑制TME【103】。人类的保护性新抗原很难识别。这种肿瘤排斥抗原存在的最有力证据来自于对小鼠肿瘤的移植研究,这些肿瘤具有非常高的突变负荷,有数千个体细胞突变是由紫外线照射或致癌物引起的。在这些模型中,表达相应新抗原的野生型肿瘤细胞被单纯小鼠排斥,而免疫编辑的肿瘤细胞克隆失去了相应的新抗原,但表达了所有其他突变,生长具有侵略性。免疫显性新抗原来源于极其罕见的突变事件,可能仅在具有非常高突变负荷的肿瘤(如微卫星不稳定性肿瘤)中有助于改善临床预后【106】。

    第二种保护新抗原类型被预先建立的交叉反应记忆T细胞识别。例如,被T细胞识别的新抗原是针对肠道微生物群、之前遇到过的病原体或持久性病毒的。这种异种T细胞对新抗原的识别有两个重要的作用。首先,记忆T细胞的功能激活阈值比原始T细胞低50倍,并且反应更快【108】。 因此,具有低MHC结合亲和力、低肽- MHC复合体稳定性或低表达水平的无法启动LN中naive T细胞的癌症突变可能会与预先建立的交叉反应性记忆T细胞相结合并扩大(图5c)。 第二,在肿瘤疾病发生前就存在预先形成的异源免疫。 因此,交叉反应性记忆T细胞对新抗原的识别发生在肿瘤生命周期的早期,可能会显著地向高亲和力TCR结合物形成肿瘤特异性TCR库,并促进T细胞浸润和肿瘤生长抑制,包括那些低突变负荷的肿瘤【58】。 异源免疫可能解释,通过肿瘤浸润淋巴细胞(TILs)的非偏倚筛选,超过四分之一的新抗原特异性T细胞反应是针对预测HLA结合亲和力低(>500 nM)的新抗原表位【20】。 因此,临床相关的异种T细胞对新抗原的免疫预计将主要由记忆T细胞库和TCR对肽- MHC复合物的亲和力驱动,而不是由MHC结合突变肽的亲和力驱动。 能够刺激更多样化的TCR库的新表位,例如那些与自我抗原有更高差异的新表位【62】,可能更有资格成为这类交叉反应的新抗原。

    保护新抗原控制疾病的自然进程,并与未接受免疫治疗的患者的良好预后无关。只有少数研究调查了分子新抗原特征和这些确切人群的有利疾病结局之间的相关性。一项研究表明,胰腺癌长期幸存者的肿瘤中含有新表位候选基因,该基因具有如下复合品质特征:第一,与病原体来源的多肽序列同源性;与短期存活者的新表位相比,预测的新表位与野生型【67】的HLA结合亲和力更强。类似地,另一项研究发现,特定肿瘤中所有克隆突变中,新表位候选基因与其野生型(差异agretopicity指数DAI)之间的MHC-I结合亲和力的平均差异,可以作为黑色素瘤和肺癌患者生存率增加的预测因子【109】。

    ICB治疗或新抗原接种可能进一步增强原有的T细胞对新抗原保护的反应。保护新抗原的一个潜在的缺点是,它们在疾病的早期被靶向,因此存在早期免疫编辑的风险【58,91】。


    图5:基于临床背景的新抗原分类

    a |新抗原特异性T细胞反应的形成和进化取决于临床背景。免疫检查点阻断(ICB)疗法增强了预先存在的T细胞反应,而新抗原癌症疫苗诱导新生反应或放大预先存在的反应。b |新抗原呈现依赖于突变蛋白的表达、突变肽与主要组织相容性复合体(MHC)的结合以及相应肽- MHC复合体的稳定性。在淋巴结(LN)驻留的树突状细胞(DCs)上的新抗原的稳健性和表达水平必须很高,才能实现高效的同源启动T细胞。记忆T细胞的激活可以在新抗原呈递水平比启动naive T细胞低50倍的情况下实现。橙色圆点表示最高新抗原,粉红色圆点表示交叉反应保护新抗原。c |在肿瘤细胞和肿瘤驻留抗原呈递细胞(APCs)上的呈递定义了在肿瘤部位激活启动T细胞和记忆T细胞的效率。肿瘤细胞、肿瘤浸润性apc(左图蓝色)和引流性LN的dc(右图紫色)上的新抗原表位的呈现水平影响新抗原特异性T细胞应答。初始T细胞的启动发生在LN中,需要比肿瘤中记忆T细胞的刺激更高的新抗原递呈。保护性新抗原要么通过各自的新表位- mhc复合物的超强结合和稳定性高表达(橙色),要么通过构建异质启动的记忆T细胞来规避高新抗原呈递的需要(粉色)。被抑制的新抗原表现出强劲的表达和强烈的MHC结合亲和力和/或稳定性,并能够启动和扩大LN中原始新抗原特异性T细胞。被忽略的新抗原需要疫苗在LN中产生可启动的新抗原递呈水平。只要新抗原呈率适中(如低表达和/或高亲和性MHC结合(深灰色)或高表达和/或低亲和性MHC结合(浅灰色)),肿瘤中的T细胞就可以被激活发挥效应功能。

    抑制性新抗原(Restrained neoantigens)

    并非所有自发出现在患者体内的新抗原表位特异性T细胞都像那些抵抗新抗原保护的细胞一样具有完全的功能。新抗原特异性T细胞在引流LN中已经成功启动,但功能受损,可能需要进一步激活,以促进肿瘤疾病的有利进程。这可以通过ICB治疗实现,持久的临床反应已被证明与新表位特异性T细胞的扩大相关【5 - 7】。

    我们将被ICB重新激活的T细胞识别的目标命名为抑制的新抗原。虽然被抑制的新抗原能够激发T细胞反应,但其抗原性比保护最高类型的新抗原弱,而且被诱导的T细胞不能完全或充分扩张,以阻止疾病进展。受抑制的新抗原引导的T细胞浸润肿瘤,并识别其在癌细胞和apc上的目标,但肿瘤生长速度超过T细胞,免疫功能受到既定TME的抑制。受抗原刺激的移行dc需要几天的时间才能从肿瘤部位到达ln的dc 【53】。由于在淋巴组织中启动naive T细胞需要高水平的新抗原呈递,突变的多肽需要在肿瘤中强烈表达,发挥高亲和力的MHC结合,并构建稳定的肽- MHC复合物,以产生抑制的新抗原(图5b)。

    与基于其预后影响而识别的保护新抗原相比,抑制性新抗原是由免疫检查点抑制剂等免疫疗法的临床效益预测的(表2)。研究抑制新抗原的特定特征的数据集必须反映这一点,可能来自随机试验,比较ICB治疗和一些非t细胞激活标准护理。

    一项这样的研究表明,在对ICB有反应的患者中,所有确定的T细胞反应都是针对克隆新抗原的【110】。突变的变异等位基因频率、每个突变预测的新表位数量【111】和DAI【109】以及新抗原和野生型对应物【112】之间MHC-I结合亲和力的比值被发现与ICB的临床反应有关。致癌驱动基因突变通常是克隆的,因为它们对肿瘤克隆的生存至关重要,因此不太可能在免疫编辑过程中丢失。在对ICB【113】有反应的患者中,来自驱动基因突变的新抗原候选物被预测得更频繁。相比之下,MHC等位基因的患者预计具有较差的驱动突变表现,不太可能对ICB【114】作出反应。据报道,SNVs【5、7,115】以及移码突变和基因融合可作为抑制新抗原【116 - 119】。

    这篇综述在ICB的背景下讨论了抑制的新抗原,其临床活性明显与受损T细胞的再激活有关。这一原则可以扩展到其他免疫调节疗法,如4-1BB受体激动剂或IL-2 (ReF.120),一旦它们被证明通过预先存在但功能受损的新抗原特异性T细胞传递临床益处。

    忽视性新抗原(Ignored neoantigens)

    在特定的人类癌症中,似乎只有很小一部分突变能被自发发生的T细胞反应识别,这是保护和抑制新抗原的共同特征【19,20,121】。类似地,在小鼠中,NGS在同基因肿瘤中识别出的相当一部分突变并不是自发免疫原性的【32】。

    缺乏自发的免疫原性并不意味着T细胞针对这些被忽略的抗原不会导致肿瘤排斥反应。事实上,小鼠的系统免疫原性研究表明,在小鼠肿瘤中,NGS识别的15-40%的癌症突变作为疫苗抗原时可诱导强劲的新生T细胞应答(CD4+应答多于CD8+应答)【15,32】。大部分诱导的免疫反应是高强度的,导致已建肿瘤的收缩和排斥,抗原扩散和免疫抑制环境的改变【32】。在高突变负荷和低突变负荷肿瘤患者中使用个体化新抗原疫苗的几个临床试验,如黑色素瘤、肺癌、胶质母细胞瘤、卵巢癌和胰腺癌【22,23,80,122 - 126 】(ReFS127,128综述)结果显示约70%的疫苗突变是免疫原性的。绝大多数的这些免疫反应在治疗前是检测不到的,是由第22、23日的疫苗接种引起的。疫苗诱导的新抗原免疫应答的相关性,通过在治疗后活检样本中检测到疫苗诱导的浸润T细胞、在体外杀死自体患者来源的肿瘤细胞株、肿瘤病变缩小、客观临床反应或复发减少得到了支持【23】。

    我们对这些突变基因产物提出了“被忽略的新抗原”这一术语,尽管它们出现在MHC分子上,但需要接种疫苗来诱导临床相关的T细胞反应。我们假设忽略neoantigens具有适度neoepitope低于阈值的表示启动幼稚T细胞,但以上级别的识别记忆T细胞(图5)。大部分突变编码neoantigens与低表达和高MHC结合亲和力,高表达和低结合亲和力,或中等表达和中等结合亲和力。疫苗的目的是向ln驻地树突状细胞注入足够数量的新抗原以实现启动。

    总之,尽管出现的频率较低,但保护和抑制新抗原候选物是个性化疫苗的高度相关目标,特别是在疾病早期治疗或辅助治疗中。被忽视的新抗原是新抗原疫苗或使用个体化tcr工程T细胞的细胞治疗的丰富和补充的靶点来源。它们可能与低突变负荷肿瘤患者的多特异性T细胞反应刺激特别相关。

    因为疫苗诱导的T细胞上调PD1 (ReFS23,129),即使是对ICB单药治疗有耐药性或难治疗的患者也可以从疫苗和ICB联合治疗中获益。疫苗可能会扩大现有的用于ICB【80】的T细胞库,包括被忽略的新抗原。此外,通过对抗Treg细胞介导的免疫抑制机制,ICB可能降低启动naive T细胞所需的新抗原呈递阈值,从而通过抗原扩散扩大T细胞反应。

    基于上下文的新抗原分类为限制、忽略和保护类是一个概念,从转化医学的观点。所有这三个类别应该纳入多新表位疫苗,并在临床试验中评估,以了解每个类别的效用。

    新抗原候选的预测

    免疫生物学驱动的方法

    免疫应答的最基本前提是体细胞突变产生的异常基因产物被转录、翻译、加工并呈现在MHC分子上。因此,验证患者MHC等位基因的表达和预测其与MHC等位基因的结合亲和力是目前计算性新抗原预测管道的两个关键的前期元素(补充表1)。除此之外,其他潜在相关的生物特征被应用到算法中,以对新抗原候选进行排序(表3)。

    这些算法包括特性可能影响预测的新抗原多肽的能力来激活T细胞(不同自体抗原测试序列同源性查询)或其产物免疫逃逸的可能性的抗原性丧失变体(如单克隆的突变计算DNA测序数据分析或由数据库查询决定的驱动突变)。

    虽然下面描述的特征是基于合理的理论基础,但还没有确定如何对每一个特征进行权衡,以便为疫苗设计的新抗原候选者进行优先级,特别是考虑到这些特征与基于上下文的新抗原类别没有关联。我们自己对新抗原特征的基准研究表明,目前还没有足够多的可用数据集来准确预测免疫原性,而且数据集过于多样化,没有标准化。大多数免疫原性研究使用来自预先存在的T细胞特异性测试的数据集。这些T细胞很可能是一个混合的篮子,包括由新抗原本身启动的T细胞,或受益于由不相关抗原启动的异体T细胞。上面提供的基于上下文的分类可能有助于建立一个框架,根据所问的临床问题来区分新抗原候选者,并相应地定制数据挖掘方法。

    转录表达

    检测到的肽- MHC复合物的密度与蛋白水平和转录本表达相关【130】。表达来自高丰度转录本的新抗原的肿瘤细胞克隆在ICB治疗下被有效清除【131】,而下调新抗原候选表达是一种免疫逃逸策略【91】。

    此外,转录本丰度可以补偿突变的低MHC结合亲和力【54】。总之,这些数据支持这样的观点,即高转录表达与自发性功能性T细胞反应的更高可能性相关,因此与抑制新抗原的预测高度相关。因此,各种研究都使用基因表达对新抗原候选基因进行排序【20,23,32】。在新抗原特异性疫苗和过继T细胞治疗的背景下,通过考虑低转录表达的突变,潜在靶点的范围可以扩大。为了量化突变及其野生型对应物的表达,从肿瘤活检样本中提取的RNA的NGS生成的大量RNA测序数据中搜索这两个转录本。通常只对肿瘤组织进行表达分析,不对相应的健康组织样本进行表达分析,通过外显子组测序确定突变的肿瘤特异性。使用kallisto等工具,可以快速、可靠地对改变的转录本进行量化,该工具提供与参考转录组相对的伪比对reads,以检测每个read【132】最可能的转录本。


    MHC结合,稳定性和细胞表面呈现

    突变肽与患者至少一个MHC等位基因结合的能力是T细胞识别的最基本要求。抗原特异性CD4+和CD8+ T细胞的协作对于有效的抗肿瘤免疫至关重要【133】。仅表达一个单一的MHC-I新抗原是不够的,在肿瘤小鼠模型中至少需要一个额外的MHC-II新抗原才能产生有意义的抗肿瘤免疫【70】。因此,个体化疫苗应结合预测与患者MHC-I和MHC-II等位基因结合的新表位。

    已发表的预测MHC结合亲和力的工具是通过湿实验室结合亲和力数据和/或质谱检测的洗脱配体进行训练的。最近的基准研究使用受试者工作特征(RoC)曲线分析作为性能指标来评估MHC-I结合和呈现在人类【134】或T细胞反应在小鼠【135】的预测工具。在这些研究中,NetMHCpan【136】和MHCflurry【137】获得了最佳的ROC曲线下面积(ROC- auc)。尽管这两种工具都对结合亲和力和洗脱配体数据进行训练,但MixMHCpred【138,139】只对洗脱配体进行训练。MixMHCpred预测给定肽序列出现在细胞表面的可能性,并在一项基准研究中使用ROC曲线分析对更大的实验验证的MHC- I结合表位数据集,获得了比MHC结合工具更高的ROC- auc【 140】。所有工具都能很好地富集具有良好MHC结合特性的多肽。缺乏罕见MHC等位基因的配体数据是一个限制,NetMHCpan等工具解决了这一问题,该工具利用MHC序列与更频繁的MHC等位基因的同源性来推断潜在的配体偏好【141】。

    新表位- MHC复合物的稳定性被认为比结合亲和力对免疫原性预测更重要,因为更高的稳定性可能增加复合物被T细胞识别的概率【142】。稳定性预测工具,如NetMHCstabpan,在丰富免疫原性突变方面表现良好,并将在更大的训练数据集可用时进一步改进【143,144】。

    在MHC-I基因位点上具有完全胚系杂合性的患者,经ICB治疗后比一个或多个MHC-I基因纯合性的患者有更好的生存率,因为较高的等位基因多样性增加了新抗原找到等位基因结合的可能性【145-147】

    NetChop【148】或NetCTL【149】预测蛋白酶体裂解并通过TaP蛋白复合物运输到内质网,这是表位最终被装载到MHC-I分子上的先决条件。然而,由于预测MHC呈现的方法是通过从MHC中洗脱的配体进行训练的,这些配体已经经历了这些早期的加工步骤,结合裂解、运输和结合预测工具的价值是值得怀疑的。

    与自身的不同和与病原体相关表位的相似。

    与野生型序列的不同(特别是当患者的MHC等位基因之一呈现时),更广泛地说,与自我蛋白质组的不同,增加了T细胞保留序列中存在高亲和力T细胞的可能性。利用差异假设的一种方法是使用基本局部比对搜索工具(BLAST)对非突变蛋白质组的比对得分作为TCR结合能量的替代品【151】。另一种方法使用核相似性度量突变和相应的野生型表位【150】。据报道,这些指标可以预测从snv中提取的新表位,对移码索引或融合基因可能更有帮助。

    新表位与病原体序列的相似性可能与针对常见病原体的预形成T细胞的更高的交叉反应可能性有关(见文献66)。一项描述胰腺癌患者新抗原特征的研究确定了新抗原与其野生型对应物之间MHC-I结合亲和力的比例,以及与病原体相关表位的序列相似性,作为保护新抗原的特征,从而区分长期和短期存活者【67】。

    TCR识别

    解决TCR与肽- MHC复合物相互作用的方法是基于预测TCR将面对mhc结合肽【152】的氨基酸侧链,或与TCR结合可能性较高相关的肽- mhc复合物的稳定性。目前正在探索将TCR的氨基酸序列引入人工神经网络,以预测给定TCR与肽- mhc复合体的结合【154】,从而规避结构建模的使用。另一种方法声称可以根据TCR序列预测TCR【155】最可能的同源肽- mhc靶点。然而,这些方法还不成熟,因为它们是在现有计算算法的限制下运行的,MHC-peptide-TCR组合空间的多样性巨大,现有的实验训练数据不足以训练算法。

    突变的克隆性和必要性

    通过分析在PyClone【156】或SciClone【157】患者中发现的变异等位基因频率,可以评估癌症样本的克隆结构。预测的稳健性取决于样本质量。例如,肿瘤含量低的样本不太可能提供准确的克隆结构。为了稳健性,可能需要来自同一肿瘤的多个样本,这在常规临床环境中很难实现。

    克隆突变和截断突变可能优于亚克隆突变和分支突变,因为它们可以解决肿瘤异质性,并靶向具有更高适应度和肿瘤促进功能的肿瘤细胞【158】。靶向少量高质量新抗原的T细胞特异性可能足以推动初治癌症患者的肿瘤控制,并预测ICB【110,159】治疗患者的延长生存期。在基因组加倍前存在的新抗原的变异等位基因频率将高于基因组加倍后产生的新抗原。在非小细胞肺癌中,超过70%的患者作为早期克隆事件,全基因组加倍【160】。


    图6: 肿瘤排斥抗原。 由于“肿瘤排斥反应”这个术语和评估排斥反应的条件并不是标准化的,因此使用的实验小鼠模型设置在概念上有所不同,并为不同的问题提供了答案。这些包括对未受感染小鼠的肿瘤挑战(102,104)以及对有肿瘤或疫苗经历的小鼠的肿瘤挑战(274,275),以及对自发排斥或各种免疫治疗方式的评估(6,15,32,70)。IBC:免疫检查点阻断。

    大多数驱动突变通常出现在肿瘤进化的早期,并且具有很高的克隆可能性【114,161】。驱动突变的定义促进癌细胞的适应性,并被认为是稳定的。像COSMIC【162】和DriverDB【163】这样的数据库列出了已知和功能验证的驱动基因。虽然经过实验验证的免疫基因驱动突变很少见,但已经开发了计算方法,允许筛选新的驱动突变【165】。

    乘客突变也可能是克隆突变,发生在早期。“乘客”这一名称具有误导性,因为它暗示了相应的突变基因是可有可无的,而且突变不会为肿瘤细胞的生存提供优势,而且在肿瘤进化过程中容易丢失。验证突变是驱动因素需要广泛的实验表征和证明它将正常细胞转化为肿瘤细胞。这种研究并不针对罕见或独特的突变进行。缺乏证据并不意味着没有证据,因此被称为“乘客”的突变很可能在个体癌症的环境中提供一种生物优势。

    计算分析表明,MHC-I和MHC-II上的共享突变和驱动突变通常比乘客突变更少出现在免疫系统中。对于诱导抗肿瘤免疫,疫苗抗原的外来性程度可能比其在癌细胞中的功能作用更为相关。

    基本基因产物杂合性的丧失

    基因通常以两个拷贝的形式存在于基因组中。如果一个必要基因受到杂合性缺失的影响,并从剩余的等位基因生成新抗原,肿瘤不能通过新抗原丢失而逃脱,因为剩余的等位基因是肿瘤细胞生存所必需的。因此,发生LOH的关键基因突变可能是新抗原接种的极好靶点【169】。编码区域的LOH可以从深度测序和微阵列数据分析中可靠地预测出来。基因敲除和基因沉默研究已经提供了大约1600 - 2500个基因列表,这些基因似乎对细胞存活【172 - 174】至关重要,并可能促进新抗原候选的优先排序。

    BOX2:机器学习和深度学习

    机器学习指的是使用算法来学习数据中的模式。机器学习任务可以分为监督学习(预测标签)和非监督学习(模式识别)。深度学习描述了一类机器学习算法,它使用深度神经元网络主要用于监督分类任务。然而,连续结果(回归)的预测以及无监督学习也可以通过深度学习工具进行。人工神经网络的灵感来自于生物神经网络。通常,它们的体系结构包括输入层、隐藏层(或多个层)和输出层。输入层将数据作为数值接收。与权值和非线性变换的关联在跨隐藏层传播时抽象了输入数据。支持深度学习的神经网络有一个以上的隐藏层,而隐藏层的数量定义了网络的深度。输出层提供了预期的类标签。网络的训练是将预测的标签与真实的标签进行比较,计算出损失函数,通过更新隐含层上的权值来优化损失函数。尽管深度学习经常被应用于图像处理等领域,但在相关主题的高质量标记数据数量不足的领域,它仍处于起步阶段;对神经元网络的解释也不简单。深度学习及其在生物医学中的应用已经在其他地方被广泛地综述了【184,289】。

    基于深度学习的方法

    人工神经网络的灵感来自于生物神经网络。为了预测表位与MHC分子的结合,我们探索了根据MHC结合分析数据训练的人工神经网络【136,137,175,176】。基于来自单等位基因细胞系的高质量免疫肽数据训练的神经网络在预测MHC-I和MHC-II结合方面表现出优异的性能【54,55177】。此外,从肽- mhc相互作用的三维结构模型中得到的物理化学性质(例如,吸引和排斥能、氢键能和构象能)正被用于训练神经网络,初步结果很有希望【178】。实验生成的三维结构数据(如x射线折射实验中的晶体结构)的可用性是有限的。基于结构的新抗原预测策略可能受益于更广泛的实验数据的可用性,以及在预测mhc配体相互作用方面硅模型3D结构准确性的提高。



    深度学习模型(BOX 2)在图像分析和语音识别方面取得了关键突破【179】,目前正在探索免疫原性预测。深度网络采用多层架构,以适应训练数据集中的复杂关系。他们有可能发现其他机器学习算法所遗漏的肽序列模式,或者在当前的生物学假设中没有反映出来的模式。

    此类网络已被发表用于MHC-I和MHC-II的结合和配体预测【180】。深度学习方法EDGE和MARIA对MHC-I或MHC-II表位的呈现进行建模,并使用转录本丰度和侧翼序列作为附加特征【181,182】。应用MARIA【182】对一项黑色素瘤新抗原疫苗研究中获得的T细胞应答数据集进行回顾性分析,结果显示,与MARIA评分较低的多肽相比,具有较高预测MARIA评分的新抗原候选疫苗更有可能在接种后诱导CD4+ T细胞应答。EDGE【181】用于黑色素瘤的新表位预测,胃肠道癌症和乳腺癌和外周血单核细胞的体外培养与预测neoepitopes导致扩张的预先存在的T细胞反应(表4)。DeepHLA【183】训练在MHC结合和免疫原性数据和结合MHC绑定和免疫原性模型。另一种方法是将TCR的氨基酸序列植入深度人工神经网络,以预测给定TCR与肽- mhc复合物的结合【154】。

    虽然深度学习算法在一定程度上显示出了良好的效果,但在广泛应用之前还需要进一步的技术成熟。一个障碍是缺乏足够大和标准化的训练数据集,具有高质量的T细胞反应数据,并在反映免疫原性和抗原性的数据集之间进行区分。另一个障碍是,数据集必须被很好地管理和平衡,具有相当数量的正和负训练样本,以便网络学习正确的模式【184】。精确的反卷积等位基因特异性肽- mhc结合模式是利用质谱实验泛等位基因数据的关键。此外,深度学习方法往往缺乏可解释性,这使得用户很难推断出关键的生物特征。

    临床转化的挑战

    技术挑战

    作为检测物的生物标本

    由于异质性是癌症的一个标志,对同一肿瘤病变的多次活检会导致不同的分子谱【97,99】,在一个病人的转移性病变中发现的新抗原候选与在第二个转移性病变或原发肿瘤中的不同【98】。

    原发肿瘤,即使是历史的和存档的样本,也能提供导致弥散性转移病灶的克隆突变、截断突变和种子克隆的信息【158】。在接近计划接种的时间点获得的转移病灶活检样本反映了【185】新抗原的最新状态。有证据表明原发肿瘤中表达的保护新抗原在转移瘤中丢失【67】。被忽略的新抗原不受选择性压力的影响,即使在晚期疾病中,也可能在不同的病变中表达和保存更均匀,这与更高的转移负荷和已建立的免疫抑制机制有关。

    许多方案都是基于单一的活检样本,该样本既不能完全捕获探测到的单个肿瘤病变的异质性,也不能在低转移或多转移性疾病中具有代表性【186】。因此,合成的复合新抗原疫苗可能只代表患者病变靶点的一小部分,至多产生混合临床反应。

    多区域甚至多病灶测序将需要额外的侵入性程序,并且在临床实践常规中很难实施【160187】。这种困境并不是新抗原疫苗所特有的:治疗护理的标准化,如酪氨酸激酶抑制剂或免疫检查点阻断剂,其伴随诊断方法确定是否合格,依赖于单一活检样本。一个部分的解决方案可以通过计算算法来解开肿瘤的异质性,并在单一活检的基础上推断肿瘤的更高层次组织。然而,当样本来自转移灶时,在解释突变的克隆性时应谨慎,因为转移灶中的新抗原的克隆性不能预测原发肿瘤或其他转移灶中的表达。

    生物样品的采集和储存条件可能会影响测序数据。新鲜冷冻样品可以提供最好的数据质量,但需要复杂的物流。福尔马林固定、石蜡包埋的样品更广泛,但固定过程与需要计算过滤的人工制品排序有关【188】。活检比手术切除更方便,但可能产生的分析物数量不足,甚至没有肿瘤细胞【189】。尽管这些障碍听起来微不足道,但它们在实践中是相关的。一种侵入性较低的方法,如液体活检,分析患者血液中的循环肿瘤DNA (ctDNA),可能提供更全面的多部位疾病表征,也更容易收集。尽管概念上很吸引人,但血浆DNA样本中突变的等位基因频率通常很低,目前的技术也仅限于检测一组预定的突变。需要进一步的技术突破,才能通过液体活检实现对癌症突变的高度敏感、无偏的识别。


    突变calling

    突变调用过程从清理测序序列开始,然后对参考基因组进行序列比对。随后的突变calling必须准确区分体细胞变异与测序错误、样品制备人工影响和生殖系突变。许多现有的软件工具解决了突变调用的关键限制。常用的工具(表5)在检测不同突变类(如snv或indel)的能力上有所不同,以处理肿瘤异质性,同时保持可接受的准确性水平,并在可接受的运行时间内交付。目前还没有一个完美的解决方案,通常的方法是将所谓的突变建立在不同工具的共识之上。snv的检测在灵敏度和特异性方面是最先进的,然而这些性能指标对indels【193,194】或融合基因不太有利【195】。

    肿瘤样本表现出高度的异质性,例如,在克隆性、体细胞拷贝数和健康细胞的样本污染方面。【196 - 198】。测序生成的数据代表所有采样细胞的平均值。因此,压缩了实际计算变量检测过程的信噪比。在纯度仅为30%的样本中,带有重复野生型等位基因的杂合子体细胞snv可以是一个典型的用例。在这个例子中,带有突变变体的预期读取数将减少十倍以上,降至不到5%,这使得序列变化难以与噪声区分开来。

    肿瘤内和肿瘤间异质性带来的挑战要求改进整合多个数据源和不同类型的方法,以及结构化的可重复的工作流程来分析来自单个患者的多个样本。

    数据集的可用性和质量

    新抗原预测算法的参数设置和训练依赖于精心策划的数据集的可用性。由于缺乏协调一致的测序、突变检测、新抗原候选优先排序和免疫原性检测方案,数据的整合和可比性受到了影响。免疫原性数据集往往是不平衡的,因为首选的检测新抗原候选者是那些最有可能是免疫原性的,并且指导候选者选择的规则在不同研究之间是不同的。对于许多这样的数据集来说,明确和一致的生物学定义不是一开始就没有考虑,就是没有提供。因此,可能不建议使用荟萃分析来汇集使用不同icb治疗的患者(如阻断PD1、PDL1、CTLA4或PD1和CTLA4联合治疗)的数据集,或来自辅助治疗与转移晚期患者的数据集。

    此外,各种方法被用于评估新抗原特异性T细胞反应,包括IFNγ ELISpot试验,在细胞培养中有或没有T细胞扩增,细胞内细胞因子染色和流式细胞术,以及多肽- mhc多聚体(参考文献199)。T细胞分析的不同之处在于它们的敏感性、准确性和它们所检测的T细胞表型。因此,根据检测方法的不同,由于低敏感性,原有的反应可能会被遗漏,而保护或抑制的新抗原可能被错误地归类为被忽略的新抗原。免疫原性数据集可以代表CD8+或CD4+ T细胞反应,也可以同时代表CD8+或CD4+ T细胞反应,可以描述在ICB治疗或接种后自发产生的新抗原特异性T细胞,也可以通过非可比的分析方法获得。汇编或比较不同研究中确定的新抗原集合的努力常常因为缺少基本的技术和生物学信息而受到影响,这些信息没有被记录下来。

    从正在进行的研究新抗原疫苗的临床试验中,区分疗效终点(如客观反应、无进展生存期和总生存期)的长期临床结果数据将增加价值,并可以反映选定的新抗原候选药物的抗肿瘤疗效。

    尽管在协调数据集方面有一些努力,如肿瘤新抗原选择联盟(TESLA)联盟所做的研究【144】,涉及的许多变量、多态性质以及关键生物决定因素(TCRs或mhc)的患者间和患者内的变异可能需要几千或更多的观察,而不是目前可用的几百个。需要的算法允许在相对较少的数据点上训练并应用诸如主动学习【202】或转移学习【203】等先进技术来创建准确的预测模型。

    疫苗设计

    疫苗设计有两个组成部分:疫苗技术平台的选择和该平台提供的新表位候选个体的选择。

    来源于突变的mhc表位的分子特性允许代表新表位候选的多个短序列的组合或连接。已发表的临床研究使用了2-20个突变,每个疫苗【22,23,123】。许多疫苗格式,如合成肽、mRNA、DNA或病毒载体,将允许给每个患者数十个突变。因此,可以设计一种结合MHC-I和MHC-II、克隆和亚克隆、忽略新抗原以及少数抑制和保护新抗原的互补类新抗原表位的疫苗。这种方法降低了对一个生物学假设下注的风险,而这个假设后来可能被证明是错误的。

    疫苗技术仍处于实验阶段,临床研究中正在探索各种形式的个性化和现成的癌症疫苗(癌症疫苗格式见ReFS204,205)。新抗原疫苗正在探索各种形式,包括长度为15-30个氨基酸的多肽混合物,其与突变序列相对应,以聚iclc(聚赖氨酸和羧甲基纤维素稳定的聚肌苷酸)为佐剂。具有内在佐剂活性的mRNA配方,编码一系列预测的新表位【23】,以及与各种佐剂结合的病毒载体【206 - 209】或DNA【210-212】。对于每种疫苗形式,需要分别确定最佳条件,如佐剂和疫苗接种计划。疫苗技术将在很大程度上影响新表位候选基因是否以诱导免疫反应的方式交付,这将使学习练习复杂化。

    疫苗形式也影响生产速度、可扩展性和成本,这可能是可行地将个别化疫苗应用于临床实践的最关键因素。一种合成疫苗技术是有利的,该技术允许通过简单、稳健、不变和符合GMP的工艺以低成本快速生产疫苗。

    个性化癌症疫苗的生产需要大量同时进行的、高度并行化的生产活动,每个活动代表一个人的一种药品。这与传统药物开发过程中追求的纯批量生产模式有很大的不同。由于生产技术需要创新、成本和时间优化,个性化疫苗生产将受益于正在出现的大规模生产定制产品的解决方案。这些解决方案可能包括生产过程的全数字化和自动化的云控制生产工厂,这得益于计算能力、连接、人机交互、机器人技术和创新的3D技术的进步,使建设规模为的并行小型化生产线成为可能【213,214】。



    BOX3:技术和分析软件验证的原则

    整个新抗原预测过程在很大程度上依赖软件和计算机化系统。对于这类系统在临床研究中的应用,以及后来在药物产品中的应用,系统的技术验证是严格的监管要求。确认是证明计算机化系统适合预期用途的持续过程,是更广泛的质量保证方案的一个组成部分。良好的自动化制造规范(GAMP)代表了自动化系统验证的行业标准【290】,包括任何计算机系统,从可编程计算器和嵌入式设备到超级计算机和运行在这些机器上的任何软件。GAMP反映了美国联邦法规第21篇第211部分(美国)或GMP指南(欧盟)所制定的良好生产规范(GMP)立法的要求。基本的验证过程遵循传统的软件工程实践,包括在不同抽象级别(如用户、功能和配置)的需求的详细文档化,然后是系统组件的文档化确认和测试,最后是整个系统。与纯软件工程的一个关键区别是在每个阶段都包含详细的风险评估,以确定对患者安全的潜在关注。新的软件工程和计算概念,如敏捷开发或云计算,近年来被引入GAMP框架。

    为了对工艺的性能、稳定性和可重复性进行分析验证,下一代测序(NGS)工艺提出了挑战。作为一个典型的全外显子组测序实验,需要分析约5000万个基因组核苷酸作为数据点,在一定程度上会出现随机错误的突变调用。质量控制包括重现性论证和全外显子组覆盖。从低质量的临床样本中获得的数据需要优化的实验室协议和稳健的突变调用算法。基于机器学习的新抗原预测方法依赖于训练数据的数量和质量,这些数据持续快速增长。增加训练数据集的大小和质量可以改善此类软件工具的性能,即使基本的算法没有实质上的改变。实时质量改进可能转化为更好更有效的疫苗。

    为了进一步推进这一领域,极有必要在正在进行的临床试验、临床开发方案和已批准的产品中,对新抗原预测和单个疫苗设计进行迭代质量改进更新。为了实现这一目标,必须确定一个监管路径,在保持产品本身安全特性的同时,允许过程改进的必要程度的灵活性。

    临床应用的挑战

    这篇综述的重点是从一个病人的样本到一种由一组独特的新表位候选人组成的注射疫苗的过程。在下游,要使这种疫苗进入临床开发,并走上适合潜在注册和实施到临床实践的可持续道路,还有进一步的关键挑战(见ReFS18,215-217)。

    对于任何一种药物,其临床疗效和治疗标准的优越性都必须通过随机试验来证明。不同的是,在试验中,每个患者都接受了一种特殊成分的药物,这种药物是在正在进行的试验中通过标准化流程按需生产的,而不是在试验开始前就准备好并发布。从以药物为中心到以患者为中心的模式转变,需要监管部门批准的不是单一化合物,而是从样本采集到疫苗设计和生产的整个过程(BOX3)。

    一个相关的问题是最合适的临床环境。以最小残留病患者为目标具有免疫抑制机制不牢固和疫苗生产周转时间不是限制因素的优势。相比之下,有效控制较大的肿瘤负荷可能需要联合免疫疗法。新表位疫苗是安全且耐受性良好的。因此,在利用协同作用模式的同时,将它们与其他药物联合使用具有较低的附加毒性风险。新表位疫苗与检查点抑制的结合保持了疫苗诱导的T细胞特异性的功能。

    从强多抗原T细胞反应中最可能的逃逸机制包括靶抗原或抗原递呈机制组分的丢失。这可以通过将疫苗与不依赖hla抗原的方法结合来解决,例如嵌合抗原受体(CAR)工程T细胞、抗体或双特异性T细胞结合物。

    展望

    在NGS等技术、不断增强的计算能力和先进算法的推动下,新抗原识别领域在过去十年中发生了巨大的发展。随着在改进新抗原预测工具方面的不断进展和努力,临床试验探索新抗原作为免疫治疗的单一或组合靶点,并产生数据,有助于对基础科学的认识越来越清晰。 ClinicalTrials.gov 目前列出了61项与“新抗原和疫苗”相关的临床研究【219】。早期个体化新抗原接种研究的报告表明,单独或联合使用PD1和PDL1的疫苗具有临床抗肿瘤活性【22,23,123,125】。

    NGS技术【220】和基于MHC配体的质谱分析【221,222】的进一步进展将支持更高分辨率和低噪声的新抗原领域。 技术的进步将开发新的新抗原类别,例如,那些来自基因组的非编码区和“暗物质”区,以及来自非典型翻译的抗原类别。

    尽管对T细胞表位中的锚定残基和面向TCR的残基的理解正在不断发展,但将新抗原和TCR分析数据集连接起来的潜力尚未完全更新。新的预测工具和研究纳入了TCR序列,并模拟了突变肽- mhc复合物与TCRs的相互作用【154,155,227,228】。对tcr与其同源新表位相互作用的结构分析将为突变特异性T细胞识别的结构依赖机制提供更深入的见解,而这不能单独从序列中推断【229】。潜在的复杂性需要通过新的基于人工智能的应用程序和大幅提高计算能力来加以控制。使用精心规划的实验设计、精确和敏感的计算工作流程以及生物和临床信息生成的标准化数据集,将为缩小现有知识差距奠定坚实的基础。

    实现真正的转化医学的方法,如提出的基于临床背景的保护新抗原、抑制新抗原和忽略新抗原的区别,将有助于建立一个框架,将新抗原科学与临床环境、医学特征和癌症疾病的特点联系起来,使未来的新抗原依赖疗法提供更大的临床效益。

    最后,一旦对特定时间点个体化疫苗设计的相关新抗原技术进行优化,并与利用测序数据早期识别单个肿瘤获得性耐药机制的概念配对,一个人的疫苗增强剂随着时间的推移适应其疾病的动态是可以想象的。

发布于 2022-05-11 10:10

文章被以下专栏收录

    乐活魔方

    聊医学,聊科研,说奇闻怪相,畅想美好未来。