集智斑图顶刊论文速递栏目上线以来,持续收录来自
Nature、Science
等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。
扫描下方二维码,关注“集智斑图”服务号,即可订阅Complexity Express:
以下是2022年4月18日-4月24日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~
1、
代谢可塑性可增强生态系统对全球变暖的反应
2、并行机器学习在复杂网络动力学预测中的应用
3、湍流中物质环的统计几何学
4、基于知识提取的通信高效联邦学习
5、二分网络模型设计急性髓系白血病联合治疗方案
6、
神经网络中的 Gell-Mann–Low 临界性
7、生成模型学习的神经编码框架
论文题目:Metabolic plasticity can amplify ecosystem responses to global warming
论文来源:
Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-29808-1
在气候变化的相关研究中,一个尚未解决的关键问题是复杂生态系统将如何应对长期变暖。通常,研究者使用生态系统数学模型中物种水平代谢率与物种体积大小及温度之间的一般关系来解决这一挑战。这些研究大多遵循生态学代谢理论
(Metabolic Theory of Ecology,MTE)
以及玻尔兹曼-阿伦尼乌斯方程
(Boltzmann–Arrhenius equation)
。然而,在这些理论中,特定参数的假设条件最近被质疑缺乏普适性,因为这类参数在物种内部和物种之间都有所不同 。此外,物种可能有能力通过驯化、进化适应或两者兼而有之来改变其代谢特征。此后,我们将物种水平热响应的这种灵活性称为“代谢可塑性”,这可以简单地认为是一组相似的生物体在环境变化时以相似的方式改变其代谢率。生物体有能力通过代谢可塑性来改变其对变暖的生理反应,但目前依旧不清楚这种代谢可塑性对食物网能量流动的后果,并且现在尚不存在用于模拟其生态系统水平影响的通用框架。
图:(a)在模拟+2 °C变暖后,通过研究系统中食物网模拟的能量通量变化的可视化。物种种群(节点)之间较粗的线(营养联系)表明,与没有代谢可塑性的模型相比,使用具有代谢可塑性的模型预测的能量通量增加更大。(b)使用来自我们 14 个研究地点的经验数据,具有代谢可塑性的模型预测,在 +2 °C 变暖后,通过网络的总能量通量比没有代谢可塑性的模型显着增加。这种增加是由(c)向草食动物的通量驱动的,而对(d)食腐生物或(e)捕食者的通量增加没有显著贡献。图中显示了Tukey箱线图和盒须图,粗黑线为中位数,界限为第1和第3个四分位数,外横线为四分位间距的1.5 倍,异常值为单个点。
在本文中,通过对自然热梯度下的水生无脊椎动物进行温度控制实验,研究人员表明:长期暴露于变暖环境后,生物体提高代谢率的能力随着体型增加而降低。长期暴露于较高温度也会增加整个机体代谢率的急性热敏感性,而该现象与体型无关。该研究结果参数化后的数学模型表明,与基于生态代谢理论的传统模型相比,当升温仅 2 °C时,代谢可塑性可以增加60%的生态系统能量通量。这可以解释为什么在最近的实验中,长期变暖会随着时间的推移放大整个生态系统的呼吸速率,并强调了将代谢可塑性嵌入到全球变暖对生态系统影响的预测模型中。
论文题目:Parallel Machine Learning for Forecasting the Dynamics of Complex Networks
论文来源:
Physical Review Letters
论文链接:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.128.164101
利用过往的时序数据预测大型复杂稀疏网络的动力学特征, 在广泛的应用背景下很重要 。在这里,我们提出一个机器学习方案,使用一个模拟相关网络拓扑结构的并行架构来完成这一任务。通过在一个混沌网络振荡器上的储备池计算案例,我们展示了该方法的实用性和可扩展性。我们考虑了两种情况的先验知识:(i) 网络链接是已知的;(ii) 网络链接是未知的,需要通过数据驱动的方法推断,以便于近似优化预测。
图:并行网络机器学习架构的示意图。这里我们展示了储备池2(R
2
),它接收来自其指定节点(节点2)的输入,加上与节点2相连的节点(即节点1和3)的输入。然后,R
2
被训练以预测其分配的节点(节点2)。这个过程对网络中的每个节点都是一样的,这样,储备池之间的连接就模仿了要预测的网络。
随着时间的推移,混沌流
(chaotic flow)
倾向于将材料的元素折叠、扭动和褶皱成近似无限复杂的状态。一个基本的问题是,这个动荡的过程是否具有任何长期持续存在的可预测特征。回答这个问题可以深入了解发生在整个系统中的混合过程,从染料扩散到水中、浮游生物群落在海洋表面的扩散,到超新星热核爆炸中的爆炸传播。在这些过程中,材料的元素——呈现为被动、非扩散标记的曲线、曲面或体积,为我们提供了一个内在的几何学视角,以了解混沌流的复杂动力学。
在本文中,研究人员揭示了湍流环境中物质环的稳健统计性质。本文采取的方法结合了 Navier-Stokes 湍流的高精度直接数值模拟、随机模型以及动力系统方法,以揭示这些复杂物体可预测的普遍特征。研究人员在本文中表明,环的曲率统计性质在通过高曲率褶皱动态形成过程后变得稳定,导致了统计分布具有幂律尾部,且其指数由流动的有限时间 Lyapunov 指数的大偏差统计确定。这一预测适用于广泛混沌流中的平流物质线。为了补充这一动态图景,研究用精确的 Fokker-Planck 方法在可解析的 Kraichnan 模型中确认了理论。
图:最初的圆环(颜色对应于初始角度)在 27τ
η
内的湍流场平流,其中 τ
η
是 Kolmogorov 时间。 湍流的扭曲和折叠作用产生了复杂的环几何形状,而环的长度平均呈指数增长。 所示的循环是一个比较极端的情况。经过较长时间后,湍流较小区域中的环路会形成扩展且复杂的结构。插图为导致曲率峰值的材料折叠。
论文题目:Communication-efficient federated learning via knowledge distillation
论文来源:
Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-29763-x
联邦学习是一种保护隐私的机器学习技术,用于从分散的数据中训练AI模型,在模型训练的每一次迭代中,联邦学习算法会利用收到的局部数据更新模型,而不是全局数据,从而实现对隐私数据的利用和保护。然而,如果模型更新包含大量的参数,那么模型的更新数据可能会非常大,而且模型训练也需要很多轮的通信。联邦学习中巨大的通信成本导致了客户端的开销过大和高环境负担。在这里,我们提出了一种名为FedKD的联邦学习方法,基于自适应互相知识提取和动态梯度压缩技术,既可以节省通信成本又能有效训练模型。在三个不同的需要隐私保护的场景上对FedKD进行了验证,结果表明,FedKD最多能降低94.89%的通信开销,取得了与集中式人工智能模型学习相媲美的结果。FedKD提供了在许多场景中高效部署隐私保护智能系统的潜力,例如智能医疗保健和个性化学习。
图:FedKD 框架,利用本地数据对 local mentor 模型和 global mentee 模型进行训练。两种模型都是从局部标记数据以及预测结果和隐藏结果中学习。本地梯度在上传到服务器之前进行分解,然后在服务器上重新构建以进行聚合。聚合的全局梯度进一步分解并分发给客户端以进行本地更新。
论文题目:Bipartite network models to design combination therapies in acute myeloid leukaemia
论文来源:
Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-29793-5
对癌症联合治疗的疗效和安全性优于单一靶点治疗。然而,确定有效的药物组合需要时间和资源。我们提出了一种通过对患者相关药物反应数据,特别是Beat AML数据集,使用二分网络建模来识别潜药物组合的方法。该方法利用细胞活力中位数作为药效测量指标,构建加权二分网络,建立药物-生物样品相互作用模型,并在两个投影网络中寻找节点簇。然后,利用聚类结果发现有效的多靶点药物组合,这也得到了更多来自GDSC和ALMANAC数据库的证据的支持。选择药物组合的效力和协同作用水平,在三种急性髓系白血病细胞系的体外单一治疗中得到证实。在这项研究中,我们介绍了一种数据挖掘方法,以通过组合疗法改善急性髓系白血病的治疗。
图:数据收集和预处理从Beat AML药物反应数据集开始,然后是关联矩阵提取、加权二分网络重建、网络投影和社区发现。使用ChEMBL、Omnipath、DrugTargetCommons和KEGG数据库,根据现有的基因表达谱、药物-靶点相互作用、蛋白质-蛋白质相互作用和生物路径,利用所有集群的药物和病人/细胞成员的相似性进行集群内同质性分析。 此外,额外的药物反应数据集GDSC和ALMANAC分别用于集群内同质性分析和集群间药物组合策略步骤,以检查所提出的工作流程是否独立于数据集。
临界性与最佳计算能力有着深刻的联系。然而,到目前为止,由于缺乏大脑临界动力学的重整化理论,对这种形式的生物信息处理的理解仅限于平均场结果。这些方法忽略了临界系统的一个关键特征:跨越所有长度尺度的自由度之间存在相互作用,这是复杂的非线性计算所需要的。我们提出了一个典型的神经场理论的重整化理论,即随机的威尔逊-考恩模型
(Wilson-Cowan model )
。我们计算了耦合流,它在不断增加的长度尺度上参数化相互作用。尽管与 Kardar-Parisi-Zhang 模型有相似之处,但该理论属于 Gell-Mann-Low 类型,是可重整化量子场论的典型形式。在这里,非线性耦合消失,流向高斯固定点,但对数缓慢,因此在大多数尺度上仍然有效。我们展示了这种临界的相互作用结构,以实现信息存储的最佳线性和计算所需的非线性之间的理想权衡。
图:(a)一个线性读数被训练成从神经活动中提取所需的输入-输出映射。集体非线性相互作用是实现复杂映射的基础。因此,我们需要超越平均场方法,在逐渐增加的长度尺度上跟踪非线性相互作用。(b) 方差,蓝色钻石:模拟;深蓝色虚线:线性系统;灰色实线:重整化理论。(c)耦合流,过渡线(黑色虚线)将收敛区(绿色)和发散区(红色)分开。(d)记忆,对于不同强度的非线性,高斯输入随时间的重建精度(0:完全遗忘;1:完美重建)。(e)分类,正确分配给3位字符串的奇偶性份额(蓝色曲线)和重复训练的标准偏差(阴影区)。读出时最慢(红色)、中间(橙色)和最快(绿色)模式的衰减时间尺度。
论文题目:The neural coding framework for learning generative models
论文来源:
Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-29632-7
神经生成模型可以用于从数据中学习复杂概率分布
(complex probability distribution)
,采样并估计概率密度函数。受大脑预测处理理论
(predictive processing theory)
启发,我们提出一种神经生成模型的计算框架。根据该理论,大脑中某一层的神经元会对另一层传来的感官输入做出预测,并根据预测与观测信号的差别调整模型参数。类似地,在我们提出的生成模型中,人工神经元也会预测相邻神经元的行为,并根据预测的准确性调参。我们所提出框架下的神经生成模型在几个基准测试数据集和衡量标准下表现良好,可以媲美或远超其他功能相似的生成模型,如变分自编码器
(variational auto-encoder)
。
图:神经生成编码、计算和环路。(a)神经生成编码中两个重要计算步骤:(1)预测和侧向错误计算;(2)神经状态的误差-纠正。图中绘制了一个3层的简单网络,每层由2个状态神经元组成(灰色圆),在T步里迭代更新。其中两层神经元与误差神经元(橙色钻石形)连接,误差神经元计算在整个系统中传播的误差信息。底层z
0
接收感官输入(一张图片)。(b)神经生成编码中基本神经元计算单元,在l层里由一个状态神经元
,一个误差神经元
组成。在这个环路中,一个状态神经元不仅接收误差神经元的信息(由
传递),还接收一个自激发信号(由
传递)和侧向连接神经元传来的抑制信号(由
传递)。误差神经元接收从侧向连接神经元传来的增益信号(由
传递)。(c) 该研究中采用的不同神经生成编码结构。黑色实箭头代表生成权重,黑色虚箭头代表误差权重,淡粉色虚箭头代表临时(虚拟)反向传播误差通路,这是一个生成权重的函数,即误差权重的转置(粉色水平实箭头代表哪个前向权重被用于制作反向通路权重)
由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。
为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统相关的最新顶刊论文。
Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“集智斑图”服务号汇总推送。
进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。
考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。
Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:
Nature
Science
Nature Communications
Science Advances
Physics Reports
Physical Review Letters
Physical Review X
Nature Physics
Nature Human Behaviour
Nature Machine Intelligence
Nature Computational Science
如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~
Complexity Express 追踪哪些领域?
我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:
由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。
将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!
由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们
(小助手微信:swarmaAI)
,帮助我们持续优化算法。
如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生
(具体请邮件联系算法组负责人huqiao@swarma.org)
。
如果你对复杂科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队
(具体请邮件联系编辑部负责人liupeiyuan@swarma.org)
。