相关文章推荐
爱看球的毛豆  ·  Python 编译错误 ...·  1 年前    · 
害羞的领带  ·  Unknown custom ...·  1 年前    · 
会搭讪的蚂蚁  ·  How to Configure the ...·  2 年前    · 

中文题目: BoA -PTA: 一种用于 SPICE 仿真的贝叶斯优化加速的 PTA 求解器

论文题目: BoA -PTA, A Bayesian Optimization Accelerated PTA Solver for SPICE Simulation

录用期刊: ACM Transactions on Design Automation of Electronic Systems ( CCF B )

作者列表:

1) 邢炜 北京航空航天大学 集成电路科学与工程学院 集成电路设计与集成系统系

2) 靳翔 北京航空航天大学 集成电路科学与工程学院 集成电路设计与集成系统系

3) 冯田 中国石油大学(北京) 信息科学与工程学院 计算机科学与技术系

4) 牛丹 东南大学 自动化学院 机器人工程系

5) 赵巍胜 北京航空航天大学 集成电路科学与工程学院 微电子科学与工程系

6) 金洲 中国石油大学(北京) 信息科学与工程学院 计算机系

背景与动机:

集成电路设计中最大的挑战之一是 需要 重复执行计算成本 高昂 的SPICE 仿真 ,特别是在涉及高度复杂的芯片测试/验证时 ,其 验证 时间 可能会占用 整个开发周期 高达80% 的时间 近年来, 由于机器学习和其他统计学习方法快速发展, 它们 已经被用来解决这一挑战。 尽管效率 得到了一定提升 ,但直接机器学习的实现依赖于大量预先计算的数据才能工作。此外,几乎所有基于机器学习的方法都 没有 提供任何形式的 误差界限 ,这将验证过程置于很大的风险 中。因此,机器学习方法主要用于学术研究,而 没有 工业 得到应用

近年来,伪 瞬态 分析(PTA)已被证明是 工业界 最有前途的SPICE延拓求解方法之一 ,而CEPTA又是所有PTA方法中 可以在 保持高效率的同时 具有很强的消除振荡 能力 的方法 。然而,插入的伪参数对 CE PTA 的求解 效率影响很大 据我们所知,到目前为止,还没有 有效的 参数 选择 策略 被提出用以加速 CEPTA 的求解 过程 因此, 本文在 保持SPICE 仿真 的准确性 可靠性 的情况下 通过 为最先进的SPICE求解器CEPTA配备机器学习 技术, 提出了一种适用于CEPTA的贝叶斯优化 ( Bayesian Optimization, BO) 误差 加速框架BoA-PTA。

设计与实现:

为了扩展不同电路的适用性,我们利用特殊 的网表 特征 深度神经网络 (DNN) 进行网表特征提取 。为了进一步改进针对高度非线性优化问题的 BoA -PTA,我们引入了贝叶斯 分层变形 BetaCDF ,它克服了一般 BO 的平稳限制,而不会通过单调双射变换使几何复杂化。 变形 BetaCDF 的参数使用变分推理结合重新参数化技巧进行积分,以避免过度拟合。最后,优化约束和规模由 log-sigmoid 变换处理。

图1:提出的BoA-PTA框架 将CEPTA求解器视为 黑盒 函数, 将网表和 插入的参数作为模型输入,将CEPTA完成 仿真 需要的迭代 次数 作为输出 。使用双层MLP 提取网表特征 并使用BetaCDF转换CEPTA插入 的参数 值,以解决非平稳挑战。基于 高斯过程 的贝叶斯优化是在 给定网表条件 下进行的。右边显示了顺序BO如何工作的说明。

BoA-PTA的创新点如下:

(1) 我们 所知,BoA-PTA是第一个机器学习 强的SPICE求解器。

(2) BoA-PTA为CEPTA SPICE求解器(以及潜在的其他SPICE求解器)提供无误差加速并提高收敛性能。

(3) BoA-PTA不需要预先计算的数据。它可以加速正在进行的重复 仿真 或完全 未知 电路的 全新仿真

(4) BoA-PTA配备了前沿的机器学习技术 用于网表 特征提取的深度学习,用于非平稳建模的BetaCDF,以及避免 过度拟合 的变分推理。

实验结果及分析:

为了全面评估 BoA -PTA,我们在电路 仿真 器基准 测试 集CircuitSim93上对其进行 测试,该基准集包含43个经典电路,包括BJT- MOS2-和 MOS 3型电路。 在这项工作中, 我们选择了一个简单的MLP架构,它有两个隐含层,包含16个神经元。我们使用L-BFGS-B进行了五次迭代的GP优化和采集优化。我们 使 用三个 采集 函数,即EI MES和UCB, 公共

来评估 BoA -PTA。 BoA -PTA的实现基于 PyTorch BoTorch

实验一、 加速效率测试

2 43 基准 电路 6种 不同 的搜索策略 下( BoA-PTA (MES、EI和UCB)、GA、SMAC及随机搜索策略 的收敛迭代次数平均加速比

图2展示了B oA-PTA 框架在基准测试集上 的加速 效率 可以看到,BoA-PTA 其他 搜索策略 有很大的优势。其中,具有不同 采集函数 的BoA-PTA表现出相似的 性能; SMAC和GA在 贝叶斯 迭代 初期表现与BoA-PTA相似。随着 贝叶斯迭代的增加 ,这种差异也在扩大。

实验二、泛化能力测试

3 BoA -PTA算法对BJT-、MOS2-、MOS3-三种类型的未知电路的随着在 已知 电路的训练的提升

为了测试 BoA - PTA的泛化能力, 我们测试了 BoA -PTA算法对BJT-、MOS2-、MOS3-三种类型的未知电路的随着在已知电路的训练的 加速效果。从图 3 可以看出, 即使 系统从未见过 电路,BoA-PTA 也可以随着 迭代次数 的增加 进一步提高 SPICE 仿真的速度 。 这实质上表明 DNN 特征提取确实可以 预期 那样和 BoA-PTA 结合使用。

实验三、 无预训练蒙 卡测试

最后,我们评估了BoA-PTA在蒙特卡洛分析中的加速效果。 本实验的蒙卡分析 测试了当 电路中的所有电阻 分别 加入 独立的 { 1% , 2% , 5% , 10% , 20% }的 正太分布 扰动 时系统的统计特性 对于每个变量集,每种方法都在相同的1000个随机抽样网表上进行测试。 图10 展示了 6000次 仿真的 平均迭代次数。我们可以看到,与CEPTA相比,无论哪种 采集 函数都能大幅提高BoA-PTA 性能 。具有MES的BoA-PTA总体上获得了最稳定和良好的性能,速度约为CEPTA的2 X

5 对于不同 扰动 的蒙特卡罗 仿真 的平均迭代次数。

本文提出了 一种用于 SPICE 仿真的贝叶斯优化加速的 CE PTA 求解器 —— BoA -PTA。 通过利用现代机器学习技术的优势, BoA -PTA 与原来的 CEPTA 求解器相比有了显着的改进 —— 43个基准电路仿真的速度 最大提升了 3.5 X ,四种 经典 电路设计的 仿真 速度 最大 提高 250 X ,蒙特卡洛 仿真的速度 提升 了2 X

作者简介:

金洲, 早稻田大学博士、博士后、GCOE研究员,计算机系讲师,硕士生导师。主要从事芯片设计自动化EDA、并行稀疏线性系统求解器、基于新型非易失存储器 的存算一体 软硬件协同设计等。在 DAC、TODAES、IPDPS、ASP-DAC、GLSVLSI 等重要国际会议和期刊上发表30 余篇高水平学术论文。联系方式: jinzhou@cup.edu.cn。