DAC上的四个演讲精髓提炼

半导体行业观察 · 半导体行业观察·2022-08-01 09:12

2.0k

来源:内容来自半导体行业观 察(ID:icban k)编译自SE,谢谢。

芯片设计和验证正面临越来越多的挑战。如何解决这些问题——尤其是在加入机器学习的情况下——是 EDA 行业需要面对的一个主要问题,这也是本月设计自动化(Design Automation Conference.)大会上四位主题演讲者的共同主题。


今年,DAC 以现场活动的形式回归,主题演讲涉及一家系统公司的领导者、一家 EDA 供应商、一家初创公司和一位大学教授。


Mark Papermaster:AMD首席技术官兼技术与工程执行副总裁


Papermaster 以分享一个观察开始他的谈话。他指出,“技术和计算领域从未有过比这更激动人心的时刻。我们正面临一个巨大的拐点。我们在新的 AI 算法中看到的爆炸性数据量和更有效的分析技术相结合,意味着将所有数据投入使用会产生对计算的永不满足的需求。在我从事该行业的 40 年中,我们有 30 年依赖摩尔定律。我可以指望每 18 个月有一次显著的改进,降低设备成本,提高每个工艺节点的密度和性能。但是随着行业进入这些微小的光刻技术,制造的复杂性已经大大增加。很明显,摩尔定律已经放缓。每个节点的成本都会增加。光罩的数量在增加,而我们的密度也在增加,他们没有得到我们曾经做过的相同的缩放因子或相同的性能改进。我们处理下一代设备的方式将会发生变化。”


Papermaster 指出,嵌入式设备正变得无处不在,而且它们变得越来越智能。由人工智能驱动的计算需求在各地都在上升,这需要新的方法来加速改进。“专家预测,到 2025 年,机器生成的数据量将超过人类生成的数据。这推动了我们对计算思考方式的改变。它让我们思考将加速器作为芯片或chiplet放入设备的新方法。作为一个行业,我们必须共同应对挑战,这就是让我兴奋的蜕变,这就是我们将如何克服挑战的方式。”


其中一个大问题涉及标线限制(reticle limitations),它决定了可以在单片硅片上塞入多少。Papermaster 表示,这将带来更多的设计和更多的设计自动化,而这只能通过协作和伙伴关系来实现。解决方案将依赖于异构性以及如何处理复杂性。软件需要与硬件一起以“shift left”的方式设计。“在过去十年中,晶体管数量增加了 225 倍,这意味着我们现在正在研究具有 1460 亿个晶体管的设计,我们必须部署chiplet。”


图 1:通过伙伴关系创建的生态系统。

资料来源:AMD(基于 Needham & Co. 数据)


然而,这并不是一个新想法。“如果我们回顾 1964 年的第一届 DAC,它被创建为帮助避免冗余工作 (SHARE) 协会。这个首字母缩略词非常说明我们现在需要什么。我们需要对我们正在解决的问题有一个共同的愿景,”他说。


简而言之,解决行业现在面临的问题不是任何一家公司都能完成的,而且很多创新都发生在合作伙伴的重叠中。


图 2:缩放收益的百分比。来源 AMD


在 3nm,设计技术协同优化 (DTCO) 有望超越内在缩放。这些趋势对 EDA、应用开发人员和设计社区都是一个挑战。为了解决这些问题,需要重新构建解决方案平台,尤其是针对人工智能。这通过软件堆栈层将引擎和互连与chiplet结合在一起,以创建平台。引擎变得越来越具体,越来越多的任务需要特定领域的加速器。


图 3. 解决问题的平台方法。资料来源:AMD


“在下一个chiplet时代,我们将看到 2D 和 3D 方法的多种组合,而性能和功耗的划分将开辟新的设计可能性。这将为 EDA 创造难以置信的机会,你将不得不重新思考过去的许多事情。我们还必须以可持续的方式做到这一点,并更多地考虑权力。IT 计算正处于消耗所有可用能源的轨道上,我们现在必须限制它。”


Papermaster 还邀请Synopsys董事长兼首席执行官 Aart deGeus谈论计算的可持续性。


在DeGeus的演讲中,他专注于摩尔定律的指数,与 CO 2排放的指数重叠。“这两条曲线几乎完全吻合的事实对我们所有人来说应该是非常可怕的,”他说。“我们的目标很明确。在这十年中,我们必须将每瓦性能提高 100 倍。我们需要在能源生产、分配、储存、利用和优化方面取得突破。因此我们号召——有头脑的人应该有心提供帮助。你应该有勇气去行动。”


Papermaster 跟进表示,AMD 制定了到 2025 年能效提高 30 倍的目标,超过行业目标 2.5 倍。他表示,AMD 正在走上正轨,目前已经实现了 7 倍的改进。“如果整个行业都实现这一目标,它将在 10 年内节省 510 亿千瓦的能源,减少 6.2B 美元的能源成本,并减少相当于 6 亿棵树苗的CO 2排放量。”


Papermaster 补充说,人工智能正处于设计自动化行业的转型期。“它几乎涉及我们今天活动的方方面面,”他说,并指出各种技术,如仿真、数字双胞胎、衍生式设计和设计优化是推动 EDA 的用例。“我们正在使用人工智能来帮助提高结果质量,探索设计空间并提高生产力。”


他还提供了一个封装可以提供帮助的例子。通过在逻辑之上堆叠缓存,AMD 可以将 RTL 仿真速度提高 66%。


Cadence总裁兼首席执行官 Anirudh Devgan


Devgan 的演讲题目是“Computational Software and the Future of Intelligent Electronic Systems”,他将其定义为计算机科学和数学,并指出这是 EDA 的基础。


“从 60 年代末到 70 年代初,EDA 已经这样做了很长时间,”Devgan 说。“计算软件已经应用于半导体,并且仍然很强劲,但我相信它可以应用于许多其他领域,包括电子系统。过去 10 年在软件领域,尤其是在社交媒体领域大放异彩,但在接下来的 10 到 20 年,即使是软件也将变得更加‘计算’。”


半导体增长有很多代际驱动因素。过去,有单一产品类别经历了繁荣然后萧条。“问题一直是,'它会继续是周期性的还是会变得更具世代增长?'”Devgan 说。“我相信,鉴于应用的数量,半导体将变得不那么周期性。”


他说,虽然设计成本在上升,但人们却忘记了数量。“半导体的数量呈指数级增长,所以如果将设计成本标准化,成本真的上升了吗?半导体必须提供更好的价值,这正在发生,这反映在过去几年的收入中。需要分析的数据量也在增加。这改变了计算机存储和网络模式。虽然在 90 年代就谈到了特定领域的计算,但在过去几年中它变得非常重要。这使我们更接近消费者和做更多芯片的系统公司。硬件与软件和机械之间的相互作用正在推动由数据驱动的系统公司的复兴。


“我们 45% 的客户是我们认为的系统公司。”Anirudh Devgan强调。


图 4. 数据的影响越来越大。

资料来源:cadence


Devgan 指出了三个趋势。首先,系统公司正在构建芯片。其次是 3D-IC 或基于chiplet设计的出现。第三,EDA 可以利用 AI 提供更多的自动化。他为每个领域提供了一些支持信息,然后研究了各种应用领域以及模型如何应用于它们。他同意 Papermaster 的观点,他说收益不再仅仅来自扩展,集成正在成为一件更大的事情。他还概述了计算软件在不同代 EDA 中出现的阶段。


图 5:EDA 软件的时代。

资料来源:cadence


也许从这次讨论中得出的最重要的事情是 EDA 必须开始解决整个堆栈,而不仅仅是芯片。它必须包括系统和封装。“机械和电气的融合需要不同的方法,并且必须重写传统算法,”Devgan 说。“热是不同的。几何形状不同。经典的 EDA 一直是关于提高生产力的。基于物理的方法和数据驱动的方法相结合效果很好,但 EDA 历来只专注于单次运行。从一次运行到下一次运行没有知识转移。我们需要一个框架和数学方法来优化多次运行,这就是数据驱动方法有用的地方。”


优化是他提供示例的一个领域,展示了数值方法如何有用并提供对空间的智能搜索。他说,这种方法可以用来在比一个人能做的更短的时间内取得更好的结果。


Devgan 还谈到了可持续性。“这对我们的员工、投资者和客户来说都是一件大事,”他说。“半导体是必不可少的,但它们也消耗大量电力。我们有机会降低功耗,而功耗将成为 PPA 的驱动因素——不仅在芯片级,而且在数据中心和系统级。与生物系统相比,我们相差了几个数量级。”


Perceive 首席执行官Steve Teig


在从事机器学习应用三十多年的工作后,Steve Teig 坚信AI可以做更多的事情。“首先,如果我们减少对民间传说和轶事的依赖,多花一点时间在数学和原理上,深度学习会比现在更强大,”他说。“第二,我认为效率很重要。仅仅制造看起来有效的模型是不够的,我们应该担心每美元、每瓦特或其他事物的计算吞吐量。”


Teig 观察到深度学习令人印象深刻,他指出该技术在 15 年前还被认为是巫术。“但我们需要认出他们的魔术,”他说。“我们一直在制造更大、更差的模型。我们忘记了过去 100 年创新的驱动力一直是效率。这就是摩尔定律的驱动力,从 CISC 到 RISC,从 CPU 到 GPU。在软件方面,我们看到了计算机科学的进步和算法的改进。当他们在做深度学习时,我们现在正处于一个反效率的时代。我们花费大约 800 万美元,能训练一个大型语言模型,其产生的碳足迹是终生驾驶汽车碳足迹的 5 倍多。这个星球负担不起走这条路。”


图 6:不断增长的 AI/ML 模型规模。

资料来源:Perceive


他还表示,从技术角度来看,这些巨大的模型是不可信的,因为它们会在训练数据中捕获噪声,这在医疗应用中尤其成问题。“为什么他们如此低效和不可靠?最重要的原因是我们依赖民间传说。”


他围绕“一个神话、一个误解和一个错误”的主题组织了他演讲的其余部分。“神话”是平均准确度是优化的正确方法。“有些事件并不重要,而其他错误则更严重。我们拥有的神经网络不区分严重错误和非严重错误。他们都得分相同。平均准确率几乎从来都不是人们想要的。我们需要考虑根据错误的严重程度而不是频率来惩罚错误。并非所有数据点都同等重要。那么你如何纠正这个问题呢?损失函数必须基于严重性,训练集应该基于数据的重要性进行评分。”


“误解”是错误地认为神经网络可以作为计算设备来表达。“许多假设和定理非常具体,现实生活中的神经网络并不满足。人们认为,网络可以与前馈神经网络任意接近地逼近任何连续组合函数。这取决于具有非多项式激活函数。如果这是真的,我们需要任意数量的位。更令人担忧的是,您可以在这种类型的神经网络中构建的唯一功能是组合功能,这意味着无法表示任何需要状态的东西。有一些定理表明 NN 是图灵完备的,但是当你没有记忆时,这怎么可能是真的呢?RNN 实际上是有限状态机,但它们的内存非常有限。


“错误”是认为压缩会损害准确性,因此我们不应该压缩我们的模型。“你想在数据中找到结构,并将结构与噪音区分开来。你想用最少的资源做到这一点。随机数据无法压缩,因为没有结构。您拥有的结构越多,您可以进行的压缩就越多。学习原则上是可压缩的,这意味着它具有结构。信息论可以帮助我们创建更好的网络。奥卡姆剃刀说最简单的模型是最好的,但这意味着什么?数据的任何规律性或结构都可用于压缩该数据。更好的压缩减少了网络做出选择的任意性。如果模型太复杂,你就是在拟合噪声。”


图 7:压缩类型。

资料来源:Perceive


完美的压缩会是什么样子?Teig 提供了一个有趣的例子。“最好的压缩已经被数学描述了。它可以被最短的可以生成数据的计算机程序捕获。这称为 Kolmogorov 复杂性。考虑 Pi。我可以将数字 31459 等发送给您,但是计算 Pi 数字的程序可以让您生成第万亿位数字,而无需发送那么多位。我们需要摆脱琐碎的压缩形式,例如权重的位数。100X 压缩可能吗?是的。”


EPFL 电子工程和计算机科学教授Giovanni De Micheli


在研究了音乐、艺术和数学中循环在历史上是如何存在的之后,EPFL 电子工程和计算机科学教授Giovanni De Micheli 研究了参与者之间的相互作用——工业、学术界、金融、初创企业和提供数据交换的 DAC 等会议之间。


他用所有这些来介绍三个问题。硅和 CMOS 会永远成为我们的劳动力吗?经典计算会被新范式取代吗?生命物质和计算机会合并吗?


首先看硅和 CMOS。


De Micheli 研究了一些新兴技术,从碳纳米管到超导电子器件,再到内存中的逻辑以及使用光学加速机器学习中的计算。“其中许多是范式变化,但你必须考虑将这些技术转化为产品所需的努力。你需要新的模型。您需要调整或创建 EDA 工具和流程。在这样做的过程中,你可能会发现能够让现有事物变得更好的东西。”


对纳米线的研究导致了静电掺杂,这创造了新的栅极拓扑。他还研究了二硒化钨 (WSe 2 ),并展示了一个可能的单元库,您可以在其中非常有效地实现诸如 XOR 和多数门之类的门。“让我们回过头来看看逻辑抽象,”他说。“几十年来,我们一直在用 NAND 和 NOR 设计数字电路。为什么?因为我们刚开始的时候就被洗脑了。在 NMOS 和 CMOS 中,这是最方便实现的。但是,如果您查看 Majority 运算符,您会发现它是进行加法和乘法运算的关键运算符。我们今天所做的一切都需要这些操作。您可以基于此构建 EDA 工具,这些工具实际上在综合中表现得更好。”


图 8:不同制造技术的栅极拓扑和库。

资料来源:EPFL


在了解了如何使用多数运算符的所有背景之后,De Micheli 声称与以前的方法相比,它可以减少 15% 到 20% 的延迟。这是他的循环的一个例子,其中一种替代技术教会了我们一些关于现有技术的知识并有助于改进它,以及适用于新技术,例如超导电子学。


“EDA 是技术的推动者。它提供了一种评估新兴技术并查看虚拟实验室中有用方法的方法。它创建了新的抽象、新方法和新算法,这些新算法不仅对这些新兴技术有益,而且对现有技术也有益。而且我们确实知道,当前的 EDA 工具无法将我们带到最佳电路,因此寻找优化电路的新途径总是很有趣。”


其次看计算范式。


De Micheli 开始研究量子计算及其有助于解决的一些应用。这里的循环需要添加叠加和纠缠的概念。“这是一种范式转变,改变了我们对算法的构思、我们创建语言、调试器等的方式,”他说。“我们必须重新思考合成的许多概念。同样,EDA 是一种独立于技术的优化,将导致可逆逻辑。它是可逆的,因为物理过程本质上是可逆的。然后映射到库。您必须能够嵌入约束。量子 EDA 将使我们能够设计出更好的量子计算机。量子计算正在推进计算理论,其中包括可以在多项式时间内解决的多项式问题。


再看生命物质和计算机。


“这里循环中的重要因素是进行校正和增强。1000 多年来,我们一直在用眼镜进行矫正。进步是巨大的。” De Micheli 讨论了当今可用的许多技术以及它们如何改变我们的生活。


图 9:在医疗应用中创建反馈回路。

资料来源:EFPL


“这导致了新的 EDA 要求,使我们能够共同设计传感器和电子设备,”他说。“但最终的挑战是理解和模仿大脑。这要求我们能够解码或解释大脑信号,复制神经形态系统和学习模型。这给可控性、可观察性和连接性带来了接口挑战。”


这是第一步。“下一个层次——未来——是从大脑到大脑,基本上能够连接人工智能和自然智能。生物学和医学的进步,加上新的电子和接口技术,将使我们能够设计出更好的生物医学系统,”他说。


结论


以最有效的方式执行任务涉及很多人。它涉及仔细设计算法、运行这些算法的平台、用于执行软件和硬件、硬件和硅之间映射的工具,或替代制造技术。当这些中的每一个都单独完成时,它可以带来小的改进。但是,当每个参与者以伙伴关系一起工作时,就会出现重大改进。这可能是阻止对我们星球的持续破坏的唯一方法。

★ 点击文末 【阅读原文】 ,可查看本文原文链接!

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3118内容,欢迎关注。

推荐阅读


拜登“芯局”

低调崛起的韩国半导体设备

国产GPU初露曙光


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!


点击阅读原文,可查看本文
原文链接!


广告

半导体行业观察 · 半导体行业观察·2022-08-01 09:12

2.0k
  • EDA
  • 机器学习
  • 用户热评
    打开摩尔芯球APP,查看更多评论

    重大事件及时推送,更流畅的沉浸式阅读体验

    参与评论

    0/200字

    登录后即可发布评论

    发布评论

    上海爱思尔教育科技有限公司

    Copyright©2021 沪ICP备19045314号-3

    沪公网安备 31011502017229号

    请使用浏览器自带的分享按钮,
    将你这篇文章分享出去吧。
    +86
    获取验证码
    登 录

    邮箱登录

    未注册过的用户将直接为你创建摩尔账号