导读 尽管大型语言模型(LLM)在生成内容方面的能力令人印象深刻,但它们在设计硬件方面却不那么出色。Nvidia、佐治亚理工学院和其他公司认为,这...
尽管大型语言模型(LLM)在生成内容方面的能力令人印象深刻,但它们在设计硬件方面却不那么出色。Nvidia、佐治亚理工学院和其他公司认为,这一弱点是由于缺乏硬件设计数据来训练模型,因此组织了一场比赛来帮助创建所需的开源公共数据集。
Nvidia设计自动化研究总监任浩星(MarkRen)最近在X(前身为Twitter)上宣布了合作。任浩星表示,硬件设计专用高质量数据的短缺是“LLM辅助硬件设计的瓶颈之一”。为了解决这些不足,Nvidia和其他公司组织了ICCADLLM辅助硬件代码生成竞赛。
目前,在LLM的帮助下设计GPU和其他硬件需要“大量的人机交互”。LLM创建的设计通常要么不可综合,要么功能不全,要么过于简单或不切实际。研究人员认为,这是因为在预训练期间没有充分接触高质量的硬件设计数据。
在注意到Nvidia的一个项目使用内部大规模Verilog代码数据集取得成功后,组织者决定丰富当前的Verilog代码数据集。该竞赛旨在构建一个大规模、高质量的硬件设计代码数据集,并最终实现开源。
LLHWDesign竞赛分为两个阶段。第一阶段,数据样本收集,于2024年8月10日结束。第二阶段从8月20日到10月1日,将对第一阶段收集的数据集进行改进和微调。在第一阶段收集数据集时,竞赛参与者将从现有的Verilog数据集开始并对其进行扩展。
在第二阶段,参与者将使用数据过滤来删除低质量数据,并开发技术来自动为收集的数据样本生成更准确的描述。最后,他们将创建标签策略来帮助法学硕士的学习过程。
LLHWDesign竞赛的获胜者将于2024年10月底在IEEE/ACM国际计算机辅助设计会议上公布。Nvidia和美国国家科学基金会赞助了该竞赛,除了竞赛给予的认可之外,竞赛还包括一些有价值的奖项: