近日,我院在软件安全领域的大模型代码安全生成研究成果被软件工程领域国际顶级期刊IEEE Transactions on Software Engineering(TSE)接收,TSE是国际公认的软件工程领域的两个顶级期刊之一,在中国计算机学会推荐期刊列表中被评价为A类期刊。

图1 安全代码生成流程
针对当前大语言模型在代码生成过程中可能引入安全弱点的问题,黄诚副教授团队在论文《Towards Secure Code Generation with LLMs: A Study on Common Weakness Enumeration》中提出了一套面向实际开发场景的安全代码生成方法体系,如上图1所示:该研究构建了基于 CWE(Common Weakness Enumeration)的任务驱动型安全数据集,并通过多标签分类方法实现生成需求与安全规范之间的更准确对应,从而在一定程度上提升了大模型对潜在安全风险的关注度;同时,该工作还提出了一套自动化的安全提示生成机制与代码规避策略引导流程,以减少对人工经验的依赖,为代码生成过程提供更加结构化的安全指引。实验结果表明,该体系在多类编程任务和不同类型的大模型上均表现出较好的适用性。