基于大语言模型的程序规约理解与生成

报告摘要: 相比于以自然语言形式表达的程序注释，由形式化语言写就的程序规约能够准确、全面、无歧义地描述程序的语义与行为，因此在软件生命周期的不同阶段均可发挥重要作用。然而传统的规约生成技术受限于程序的高度复杂性，难以生成有用的规约对程序的语义进行准确的描述。大语言模型打开了解决问题的新空间，基于大语言模型的程序规约生成技术吸引了业界的广泛关注。本次汇报，报告人围绕基于大语言模型的程序规约理解与生成展开，重点介绍如何利用程序规约度量大语言模型对于程序的语义理解能力（SpecEval）和利用大语言模型生成高质量的程序规约（SpecGen）。

报告人简介: 刘尚清，南京大学软件学院副教授，主要研究领域是智能化软件工程包括基于人工智能的程序漏洞检测与修复技术、代码自动化生成技术以及代码模型的可解释性研究等，在软件工程和人工智能领域发表高水平学术论文30余篇，包括ICSE、ASE、ICLR、NeurIPS等。报告人于2022年在南洋理工大学获取博士学位，从2023至2024年在南洋理工大学从事博士后研究，入选国家级青年人才项目。