2025-05-12 | 科研部 南科大张煜群课题组发表论文获ACM SIGSOFT杰出论文奖
近日,计算机科学与工程系助理教授张煜群及课题组研究生在国际软件工程CCF-A级会议ICSE 2025上发表的论文"Tumbling Down the Rabbit Hole:How do Assisting Exploration Strategies Facilitate Grey-box Fuzzing?"荣获ACM SIGSOFT杰出论文奖。研究针对当前灰盒模糊测试技术在探索复杂程序状态时面临的效率瓶颈,创新性地提出了CDFuzz技术。这项技术通过定制化靶向字典,以轻量级方式有效提升了程序覆盖率与漏洞挖掘能力,为解决复杂软件系统中的安全难题提供了新思路。
该研究首次系统揭示了灰盒模糊测试中辅助策略的核心效能边界,并提出定制化靶向字典技术CDFuzz,以轻量级方法实现覆盖率与漏洞挖掘能力的双重突破。CDFuzz技术具备三大核心优势:一是无需额外插桩,基于程序控制流图(CFG)自动提取关键常量,摆脱传统策略对额外插桩以及复杂符号执行或梯度求解的依赖;二是定制靶向字典,为每个输入种子动态生成靶向字典,精准覆盖执行路径约束中的常量条件,效率提升高达16.1%;三是零编译/运行开销,靶向字典生成与应用与模糊测试全流程无缝融合,在编译及执行上无额外开销。
图1. CDFUZZ的工作流程
随着软件系统复杂性的增加,传统的模糊测试方法在挖掘软件漏洞方面面临挑战。特别是在处理由复杂条件(如常量约束)保护的程序状态时,现有的灰盒模糊测试技术往往效率不高。为了提高这些程序状态的探索效率,研究对9个模糊测试技术以及多种主流辅助策略(符号执行、梯度求解、输入-状态追踪等)在21个真实项目中进行了大规模实验,研究发现:一是程序深层状态探索被input == CONSTANT型常量约束阻挡,不同辅助策略实际约束求解能力主要为常量约束,90%以上的约束突破为常量比较类型。二是在相同实验条件下,字典策略表现超出预期,传统字典机制(AFLDict)覆盖率表现甚至超过符号执行策略(QSYM)。三是复杂策略存在深度局限,当约束深度>20时,符号执行成功率骤降至15%,而字典策略不受此限制。这一发现颠覆了“复杂策略必然高效”的固有认知,揭示了轻量级优化的巨大潜力。
图2. 策略性地构建用于探索 jhead iptc.c 的字典
CDFuzz靶向字典的技术原理为编译时静态分析与运行时动态优化,通过两阶段实现靶向字典生成:首先,基于LLVM IR解析程序控制流图,静态常量提取所有分支条件中的常量值(如0xdeadbeef、"8BIM" )。其次,根据输入样本的执行路径,筛选与当前路径约束相关的常量子集,构建靶向字典动态路径反馈。
在24小时测试中,CDFuzz工具展现出了显著优势:一是超越现有最佳策略AFL++Dict,在strip项目中提升达26.2%,平均覆盖率提升16.1%。二是37个真实漏洞首次曝出,包括堆溢出、未初始化内存等高风险漏洞,其中9个已获官方确认,7个已被修复。三是体现出跨格式通用性,在ELF、JPEG、SQL等10类文件格式中均表现稳定。
CDFuzz技术以“轻量靶向字典”替代“笨重约束求解器”,证明轻量化辅助策略在模糊测试中的巨大潜力。这项工作不仅为辅助策略的优化指明方向,更推动工业级测试工具向高效率、低开销演进。未来,团队将持续探索轻量化模糊测试优化技术,进一步提升轻量级便于工业落地应用的模糊测试机制。
该工作由计算机系24届博士毕业生吴明远(与香港大学联合培养)和22级硕士生香佳宏作为共同第一作者,计算机系助理教授张煜群作为唯一通信作者完成,南科大为第一单位和唯一通信单位。该工作同时与加拿大康考迪亚大学,香港大学、蚂蚁集团合作完成。
ICSE(International Conference on Software Engineering)国际软件工程大会是软件工程领域公认的国际顶级旗舰会议,是中国计算机学会(CCF)推荐的A类会议,享有极高的学术声誉。ICSE 2025为第47届会议,恰逢其创办50周年,于2025年4月27日至5月3日在加拿大渥太华举行。ICSE 2025共收到1150篇投稿,245篇论文被录用,录用率为21.3%;其中,仅23篇论文(占投稿总数的2%)荣获ACM SIGSOFT杰出论文奖。
论文原文:https://arxiv.org/pdf/2409.14541
项目源码:https://github.com/GhabiX/CDFuzz
供稿:计算机科学与工程系
通讯员:刘萍
编辑:任奕霏