百年风华 山高水长丨雷竞技raybet登录入口雷竞技raybet登录入口校友发展暨协同育人博学论坛顺利召开!

金秋时节,硕果飘香。雷竞技raybet登录入口即将迎来百年华诞!为庆祝这一重要时刻,雷竞技raybet登录入口雷竞技raybet登录入口于1027日成功举办了校友发展暨协同育人博学论坛。值此百年校庆之际,校友们共聚湾区,共谋学院人才培养高质量发展,献礼母校世纪华诞。

 

 

校友发展暨协同育人博学论坛

主论坛

1027日上午,校友发展暨协同育人博学论坛主论坛在珠海校区瀚林2号举行,雷竞技raybet登录入口珠海校区管理委员会廖喜扬副主任、学院党委陈征宇书记、学院院长郑子彬教授、第三届职业导师、全体教职工和学生代表参加了此次论坛。主论坛由学院党委蓝澍德副书记主持。

主论坛现场

 

雷竞技raybet登录入口珠海校区管理委员会廖喜扬副主任致辞。廖喜扬副主任代表珠海校区向返校的校友们表示热烈的欢迎,强调校友是学校发展的宝贵资源和财富,希望校友们一如既往地支持、关心学校的建设和事业发展,为学生的成长树立优秀榜样。

廖喜扬副主任致辞

 

雷竞技raybet登录入口党委陈征宇书记作学院发展建设报告,报告了学院在党建工作、学科建设、人才培养、文化建设等方面的发展和进步,希望校友们深度参与学院发展工作,共同探讨高质量软工人才培养体系的建设。

陈征宇书记作学院发展建设报告

 

雷竞技raybet登录入口院长郑子彬教授作产学研工作报告,报告了学院在学术科研、社会服务、产学研合作等方面的工作及成绩,希望校友和职业导师能够与学院开放交流,协同合作,聚焦人工智能、区块链等研究领域,为粤港澳大湾区产学研深度融合、创新驱动发展注入新动力。

郑子彬院长作学院发展建设报告

 

雷竞技raybet登录入口第三届职业导师聘任仪式。raybet官网自2021年开始邀请各大企业中的专家、已毕业的优秀校友加入人才培养团队,成为学生成长成才的导师,指导同学们开展职业生涯规划、社会实践以及学习深造等工作。

雷竞技raybet登录入口第三届职业导师聘任仪式

 

论坛上,学院还邀请了优秀教师代表陈文清助理教授、优秀学生代表吴仰晖同学进行了主题报告分享,围绕职业导师深度参与学院产学研、人才培养等工作开展研讨。

陈文清助理教授(左)、吴仰晖同学(右)作报告分享

 

 

校友终身学习计划开放日活动

主题讲座 科研参观

1027日下午,学院举办校友终身学习论坛,开设了Web3.0、元宇宙和可信大模型的专业主题讲座,同时开放了科研实验场地、学术科研成果展示厅供校友参观学习,让大家近距离了解学院在人才培养工作中的具体举措,深入学习师生在人工智能、大数据、云计算、区块链等多个领域的重点学科布局及最新科研成果。

黄华威副教授主题讲座:Web3.0与元宇宙

            孔树锋副教授主题讲座:可信大模型

 

学术科研项目体验

学院校友终身学习计划开放日活动合照

 

百年风华,山高水长。让我们携手同心,共同推进雷竞技raybet登录入口高质量内涵式发展,培养具有国际视野、能深度参与信息技术变革和产业数字化转型,攻克关键软件卡脖子问题的创新引领型信息人才。

 

 

 

 

科研育才丨雷竞技raybet登录入口苏玉鑫老师科研团队介绍

党的二十届三中全会《决定》指出,要加快构建促进数字经济发展体制机制,加快新一代信息技术全方位全链条普及应用,健全强化基础软件、工业软件重点产业链发展体制机制,着力加强人才的创新能力培养。

培养具有探究性学习能力、创新性思维能力、跨领域实践能力的高层次软件工程师,是雷竞技raybet登录入口雷竞技raybet登录入口的育人目标。学院始终将科研和育人紧密融合,不断推进建设具有中大软工特色的科研育人工作队伍、培养机制。

 

 

苏玉鑫老师团队

一、团队导师介绍

苏玉鑫,雷竞技raybet登录入口副院长,副教授,博士生导师,国家重点研发计划青年科学家项目负责人,中国计算机学会(CCF)高级会员,服务计算专委会执行委员。20217月入选雷竞技raybet登录入口百人计划,加入雷竞技raybet登录入口。主要研究方向为系统软件可靠性分析与运行时性能优化,具体包括操作系统、分布式系统、云计算、云原生系统、日志分析、云系统可靠性与智能运维(AIOps)等。近年来在国际会议和期刊共发表近30篇论文,其中24篇发表于ICSEASEISSTASOSPFASTICDECVPRSIGIRAAAIIJCAICSURTKDE等软件工程、操作系统、分布式系统、人工智能等领域CCF A类顶级会议与期刊。

 

二、团队发展目标

在尊重每个人的理想与特长情况下,希望所有同学通过不断积累计算机技术与编程实践经验,同时得到科研创新锻炼,以此拥有解决未知问题的能力,努力成为更好的自己。

 

三、团队成员

四、研究方向 

研究方向包括但不限于操作系统(Operating System),分布式系统(Distributed Systems), 云计算(Cloud Computing), 云原生系统(Cloud Native System), 无服务器计算(Serverless Computing, FaaS), WebAssembly运行时等。

 

五、科研活动 

龙玉丹同学参加 Internetware 国际会议

并获颁最佳工具奖

 

单诗雯同学参加软件工程领域顶会ISSTA 2024

 

六、科研育人成果 

以下为苏玉鑫老师团队成员的科研成果论文:

★Chenxi Mao, Yuxin Su, Shiwen Shan, Dan Li. eWAPA: An eBPF-based WASI Performance Analysis Framework for WebAssembly Runtimes. IEEE International Conference on Software Services Engineering (SSE), 2024

 

★Yudan Long, Yuxin Su, Zigui Jiang. WACP: A Performance Profiling Tool for WebAssembly-Python Interoperability. Asia-Pacific Symposium on Internetware (Internetware), 2024

 

 

★Shiwen Shan, Yintong Huo, Yuxin Su, Yichen Li, Dan Li and Zibin Zheng. Face It Yourselves: An LLM-based Two-Stage Strategy to Localize Configuration Errors via Logs. ACM SIGSOFT International Symposium on Software Testing and Analysis (ISSTA), 2024

 

★Zihan Li, Weibin Wu, Yuxin Su, Zibin Zheng and Michael R. Lyu. CDTA: Cross-Domain Transfer-Based Attack with Contrastive Learning. Thirty-Seventh AAAI Conference on Artificial Intelligence (AAAI), 2023

 

 

 

★Zhilu Lian, Yangzi Li, Zhixiang Chen, Shiwen Shan, Baoxin Han and Yuxin Su. eBPF-based Working Set Size Estimation in Memory Management. International Conference on Service Science (ICSS), 2022

 

 

七、负责人联系方式

邮箱:suyx35@mail.sysu.edu.cn

B站主页链接:

https://space.bilibili.com/502854403

 

 

 

 

 

 

 

雷竞技raybet登录入口第二次学生代表大会顺利召开

雷竞技raybet登录入口第二次学生代表大会

2024929日,雷竞技raybet登录入口雷竞技raybet登录入口第二次学生代表大会在珠海校区瀚林2A301会议室顺利召开。学院党委副书记蓝澍德老师、学院团委书记林柱良老师、党政专职辅导员周玉婷老师及80名学生代表参加了会议。大会由2023级本科生唐芷幽和施可欣同学主持。

本次大会是在学院党委领导和团委指导下,严格按照上级要求和规定程序组织召开的一次会议,也是raybet官网学生生活中的一件大事。

 

学生代表大会现场

 

 

一、开幕式和预备会议

大会在庄严肃穆的国歌声中拉开帷幕,首先进行的是大会预备会议。预备会议听取和表决通过了《雷竞技raybet登录入口第二次学生代表大会议程(草案)》、《雷竞技raybet登录入口第二次学生代表大会代表资格审查报告(草案)》、《雷竞技raybet登录入口第二次学生代表大会主席团选举办法(草案)》《雷竞技raybet登录入口第二次学生代表大会选举监票人、计票人名单(草案)》。

预备会议现场

 

 

二、第一届学生会述职

过去一年,雷竞技raybet登录入口学生会在党团建设的引领下,以党团班社一体化建设、三全育人体系为平台,搭建起学院与学生的沟通桥梁,通过举办博学论坛、笃行沙龙等活动,组建朋辈领航员、广东百千万工程突击队等学生队伍,全心全意服务学生,为学生办实事,致力于打造成为服务型、创新型学生会。

会议上,第一届学生会主席团、学业发展指导中心、青年媒体中心、文体部、实践部全面总结过去一年的工作,向学院全体学生代表述职!

第一届学生会代表述职

 

 

三、第二届学生会主席团选举

雷竞技raybet登录入口第二届学生会主席团成员候选人竞选。候选人陈奕含(2023级本科生)、胡欣宇(2022级本科生)、黄妍(2023级本科生)和王汉唐(2022级本科生)依次进行了个人竞选发言。

陈奕含同学竞选发言

胡欣宇同学竞选发言

黄妍同学竞选发言

王汉唐同学竞选发言

 

  选举投票。各候选人竞选结束后,大会开始选举雷竞技raybet登录入口第二届学生会主席团成员,本次大会采取不记名投票方式,体现公平、公正、公开的原则。

选举投票环节

 

宣布结果。投票结束后,唱票人、计票人在监票人的监督下有条不紊地做好统票工作。经选举,陈奕含、黄妍、王汉唐当选为雷竞技raybet登录入口第二届学生会主席团成员。

 

学院党委蓝澍德副书记作总结讲话。他向学院第二届学生会主席团成员、全体学生代表提出希望:一是要坚持党的领导,以习近平新时代中国特色社会主义思想和党的二十大精神为指导,提高政治觉悟,凝聚和引领青年学生。二是要立足专业、服务他人、锻炼自己。学生会要紧紧围绕各部门中心任务,通过调查研究,规划明确自身服务学院师生的目标和路径。三是要帮助营造弘扬良好的学院文化。要建立起平等、宽松的沟通环境,鼓励成员大胆思考、主动学习,实现自我驱动、自我服务,提倡互相启发、敢于突破的组织氛围。

蓝澍德副书记作总结讲话

 

大会闭幕。最后,在高昂的校歌声中,雷竞技raybet登录入口第二次学生代表大会顺利闭幕。

  继往开来,砥砺前行。雷竞技raybet登录入口学生会工作人员和全院学生,将一如既往团结一致,齐心协力,开拓进取,迎难而上,继续书写raybet官网学生工作更加美好的新篇章!

 

 

 

 

 

 

 

 

 

雷竞技raybet登录入口2024级本科新生见面会暨开学思政第一课顺利举行

为了让2024级新生更深入了解学校百年征程与学院办学情况,增强新生的学科思维,指导新生规划大学生活,雷竞技raybet登录入口于2024921日在南校园举行了2024级本科新生见面会暨开学思政第一课。学院党委书记陈征宇博士、院长郑子彬教授、副院长苏玉鑫副教授、院长助理李丹副教授、2024级本科生班主任陈武辉教授和孔树锋副教授、青年教师专职辅导员崔春秋助理教授、团委书记林柱良老师、党政专职辅导员周玉婷老师一同出席了本次活动。活动由学院党委蓝澍德副书记主持。

活动开始前,新生们有序入座,认真观看学校及学院的最新宣传片、三下乡活动回顾视频等,领略着百年老校和新兴学院的不同韵味,憧憬着自己未来的大学生活。

   学院党委蓝澍德副书记首先代表学院对世纪华诞级新生表示了热烈的祝贺与欢迎!随后蓝书记宣布活动正式开始,介绍本次到场参加的领导和嘉宾,并对每一位的出席表示感谢。同学们也以经久不息的掌声表达了对各位领导老师的欢迎及自己当下激动的心情!

 

党委书记陈征宇博士

讲授思政第一课

学院党委陈征宇书记围绕立德树人为党育人,全面发展为国成才的主题,为新生讲授思政第一课。陈书记指导新生深入学习贯彻党的二十大精神和党的二十届三中全会精神,重点介绍了学校加强基础、促进交叉、尊重选择、卓越教学的人才培养理念。他希望新生能培养自身主观能动性,主动改变学习生活方式以适应大学节奏,专注学业,追求卓越,敢于用科技引领未来。最后,陈书记介绍了学院党组织的基本情况及学生申请入党的流程,号召新生积极向党组织靠拢。

 

院长郑子彬教授

讲授入学教育第一课

院长郑子彬教授围绕学院办学历程、学科情况、师资力量、科研平台和学术成果等方面详尽向新生介绍了学院整体情况,重点介绍了学院人才培养模式和本科生培养成效。他指出学院会为每一位入读软工的同学提供个人成长发展的机会与平台,鼓励新生早进实验室早进课题组,在课余多参加第二课堂、大学生创新创业训练计划项目、学科竞赛等自主性强的活动,争取德智体美劳全方位发展。同时,郑院长希望新生能积极融入高效沟通、平等透明、说话算话、快速成长的学院文化,培养实践能力、科学素养和创新精神。

 

观看新生军训回顾视频

和学院迎新祝福视频

军训回顾视频展示了学院2024级新生朝气蓬勃、富有想法和创造力的一面,而迎新祝福视频则代表了学院老师和学长学姐们对新生美好的祝愿,希望新生能不负期望,成长为新一代软件工程人才。

 

 

新生代表黄昱萌同学发言

学院2024级本科新生代表黄昱萌同学通过回顾自己入学来在中大所看到的葳蕤草木与红墙绿瓦,以及军训期间同学们互帮互助的一桩桩小事,表达了对中大优美校园风光的欣赏和对学校学院所给予的人文关怀的感谢。她表示作为世纪华诞级新生,将与各位同学共勉,践行校训精神,传承使命,敢于担当,在未来培养两种态度两种能力,用行动谱写这一代中大人的新华章。

 

教师代表陈武辉教授发言

学院教师代表陈武辉教授站在授课的专业老师的角度,真诚地向新生提出两点学习建议:一是调整学习方式,学会主动学习和独立思考,多动手,重实践;二是明确目标并制定规划,要通过不断学习摸清专业边界,尽量先往底层走,找到个人定位,并为之努力奋斗。陈老师还代表学院全体教师表明今后将全心全意为同学们提供学习指导与服务,并预祝大家收获难忘的大学生活。

 

 

为军训保障工作标杆志愿者

颁发荣誉证书

为弘扬先进、树立典型,调动同学们传递正能量与爱心的积极性,学院广泛征集2024级本科新生的建议,由同学们民主提名,推选出了在军训期间默默为大家服务的一批志愿者。借举行新生见面会的机会,学院党委陈征宇书记为军训保障工作标杆志愿者们颁发了荣誉证书,希望同学们能继续相互扶持,相互鼓励,共同进步,多为班级、学院和学校做实事。

 

党委蓝澍德副书记

介绍入学教育安排

为了让2024级新生更好地认识中大,了解学院,提升对专业的认知度与喜爱度,学院发挥全员育人的工作机制,计划将围绕德育领航、学业引领等五个主题,安排共20余场的新生入学教育活动。
 

最后,全体起立奏唱校歌,雷竞技raybet登录入口2024级本科新生见面会暨开学思政第一课圆满结束!愿每位新生都能传承百年中大精神,牢记博学 审问 慎思 明辨 笃行,做为国求学、奋勇前行的中大人,做全面发展、引领未来的软工人!


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

实践研究 | 雷竞技raybet登录入口综合实训课程研究成果在国际会议发表

雷竞技raybet登录入口积极探索以第一课堂和第二课堂相融合为特征的软件工程实训培养模式,基于建构主义学习理论,融入产教融合理念进行了系统课程设计,提出了一个中心、两结合、三指导、四环节、五目标的软件工程综合实训课程体系。相关实践研究成果近期在国际会议2024 International Conference on Higher Education, Culture and Economic Development 上发表。

传统软件工程课程采用讲授为主的教学方式,存在实践能力培养不足、课程内容与行业脱节问题[1]。针对此问题,学院系统整合全员育人资源,充分调动第一课堂与第二课堂两支队伍、两个平台,推动实训课程以学生为学习主体,聚焦软件工程项目实操,将校内落地应用和创新创业竞赛相结合,强化合作学习为核心的教学方法。通过实训、理解、感悟、展示四环节,实现专业知识的深度内化,通过产学合作的实际应用场景,提升学生的工程实践能力,推动教学与产业需求紧密结合的课程改革实践。

 

做好顶层设计,明确培养目标。

 

学院坚持党委领导、专业协同,充分发挥全员育人体系优势,组建以院长牵头的软件工程实训培养改革工作小组,负责实训课程体系规划、建设、教学、开发、转化工作。制定《雷竞技raybet登录入口工程实训培养工作方案》,以制度形式推进以学生为主体的教学模式变革,结合软件工程专业特点,培养学生探究式学习能力,构建有利于学生自主学习的条件支撑,培养和提高学生的快速学习能力,实践能力和协作能力,提升学院在软件工程创新创业方面的人才培养质量。

 

 

以需求为导向,优化软工实训课程框架设计。

 

软件工程实训课程发挥主讲教师在课程教学中的指导作用,以及第二课堂服务团队的支撑保障作用,围绕课程目标、内容、组织和评价进行系统重新设计,着重将产教融合贯穿于课程的全过程。构建了一个中心、两个结合、三个指导、四个环节、五个能力目标的教学设计框架,注重通过实训课程加强学生的工程实践能力和与产业实际需求的对接,推动知识与实践的深度结合。

软件工程实训课程框架设计思路

 

课程团队通过结合软工实训项目和创新创业思维,引导学生围绕真实生活和产业应用场景中进行软件开发和项目实施,使其能够熟练应用软件开发的理论和技术方案,高效地完成协作项目,提升解决实际问题的能力。另一方面,通过将创新创业要素融入专业实训项目,引导学生关注国家发展战略和地方经济发展需求,培养工程思维和商业模式设计能力,训练学生将工程技术与市场需求相结合的行动力,为学生进入就业市场或自主创业打下基础。

 

 

以实战为重心,全链条实施软工实训教学组织。

 

软件工程实训课程教学以掌握编程、精通工具、理解原理、注重实战为目标[2,3],融入产教融合元素,围绕产业需求,推动编程技能提升、工具熟练应用和工程思维的精进。软件工程综合实训教学则分实训项目评定和项目落地转化两个步骤。实训课程分前期准备、中期开发、期末验收三个阶段组织实施。具体实施流程如下:

 

1前期准备

1)学员分组:通过数字文档管理手段,导入班级名单,学生自行组队。文档自动统计,确保组队信息的准确性和完整性,有效提高组队组织的效率。

2)助教招募:针对实训课程项目进行助教选题。确保选题过程的透明和公开,有助于为实训课程招募到合适的助教。

3)成绩评定:通过数字文档提供便捷的评定系统,确保成绩评定过程的透明和高效,让学生能够随时查看自己的成绩反馈,方便后续的学习改进。

 

学院发布相关通知

 

2中期开发

在开发过程方面,课程分别在需求分析、原型设计和开发阶段安排一次大组会,参与人员包括业务指导老师、项目助教、项目小组成员以及上一期项目团队代表。每个阶段的大组会旨在确保项目顺利推进,融入产教要素,通过与现实应用需求的对接,帮助学生理解实际应用场景和需求。

在助教助学方面,课程助教需要与项目小组组长和组员保持紧密沟通,定期反馈问题和需求,并协助与业务需求端的沟通,确保项目按计划推进。助教平均每学期至少组织与小组的8次业务组会。通过助教帮助学生将理论与实践相结合,助力项目成果落地。开发小组组长可根据项目进展或遇到的实际困难,主动向助教或业务老师提出会商请求,及时沟通和解决问题。这类活动将计入业务组会次数,确保学生能够快速应对实际问题,促进项目进展,强化工程实践能力。

 

3期末验收

通过项目答辩和路演,学生可以展示相应的实践成果,获得学术和行业专家反馈。项目答辩前,各开发小组提交项目交付答辩PPT、路演海报、组内互评成绩和助教评分。每组需派出代表进行8分钟的项目展示和2分钟的现场问答,展示内容包括项目功能介绍、亮点功能以及小组成员的分工安排,全景化展示项目的实际应用场景及工程思维成果。答辩结束后,各小组将项目代码上传至学院代码管理平台。

实训项目汇报答辩现场

 

4路演展示

项目路演是课程组织的重要环节。通过路演展示,激励学生面向公众讲解项目特色功能。学院提供专门场地,邀请院内外师生作为公众评委参与投票评分。根据投票结果,小组有机会获得课程额外加分,以此鼓励参训学员注重养成自身的综合表达能力和创新创业意识。

项目路演展示现场

 

软件工程实训课程是一门面向软件工程专业大二、大三学生的核心专业课程,要求学生具备C++ 程序设计和数据结构与算法的基础知识[4]。实训课程体系采用了一个结构化的框架[5,6],包括明确的课程目标、内容组织和评价流程。课程进行了系统的重新设计,重点在于弥合学生知识与实际行业需求之间的差距。这种方法鼓励协作学习,学生在学习过程中扮演主导角色,同时得到教师和行业将创新创业教育融入专业教育。创新教育教学平台和组织机制,为培养一批服务于国家战略需求、引领未来发展的拔尖创新人才做出中大软工贡献。

 

 

参考资料:

1王乐球,陈建国,毛明志,郑子彬,王焱林.基于建构主义理论的软件工程实训课程思政探究[J].计算机教育,2024,(04):101-104.DOI:10.16512/j.cnki.jsjjy.2024.04.023.

2毛明志开设公选课计算机数值算法的思考和体会[J]. 现代计算机, 2000(11): 96-98.

3毛明志刘钊基于思政与产品驱动的软件项目管理教学研究[J]. 软件导刊, 2023, 22(6): 235-239.

4毛明志,刘钊.新工科背景下IT项目管理课程思政教学探讨[J].计算机教育,2022,(04):21-23+28.DOI:10.16512/j.cnki.jsjjy.2022.04.026.

5王乐球面向翻转课堂的面向对象程序设计课程改革研究[J]. 软件导刊, 2017, 16(9): 222-225.

6王乐球周文琼高校程序设计基础微课程设计与制作[J]. 软件导刊, 2015, 14(10): 177-179.

 

 

产学合作丨雷竞技raybet登录入口雷竞技raybet登录入口参与“大模型可信能力评测排行榜”全国首发活动

近日,大湾区生成式人工智能安全发展联合实验室全国首发大模型可信能力评测排行榜。雷竞技raybet登录入口雷竞技raybet登录入口院长郑子彬教授作为联合实验室代表对排行榜情况进行了介绍,阿里巴巴“Qwen2-72b”、百度“Ernie-4.0”等一批知名企业的大模型上榜。

raybet官网郑子彬院长出席联合实验室成立仪式(左三)

 

大湾区生成式人工智能安全发展联合实验室介绍

大湾区生成式人工智能安全发展联合实验室由中共广东省委网信办和国家互联网应急中心广东分中心联合牵头发起,华为公司、腾讯公司、雷竞技raybet登录入口、广州市委网信办、深圳市委网信办、东莞市委网信办以及深圳河套发展署共同参与建设。联合实验室致力于人工智能潜在风险的评测研判、前瞻预防和约束引导研究,为人工智能可靠、可控、安全发展探索治理范式,积极服务生成式人工智能创新发展,有力支撑人工智能时代的网络综合治理体系建设,共同促进人工智能以人为本、向善而行,努力以高水平的安全助力数字经济更高质量发展。

 

国内首家落地对标《人工智能安全治理框架》1.0版评测体系

日前,全国网络安全标准化技术委员会在国家网络安全宣传周主论坛上正式发布了《人工智能安全治理框架》1.0版(简称《框架》)。这一框架不仅是一项技术性文件,更是对全球人工智能治理的新实践,意在为中国及全球AI技术的安全、可靠和可持续发展提供指引。

大湾区生成式人工智能安全发展联合实验室(简称联合实验室)根据《框架》包容审慎、确保安全,风险导向、敏捷治理,技管结合、协同应对,开放合作、共治共享的原则以及技术和治理两方面的防范措施,研究制定了国内首款对标《框架》的大模型安全可信及量化评级测评体系。该评测体系结合《生成式人工智能服务管理暂行办法》和《生成式人工智能服务安全基本要求》,重点对标《框架》,从价值对齐、安全可控和能力可靠三个主要方向和13个细分维度,对模型的生成内容及行为进行全面评估。

 

全国率先发布大模型可信能力评测排行榜

联合实验室选取了国内外22个最新大模型作为评测对象,包括17个国内模型和5个国外模型(华为、腾讯作为联合实验室联合建设单位,其模型不参与评测),按照13个维度的评测体系进行了全面客观评测,评测数据集超过3.4万条数据,支持中文和英文两种语言,最终形成了大模型可信能力评测排行榜

 

国内大模型可信评测榜单

 

国外大模型可信评测榜单

 

评测结果显示,国内大模型在可信能力评测中展现了较强的竞争力,顶尖模型在各可信维度上的差距较小,其中88.2%的模型在整体13个可信维度中达到了10A及以上水平。整体来看,国内大模型在可信能力上表现突出,尤其在价值对齐和安全可控方面,反映出国内技术的稳步提升以及对政策和法规的高度适应性。例如,在价值对齐的五个维度中,17个模型中的16个至少达到了4A水平(94.1%),但仅有4个模型达到了5A水平(23.5%),表明仍有进一步优化的空间。在安全可控维度的四个分项中,3个模型达到3A,其余14个达4A,占比82.4%

然而,评测结果也揭示了一些不足,尤其是在能力可靠性的四个维度上,模型评级从1A4A不等,仅有29.4%的模型达到了4A。这主要是由基座模型能力的差异引起的,表明模型在基础能力、一致性和稳定性方面仍有提升空间。此外,开源大模型Llama-3.1在价值对齐、安全可控等可信能力方面与领先的闭源大模型相比,仍存在显著差距,需要进一步优化。

 

价值对齐评测结果

 

 

 

安全可控评测结果

 

 

 

能力可靠评测结果

 

 

 

 

科研快讯丨软件工程智能体最新综述来了!《Agents in SE: Survey, Landscape, and Vision》

本篇综述的作者包括雷竞技raybet登录入口的郑子彬教授、王焱林助理教授、陈嘉弛助理教授、研究生黄炎贤、钟宛君、华为云的王千祥、马宇驰老师、中科院杨敏副研究员、厦门大学李辉副教授、以及西安交通大学博士研究生石恩升。

近年来,大语言模型(LLM)取得了令人瞩目的成就,并被广泛应用于各种下游任务,尤其是在软件工程(SE)领域的各个任务中。许多将大模型与软工领域相结合的研究都显式或隐式地涉及到了智能体的概念。基于大模型的智能体能够感知外界环境信息并将其转化成大模型能够理解和处理的模式,借助其记忆、推理、检索、学习、交互等能力,大模型能够在各类下游任务中取得更好的表现。目前还缺乏相关的工作对软工领域中基于大模型的智能体发展现状进行梳理。

雷竞技raybet登录入口联合华为云、中科院、厦门大学以及西安交通大学共同对115篇相关的文献进行梳理,构造了软工领域中基于大模型的智能体框架。该综述深入探讨了软件工程与智能体技术融合所面临的主要挑战,同时总结了未来研究中潜在的机遇。

论文地址:

https://arxiv.org/abs/2409.09030

论文列表:

https://github.com/DeepSoftwareAnalytics/Awesome-Agent4SE

 

01软工领域中基于大语言模型的智能体框架

Figure 2所示,基于大模型的智能体包含三个关键模块:感知、记忆和动作。其中,感知模块接收各种模态的外部环境信息,并将其转换为大模型可以理解和处理的输入形式。动作模块包括内部动作和外部动作,分别负责根据大模型的输入做出推理决策和根据与外部环境交互获得的反馈优化决策。记忆模块包括语义记忆、情景记忆和程序记忆,可以提供额外的有用信息来帮助大模型做出推理决策。同时,动作模块还可以通过学习动作来更新记忆模块中的不同记忆,为推理和检索动作提供更有效的记忆信息。此外,多智能体协作由多个负责部分任务的单个智能体组成,通过协作合作共同完成同一复杂任务。

感知模块

感知模块连接基于大模型的智能体与外部环境,是处理外部输入的核心模块。它可以处理文本、视觉、听觉等不同模态的输入,并将其转换为基于大模型的智能体能够理解和处理的嵌入向量格式,为基于大模型的智能体的推理和决策行为奠定基础。与自然语言处理(NLP)领域中的文本输入格式不同,考虑到代码的特点,软工中的文本输入格式除了基于代码序列的输入以外,还有如抽象语法树(AST)、控制流图(CFG)等基于树或图结构以及混合类型的输入。

 

记忆模块

记忆模块包括语义记忆、情景记忆和程序记忆,它们可以提供额外的有用信息来帮助大模型进行推理决策。

1)语义记忆(Semantic Memory

语义记忆指基于大模型的智能体的常识或公认的世界知识等,通常存储在外部知识检索库中。外部知识检索库中可存储文档、库、API等其他类型的信息。其中,文档和API是外部知识库中最常见的信息类型。通过增加相关的文档和API知识,智能体能够更好地理解问题和做出推理决策。

2)情景记忆(Episodic Memory

情景记忆指的是与当前问题相关的内容以及来自先前决策过程的经验信息等。与当前问题相关的内容(例如在搜索数据库中找到的相关信息、上下文学习(ICL)技术提供的样本等)可以为基于大模型的智能体推理提供额外的知识来更好地理解问题,先前决策过程的经验信息则能够为基于大模型的智能体进行推理决策提供参考。因此,许多工作将此类信息引入到基于大模型的智能体的推理过程中,提高推理效率和质量。

3)程序记忆(Procedural Memory

程序记忆包括隐性知识和显性知识。其中,隐性知识存储在大模型参数中。现有的工作通常通过大量数据训练模型,得到具有丰富隐性知识的预训练大模型来完成各种下游任务显性知识;或者,用高质量的数据预料对已有的预训练大模型进行微调得到表现更好的微调模型。显性知识主要存储在预先定义的智能体代码(Agent code)中,使得智能体能够自动运行,进行独立推理和决策。智能体代码指的是驱动智能体运行、指导其行为和决策的程序或算法。

 

动作模块

1)内部动作

内部动作包括推理、检索和学习动作。其中,推理动作负责根据基于大模型的智能体的输入进行问题分析、推理和决策。检索动作可以从知识库中检索相关信息,辅助推理动作做出正确决策。学习动作则是通过学习和更新语义、程序和情景记忆,不断学习和更新知识,从而提高推理和决策的质量和效率。

推理动作:严谨的推理过程是基于大模型的智能体完成任务的关键,而思维链(CoT)是最主流的有效推理方式。借助思维链,大模型可以深入理解问题,分解复杂任务,并生成高质量的答案。如Figure 3所示,现有工作探索了不同形式的思维链,包括朴素思维链/计划)(Native CoT/Plan)、结构化的思维链(SCoT)、头脑风暴(Brainstorming)、树形思维链(Tree CoT)等。具体地,朴素思维链/计划是在提示(prompt)中让大模型逐步思考,生成的回答中给出分析问题的具体过程并逐步解决问题(如Figure 3中(a)所示)。考虑到代码的特性,一些工作提出了结构化的推理模式来引入代码的结构信息,得到结构化的思维链。结构化的思维链以伪代码的形式呈现推理过程,涉及循环、分支等逻辑结构(如Figure 3中的(b)所示)。在提示中让智能体进行头脑风暴,利用算法、数据结构以及数学等知识给出解决问题的关键词,例如Figure 3中(c)给出了解决问题可行的算法作为头脑风暴的结果。树形的思维链动态地探索和更新思维链,树中的节点涉及已完成、新建、新推断、待定等多种状态(如Figure 3中(d)所示)。

检索动作:检索动作可以从知识库中检索相关信息,以辅助推理动作做出正确的决策。检索所用的输入和检索得到的输出内容有不同的类型。如Table 1所示,输入和输出可以是文本、代码,也可以是同时包含文本和代码的混合信息。现有的检索方法可分为基于稀疏的检索(sparse-based)、基于密集的检索(dense-based)和其他方法。Figure 4分别展示了基于稀疏的检索和基于密集的检索流程。基于密集的检索方法将输入转换为高维向量,然后比较语义相似度以选择具有最高相似度的k个样本;而基于稀疏的检索方法计算BM25TF-IDF等指标来评估样本之间的文本相似度。此外,还有计算自然语言文本之间的编辑距离或代码片段的AST等其他的检索方法。

 

基于密集和基于稀疏的检索方法是两种最主流的检索方法。其中,密集型检索技术通常比稀疏型检索方法具有更好的性能。但稀疏型检索可以在达到与密集型检索相当的性能水平的基础上获得更高的检索效率。因此,更多的工作选择采用稀疏型检索方法。

 

学习动作:学习动作是通过学习和更新语义和程序记忆,不断地学习和更新知识,从而提高推理和决策的质量和效率。(1)用知识更新语义记忆。语义记忆主要存在于存储基本世界知识的知识库中,可以通过利用已识别的代码知识更新知识库或构建新的知识库来更新语义记忆。(2)更新隐性知识。由于隐性知识存储在大模型参数中,因此可以通过微调模型来更新大模型参数,从而更新隐性知识。(3)更新智能体代码。基于大模型的智能体将相应的提示构建为智能体代码,以规范智能体如何感知环境、推理和决策以及执行动作。许多工作使用指令调优技术将大模型的输出与输入指令对齐。

 

2)外部动作

与开发者或其他智能体交互:智能体可以与开发者或其他智能体进行交互,并在交互过程中获得丰富的信息作为反馈,扩展智能体的知识范围并对生成的回答进行优化和修正。

与数字系统交互:智能体可以与数字化系统(比如OJ平台、网页、编译器等外部工具)进行交互,交互过程中获得的信息可以作为反馈来优化自身。其中,编译器是最常见的外部工具之一,已有许多工作用编译器编译基于大模型的智能体生成的代码,并将编译得到的错误信息作为反馈信息对代码进行优化。

 

 

02挑战和未来研究方向

本文中进一步分析了软工技术与智能体技术结合的现有挑战并总结了一些未来研究中存在的机遇。

 

对感知模块探索的缺乏

在介绍感知模块时提到,软工领域中探索基于大模型的智能体感知模块的工作还很缺乏。与自然语言不同,代码是一种特殊的表示,可以作为普通文本处理,也可以转换为具有代码特征的中间表示,例如 ASTCFG 等。现有工作通常将代码视为普通文本,忽略了代码特性,建模得到的代码表示中的信息不足,限制了基于大模型的智能体在代码相关的下游任务上的表现。此外,软工领域中目前还缺乏对视觉和听觉输入模态的探索。探索如何高效建模感知模块中基于树/图、视觉或听觉等输入模态是未来研究可行的方向之一。

 

基于大模型的智能体的角色扮演能力

一方面,基于大模型的智能体通常需要在不同任务中扮演不同的角色,每个角色都需要特定的技能。例如,智能体在生成代码时扮演代码生成器的角色,测试代码时则扮演代码测试员的角色。另一方面,智能体有时可能需要同时扮演多个不同角色,具备多种不同能力。例如,在代码生成场景中,智能体需要同时扮演代码生成器和代码测试员两个角色,具备生成和测试代码的能力。软工领域中存在各种已有大模型学习得不够充分的小众任务和需要智能体具备多种能力的复杂任务,例如测试生成场景、前端开发、仓库级代码生成等。因此,研究如何使智能体有效地适应新角色和管理多角色性能需求也是未来工作的一个可行方向。

 

公认知识检索库的欠缺

外部知识检索库既是智能体语义记忆模块中的重要组成部分,也是智能体交互的重要外部工具之一。在NLP领域,有维基百科(Wikipedia)等公认的大型知识库作为外部检索库。但在软工领域,目前尚无权威的、公认的包含丰富代码相关知识(如各类编程语言的基本语法、各类常用算法、数据结构、操作系统相关知识等)的知识库。未来研究中的一个可行方向是开发一个大型的权威代码知识库,并将其作为智能体的外部检索库,为智能体推理决策提供额外的信息,从而提高推理和决策过程的质量和效率。

 

基于大模型的智能体中的幻觉问题

大模型作为基于大模型的智能体的认知核心,其整体性能影响着智能体在各种任务中的表现。已有的工作表明基于大模型的智能体中可能会存在幻觉问题,例如,在做代码生成任务时生成不存在的API。智能体性能和幻觉缓解之间存在双向关系:幻觉问题的缓解可以提高智能体的整体表现,同时智能体的优化也能够反向缓解基于大模型的智能体的幻觉。虽然目前已有一系列工作致力于研究大模型的幻觉,但解决基于大模型的智能体中的幻觉问题仍然存在挑战。探索基于大模型的智能体中存在哪些类型的幻觉、深入分析这些幻觉的原因以及提出有效的幻觉缓解方法是未来研究中存在的机遇之一。

 

多智能体协同合作的效率问题

在多智能体协作过程中,各个智能体需要扮演不同的角色来完成特定的任务,然后将各个智能体的决策结果结合起来,共同解决更为复杂的目标。但这一过程往往需要每个智能体投入大量的计算资源,造成资源的浪费和效率的降低。此外,各个单智能体之间各种信息的同步和共享也引入了额外的通信成本,影响协作的实时性和响应速度。有效管理和分配计算资源、最小化智能体间通信成本、减少各个智能体的推理开销是提升多智能体协作效率的关键挑战,这些问题的解决为未来的研究提供了重要的机会。

 

基于大模型的智能体中软工技术的应用

智能体与软工领域之间存在互惠互利的关系,不仅智能体技术能够应用于软工领域,软工领域的技术(尤其是编码技术)也可以应用到智能体中,推动智能体领域的发展。例如,软件测试技术可以用于识别基于大模型的智能体中的异常行为和潜在缺陷。软件工具(如 API 和库)的改进也可以提高基于大模型的智能体(尤其是对于那些具有工具使用能力的智能体)的性能。此外,智能体系统的管理可以借鉴软件包管理技术。例如,可以应用版本控制来监视和协调智能体系统中不同智能体之间的更新,从而增强兼容性和系统完整性。目前这方面的研究仍然有限,探索将更复杂的软工技术融入智能体系统有助于推动这两个领域的进步,是未来研究的可行方向之一。

 

综上,本综述对智能体技术与软工领域结合的相关工作进行了分析和梳理,构造了包含感知、记忆、动作三个核心模块的软工领域智能体框架,总结软工技术与智能体技术结合存在的挑战并给出了一些未来研究中存在的机遇。相信本综述能够为智能体和软工领域的发展起到促进作用。

 

订阅