为深化政法智能化建设,加强“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”等信息平台建设,深入实施大数据战略,实现科技创新成果同政法工作深度融合。法制日报社已连续举办了七届“政法智能化建设技术装备及成果展”。
作为装备展配套活动,法制日报社于2024年3月继续举办了2024政法智能化建设创新经验征集宣传活动,活动征集了“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”创新经验。
在2024年7月10日至11日举办的成果展上,对入选的创新经验进行了集中展示,并已编辑整理成册——《2024政法智能化建设创新经验汇编》。
该汇编分为智慧治理篇、智慧法院篇、智慧检务篇、智慧警务篇、智慧司法篇五个篇章,为政法信息化、智能化建设提供及时、准确、 实用的资讯信息与经验观点。
应广大读者要求,我们特开辟专栏,将部分创新经验进行展示,敬请关注!
以下推出的是《智慧法院篇 | 创新经验之“司法大模型辅助裁判文书生成:问题、定位与应用探究”》
司法大模型辅助裁判文书生成:问题、定位与应用探究
钱力 罗燕飞 四川省成都市武侯区人民法院
【摘 要】:相较于传统人工智能,大模型赋能裁判文书生成更具通用性、拓展性和全域化,但也存在数据瓶颈、算法黑箱及平台异构等掣肘。应明确其“辅助”功能定位,赋予算法设计者相关法律义务,提升可解释性。从规范、事实、争点整理层面对大模型进行预训练。经过预训练的大模型,能够根据不同的办案流程及场景,自动基于案件信息、卷宗和法律条文规则,完成裁判文书制作。
【关键词】:大模型;人工智能;裁判文书;数字法院
当前,以大模型技术为代表的生成式人工智能正在实现快速演进并不断获得技术跃进,为审判工作现代化带来了全新引擎。大模型拥有海量参数和复杂架构,具有“类人”的语言理解、知识记忆和逻辑推理,能够深入挖掘大规模数据中的潜在关联规则和语义信息,并根据复杂指令生成相应的图文内容。而裁判文书展现的要件化、格式化特征,使其成为司法大模型的重要应用场景。本文将聚焦司法大模型辅助裁判文书生成这一功能,探讨其运行困境、功能定位与优化路径。
一、迭代:从传统人工智能向生成式人工智能的技术进路
(一)小规模:传统人工智能应用于裁判文书智能生成的局限性
传统人工智能应用于裁判文书智能生成具有“小规模”特征,所需参数少、算力小,且只能处理简单、分散的任务。主要以本院审理的案件为蓝本(简单、实用类案)、以要素信息为基础(制定要素式裁判文书模板),文书可批量生成。此种模式有赖于法官及审判辅助人员自行提取并导入案件基础信息和要素信息,系统的主要功能是进行基础信息的机械性提取和回填,因此智能化程度较低,这也在一定程度上限制了人工智能的适用场域,对于复杂案件的裁判文书生成显得“力不从心”。
(二)大模型:生成式人工智能应用于裁判文书智能生成的创新性
相较于传统人工智能处理任务的简单化和适用场域的有限性,以大模型为代表的生成式人工智能可响应多元化指令、执行多样化任务。具体到裁判文书制作方面,其突破性在于:第一,模型更具通用性。生成式人工智能时代,裁判文书智能生成无需单独重新训练,一套大模型可以适用多种场景,自动甄别指令并高效执行事实提取、证据审查、文书生成等任务。第二,功能更具拓展性。生成式人工智能可以传统人工智能的输出结果作为指令,进而拓展人工智能场景。例如,将传统人工智能输出的结果(即是否假释被告人)输入大模型中,大模型可结合法官的最终裁定结果(即是否假释被告人)自动生成裁定书。第三,场景更具全域化。实现立案、调解、庭审、判决全流程的案情分析、案由匹配、证据梳理、争点整理、类案推荐和法条推送,全链条辅助裁判文书生成。
二、检视:大模型应用于裁判文书生成的困境审思
大模型技术的应用,看似突破自然人的“有限理性”桎梏而向“极限理性”逼近,实则还存在数据、算法及平台等多方面掣肘。
(一)数据瓶颈:前置性与不完整性的矛盾
一是数据质量不优。大模型应用于裁判文书生成,依赖于海量文本与大规模的语言训练,包括法律法规、类案裁判及个案事实数据等。但是司法实践中仍存在不少“同案不同判”的问题,以及存在裁判文书结构不一、事实部分不明、说理内容单薄等问题。二是数据识别困境。技术语言以文本语料为基础,主要对字词语句分析含义,而法律语言除文本含义外,还注重对上下文关系、语境等因素的理解。三是数据泄露风险。主要包括案件相关敏感信息的数据窃取和数据泄露等,国家秘密、个人隐私等保护存在泄露隐忧。
(二)算法黑箱:公开性与不可解释性的矛盾
大模型生成裁判文书的可解释性较弱,事实认定、证据审查、逻辑推理及最终决策都难以追溯或验证,这与司法公开的要求相悖。尽管其只是作为辅助裁判工具,但预判结果难免影响法官判断。此外,还存在技术人员操纵算法机制影响裁判结果的风险。从责任承担上来看,大模型所生成的裁判文书若最终影响法官决策,则关于法官、人工智能以及人工智能设计者的责任承担问题,尚存讨论空间。
(三)平台异构:统一性与多样化的矛盾
大模型有通用大模型和行业大模型之分,行业大模型聚焦特定领域,提供针对该领域的场景化服务。随着生成式人工智能的兴起,各类司法大模型产品如“雨后春笋”般涌现,但由于数据来源、训练方式以及算法技术的不同,在生成结果方面也具有差异性,大模型也难以摆脱“同案不同判”的窠臼。
三、进路:大模型应用于裁判文书生成的路径探究
面向未来的大模型应用,首先要解决其功能定位和责任承担方面的原则问题,并以实践为导向探寻技术层面的优化路径。
(一)原则:功能定位与责任厘清
《最高人民法院关于规范和加强人工智能司法应用的意见》已经明确了司法人工智能的“辅助审判原则”,结合上文中对大模型数据、算法及平台的分析,当前大模型生成裁判文书的“辅助”功能定位是清晰的。质言之,大模型应用于裁判文书生成的主要作用是提供决策参考,即通过“技术理性促进裁判理性”。
从责任承担角度来讲。一方面,要明确算法设计者的相关责任,避免恶意操纵算法影响司法决策的行为,算法的提供者虽然不属于司法主体,但其通过算法对裁判文书产生一定影响,即使不承担司法责任,也需要赋予其相应的法律义务,以制约算法产生的不利影响。另一方面,要提升大模型的可解释性,增强大模型生成裁判结果及论证过程的可信度。
(二)技术:语料输入与文本输出
法官制作裁判文书的过程,是在事实与规范之间穿梭的过程。同理,如何预训练大模型从生活事实中识别出要件事实,并将其涵摄于法律规范,是大模型生成裁判文书所需要解决的关键问题。
1.规范部分
为建立法律与事实、法律与解释之间的联系,预训练需要纳入两类文字素材:一类是包括完整裁判规范和对应事实类型的裁判文书,另一类是建立与法律解释相关的政策文件、法学理论著作等。通过学习并梳理常用的法律规范,与案件案由、事实信息匹配,回填到裁判文书中。
2.事实部分
大模型生成裁判文书所认定的事实是经过归纳并与证据相对应的。第一,为获得归纳案件事实能力。需辅以海量生活事实与经整理的事实作为训练语料;第二,为获得事实认定能力,将案件事实和证据作为训练预料;第三,为获得证据评价能力,以证据信息作为训练语料,输出优质证据评价结论。对于无争议事实,大模型可以自动识别并回填至裁判文书的相应位置。
3.争点整理
以当事人诉讼请求(控告)和被告答辩(辩护理由)作为训练语料,训练大模型归纳争议焦点的能力。
(三)范式:个案具体应用
经过预训练的大模型,能够根据不同的办案流程及场景,自动基于案件信息、卷宗和法律条文规则,完成裁判文书制作。(具体应用如下表)
四、结语
当前,是大模型技术应用于数字法院建设“最好的时代”。全国法院“一张网”建设能够为大模型开拓出数据汪洋,“案例库”“法答网”等平台的建设与应用,既依靠大模型深度赋能,也能为未来裁判文书智能生成提供更多高质量、规范化的预训练数据,实现“双向奔赴”。面向未来,“辅助”定位下大模型在裁判文书智能生成中的深度应用,必将助力司法审判质效实现有力提升。
责任编辑:晓莉
暂无评论