□通过开源大语言模型的深度优化,从实体关系维度系统性地星空智能科技构建证据审查的规则及其空间关联结构,确保模型能够精准契合证据审查的核心需求。同时,积极收集经验性证据审查材料,针对性投喂预训练模型,并根据模型运行反馈,动态调整相关参数,逐步训练出符合司法实践场域特点的个性化智能体模型,从而形成以数据证据为核心对象的人机协同证据审查运行模式。
证据是诉讼活动的核心与基础。证据审查本质是发现、判断案件相关事实信息,进而认定证据事实,并依据证据的真实性、关联性、合法性判断待证事实的过程。当前,人工智能在证据取证与审查中多局限于特定领域,缺乏复杂现实环境下大语言模型技术适用的场景,且取证系统性研发与现实需求契合度不高,尤其是欠缺统一的证据规范及其适用标准,易导致取证分析不彻底,证据获取不充分以及证据采信度不高等问题。因此,建构基于人工智能的辅助证据审查机制对于数字法学以及数字检察等研究具有重要现实意义。
对于证据审查,首先依据的是现行法律规范并高度依赖办案经验,这是由人类认知活动的基本规律所决定的。就人工智能技术而言,建构辅助性证据审查系统必须依托既有的“前理解”阶段以及与之相适应的“预训练”模型,这一过程呈现出技术化路径的转换特征,也是人工智能辅助证据审查机制体系性建构与模式化转向的重要基础。
经验审查模式向人机协同模式的转换。传统证据审查活动主要是办案人员基于法律规则、办案经验,经由“证据建构”形成案件事实。当前,随着人工智能技术的引入,拓展了“机器经验”(人的经验机器化)在证据审查机制中的运用,推动了证据审查从以人工经验为主向人机协同模式的转型。即通过人工智能大语言模型训练,实现证据体系与数据对象的关联耦合,形成系统性推理和分析模型。并结合系统设计与相应的工作机制,通过“人机交互”规避模型因缺乏司法经验、社会阅历等导致的效能不佳问题,从而构建高效的人机协同证据审查运行模式。
直接证据形态向间接证据形态的转换。传统证据法认为,直接证据的法律效能要远大于间接证据。直接证据单独与主要案件事实发生证明关系,能够独立构成一个完整的证据链条;间接证据则需达到一定数量,并组成完整的间接证据链,才能推论出案件主要事实。在数字化证据中,相关证据的特征与形态均为再生性的数据模式。特别是基于人工智能算法分析后生成的证据均为间接证据。这些间接证据形成一个相互印证的有机整体,可实现一种高度盖然性推论。其核心是要求每一项间接证据不仅要符合法定性要求,达到证据内容真实,还要与案件主要事实存在关联性,且在数据体量上形成规模,最终通过完整的间接证据链推论出案件主要事实。
证据文本化叙事向证据模型化叙事的转换。在证据分析中引入叙事方法是现代证据法研究的重要议题。从叙事学角度来看,案件证据的适用过程就是基于法律要件“重现”案件的过程。人工智能模型的技术核心是基于形式化逻辑所形成的一个符号系统,这些符号按照一定的运算程序规则相互连接,形成以符号参数为要素的复杂空间结构。而经过人工智能模型分析处理的证据则是借助大语言模型的程序运算,将文本化证据形式化为数据对象,进而通过对数据对象的计算实现证据分析的目的。在这种模式下,传统证据文本化叙事范式被转换为结构化和信息化的场景形态,即建构形成高度技术化叙事范式。通过算法的计算化处理,对海量证据数据进行规模化、体系化重构,形成一种程序化的证明性星空智能科技过程。在证据形态数据化转向证明过程模型化的过程中,预示着在证据审查中,模型方法的运用将成为直接决定证据审查机制运行的关键性因素。
证据规则是确认证据范围、调整和约束证明行为的法律规范,是认定某一证据材料是否具备证据能力的根本性依据。此时,如何科学、规范地“裁剪”证明事实,将原始证据材料转换为符合法律规定的案件法律事实,成为能够最终将案件事实涵摄于确定的法律规则之下的关键。在此基础上,证据审查则是司法机关在诉讼活动中,依照法定程序对证据进行全面核查、判断,以确定其能否作为定案依据的法律活动。在人工智能辅助证据审查机制建构中,司法机关训练和应用大模型审查什么、怎么审查、如何进行系统建构成为机制运行的核心问题。
基于“参数化”的关联性审查路径。对于人工智能算法而言,如何适配于办案人员所进行的证据审查流程,成为了人工智能算法设计的基础性问题。人工智能系统本质是通过数据模型开展证据分析,通过数据证据间的关联判断明确实体证据间的因果关系。如何依据数据关联性判定两个事实之间的相关性,成为人工智能辅助证据分析及审查机制建构的关键落脚点。
从证据规则的一般性原理出发,关联性是证据的本质属性,只有蕴含案件信息的物和人才能够成为证据,而在司法实践中强化对证据的收集、甄别、审查、判断的重要环节也是基于证据的关联性审查。那么,在建构人工智能辅助证据审查系统中,如何进行关联规则的界定是难点问题。尤其在模型的算法架构中判断证据之间为何具有关联性、如何通过算法把握关联性,成为相关系统研发的核心环节。当前主流生成式人工智能技术的法律系统设计,其基本原理是将相关法律规则设定为一种先验规范依据,并在相关数据分析中基于上述既定的逻辑规范进行处理。而在具体技术路径上,法律规范的规则逻辑,在数字化空间中将以“参数化”形态出现。在人工智能算法运行过程中,变量和参数的调整在一定程度上影响复杂系统空间结构和组织架构,进而对数据要素间的关系进行量化调整。此时,依托于大语言模型参数阈值的代码化架构,逐步成为数字时代法律规范运行的基本模式。即通过设定自动调整参数,实现算法模型与现实法律运行的适配衔接,已成为人工智能技术介入司法活动的基本路径。具体到人工智能辅助证据审查技术实现路径,在相关机制设计过程中可将证据的关联性规则依托规范化语料的训练,转换为大语言模型的参数架构,使得参数化要素和代码化逻辑成为证据关联性审查的基础性参考依据。
基于“图谱化”的法定性审查路径。只有符合法律规定的程序、方法和原则,所识别和收集到的证据所包括的案件信息才能够作为认定证据事实的依据。因此,界定审查依据,明确审查标准和流程,是人工智能辅助证据审查机制技术化路径实现的核心内容。
大数据技术及人工智能算法的应用本身是经验主义在法律领域的具体应用。实践中所广泛采用将数据挖掘的关联规则技术应用于电子证据分析,其目的就是找出隐藏在各个数据项之间的联系和规则,推动大数据模型在数据化证据审查中的适用。而如何对相关数据关系进行模型化审查,则需要将相关证据规则进行图谱化转换。从技术路径角度理解,知识图谱作为一种知识表示,是人工智能的基本组成成分。它反映了物理世界客观存在的组成和形式,为人工智能提供了推理和决策的关键组件,也是确保人工智能场景适用的根本性技术支撑。随着数据量的快速增长,数据对象的关联越来越紧密,数据内在结构和功能将为知识图谱的信息处理提供有效支撑。知识图谱的核心价值在于其丰富的连通结构,能反映真实世界的丰富信息,因此,基于证据规则建构数字化证据图谱进而分析实体性证据要素之间的关系,是知识图谱在相关证据审查系统应用的关键环节。即构建证据审查知识图谱的目的在于,获取大量计算机可读的知识内容,实现数据与证据的融合,对不同数据源的数据进行融合性分析,构建数据之间的关系结构。而在关系模型中,实体以及实体间的关系是通过数据表来显示的,将这些表映射为本体中的概念和关系通过图谱化处理,则能够在人工智能系统中实现对现实证据运行关系的表征与模拟。
基于“智能化”的系统性审查路径。当前,在人工智能技术发展已进入智能体阶段,通过整合多种数据源构建专业领域数据集,充分发挥各种数据源的优势,通过融合这些数据源,能够提升智能体的认知和推理能力。按照覆盖面,相关智能体可分为通用智能体和行业智能体。目前,基于DeepSeek等通用大语言模型,进行相关行业化模型训练,辅助复杂分析或决策支持场景,已成为主流的技术应用模式。在司法领域,对于智能体技术应用于证据审查模型的研发虽然还处于探索阶段,但行业内已有相关开展证据审查智能体大模型训练的案例。其基本思路是以RAG(图检索增强生成技术)架构为核心,依托大语言模型系统,实现对相关证据规范性数据集的智能化解析与结构化处理。通过开源大语言模型的深度优化,从实体关系维度系统性地构建证据审查的规则及其空间关联结构,确保模型能够精准契合证据审查的核心需求。同时,积极收集经验性证据审查材料,针对性投喂预训练模型,并根据模型运行反馈,动态调整相关参数,逐步训练出符合司法实践场域特点的个性化智能体模型,从而形成以数据证据为核心对象的人机协同证据审查运行模式。此时,相关证据审查工作也将被数字化的算法模型流程所赋能,并将其转换为结构化的算法语言储存在大模型数据集合中,有效促进办案经验与算法工具的深度啮合,从而逐步建构起证据审查的人机协同发展的智能体系统路径方法。
(作者分别为天津师范大学政治与行政学院教授、博士生导师,山西省人民检察院法律政策研究室副主任。本文系2025年度最高人民检察院检察应用理论研究课题“法律监督人工智能大模型的运行机理问题研究”的阶段性研究成果)
最高人民检察院 (100726)北京市东城区北河沿大街147号 (查号台) 010-12309(检察服务热线)
为了获得更好的使用,建议使用谷歌浏览器(chrome)、360浏览器、IE11浏览器。