【关键字】:区块链;数字检察;监督模型;数据信任;安全
数字检察快速发展的同时,数据信任与安全问题也应当引起足够重视,构建大数据法律监督模型应以数据可信任、确保数据安全为前提。因比特币诞生的区块链为实现数据信任与安全提供了新的思路和技术条件,《中共中央关于加强新时代检察机关法律监督工作的意见》要求“运用大数据、区块链等技术推进公安机关、检察机关、审判机关、司法行政机关等跨部门大数据协同办案”。基于区块链的数字检察创新发展势必更加行稳致远。本文通过分析区块链的特点和核心技术,利用区块链探索解决数字检察中数据信任和安全问题。
一、区块链技术概述
2008年11月,一名自称“中本聪”的人在论坛“metzdowd.com”上发表了一篇名为《比特币:一个点对点的电子现金系统》的论文,论文中描述了一种去中心化的加密数字货币—比特币,从此以后,区块链作为比特币的底层技术进入大众视野。经过十余年的发展,区块链技术已被认为新一轮信息技术革命的发展核心和应用高地。
(一)区块链特点
区块链技术独具的去中心化、可信、防篡改等特点,解决了不同主体间的不信任和协作难题,在整个经济社会中产生了一系列的应用场景。
1.去中心化
区块链网络中的所有节点均是对等节点,每个节点都可以观察到网络中的全部行为,并将观察到的行为在各个节点维护一个本地账本,整个区块链系统对每个节点都是透明的。各个节点的权利和义务相等,共同维护和管理数据,这与中心节点有绝对话语权的中心化网络有本质区别。
2.可信性
区块链系统中的所有行为对所有节点都是透明可见的,通过共识算法确保所有节点数据的一致性,所以整个系统中的数据和信息是可信的,各个节点共同参与共识过程的结果。
3.防篡改且可追溯
一旦写入某个节点的数据信息被各个节点共识后加入到区块链中,将无法进行篡改,因为在节点中进行篡改,无法将篡改的部分达成共识,导致篡改无效。区块链上的每一次操作将会被完整记录,记录不能被修改,这就为可追溯提供了保证,即每一次的数据操作均可溯源。
4.用户匿名性
区块链中任意节点都包含完整的区块校验逻辑,因此网络中两个节点之间无需建立信任即可进行数据交互,即不需要互相公开身份,从而用户的隐私得到保护。
5.系统高可靠性
每个节点都对等地维护一个账本并参与整个系统的共识计算,任何一个节点的故障都不会影响整个系统的正常运转。
(二)区块链关键技术
1.共识机制
共识机制是区块链的基础和核心,决定了节点之间以何种方式对操作执行顺序和内容达成一致,确保各个节点数据的一致性。实现共识的方式有两种,一种是纯软件的方式,灵活性高、通用性强,但是高度依赖于算力和网络属性,性能容易遇到瓶颈,比如证明类共识算法、拜占庭容错类共识算法、崩溃容错共识算法等。另一种是软硬结合的方式,由于引入硬件的高性能和高可靠性,通常具有更好的性能优势和稳定性,但是依赖于特定的硬件资源,可移植性较弱,例如基于硬件可信执行环境类共识算法。从纯技术层面考量,共识算法类型较多,并不存在适用于所有场景应用的完美算法,需要研究者根据特定应用场景的需求进行算法种类选择,并加以设计和改进。
2.智能合约
智能合约概念在1993年被提出,意思是当满足一定的触发条件时,就能被自动执行,无需第三方,但较少引起关注。区块链的出现,天然地将智能合约的作用激发出来,区块链刚出现时,主要应用于加密的数字货币,引入智能合约后,区块链的应用就进入到社会生产生活的各个领域,比如金融、拍卖、政务、司法、平台经济等。一个基于区块链的智能合约包括事务处理机制、数据存储机制以及完备的状态机,事件的触发、数据处理并计算和数据存储都在区块链上进行。一次智能合约流程包括:当满足触发条件时,智能合约根据预设的逻辑,读取数据并计算,最后将计算结果保存到区块链上。
二、数字检察中数据信任与安全异化风险
(一)构建模型引入海量数据的安全风险
构建大数据法律监督模型需要的数据可以划分为两种类型,一种是检察内部数据,指检察机关办案过程中掌握或产生的办案数据,从检察办案系统上线以来,检察机关已经积累了丰富的办案数据,但这些数据大多处于“沉睡”状态,没有真正用起来,另外公安机关移送的电子数据,这部分数据基本只是用于个案审查,很少对里面的数据进行深入挖掘。另一种是外部数据,包括司法数据、行政数据等,对于部分司法数据可以通过政法协同平台获取,还有部分司法数据需要沟通获取,大部分行政数据基本都需要与行政机关沟通获取。许多模型运用需要的数据量往往较大,实践中可能大多只关注模型规则、逻辑、线索等,很少对大量数据获取、应用带来的风险进行考虑。
检察机关的内部数据存储于检察业务应用系统中,文书卷宗占绝大多数,这部分数据是非结构化数据,需要转换成结构化数据之后才能进行使用和分析。但是文书卷宗的数据体量非常大,使用过程中需要确保源文件不被丢失、不被篡改,否则将影响日常办案,同时还需要确保转换的结构化数据与非结构化数据的一致性。对于公安机关移送的电子数据,要做到案件之间的挖掘和比对,包括异地案件的碰撞,筛查个案之外的其他犯罪线索,比如毒品、电信诈骗、洗钱等,需要将电子数据进行存储并接入网络,较短时间就可以达到海量电子数据,存储的电子数据都是从原始介质提取后复制过来的,应当从技术层面保证证据的客观性,接入网络的电子数据应有效防止被攻击、被篡改,并具备可追溯和重定向功能。外部数据基本都是检察机关根据建模需要从其他机关获取,确保数据的安全是第一性的,更应该考虑怎么存储和管理,如何防止数据篡改和泄露,如何确保推送线索与原始数据间的关联性。以上关于建模引入海量数据的安全风险问题是推进数字检察战略面临的基础性问题,只有解决好这一基础性问题,根据模型推送的线索才是可靠而具有说服力的。
(二)公民个人信息泄露风险
随着数字化时代的到来,对数据的应用不断加深,造成公民个人信息泄露也层出不穷,泄露的数据被犯罪分子利用可能对用户造成严重的后果。2022年12月,蔚来汽车因用户数据泄露而被勒索比特币,泄露的用户达40万条之多,被泄露的信息包括车主身份证、家庭住址、贷款数据等,这些信息被黑客明码标价的在市面上出售。2023年6月,浙江某科技有限公司为浙江某县级市政府部门开发运维信息管理系统的过程中,造成严重的数据泄露,相关责任人被问责追究。推进数字检察工作过程中,处理和分析的数据基本都包括公民个人身份信息,对于这部分数据要严格按照《个人信息保护法》规定的权利义务进行管理和使用,应当具备防篡改、事中留痕、事后审计、安全防护等必要技术措施。据了解,实践中部分地区的检察机关将大数据法律监督模型直接部署于互联网中,且采取的安全策略和措施均不能满足安全需要,一旦被攻击造成数据泄露,损失将无法弥补。
(三)接口对接产生数据不一致的信任风险
检察机关获取外部数据,通过与其他单位的应用系统进行接口对接方式是一种不错的选择,能够实现使用数据“最小化”原则,按需获取数据,而不是直接获取全量数据,既节约资源又可一定程度降低安全风险。同时能够让数据不“落地”,让数据“多跑路”,提高工作效率。实践中,各个地方对接系统、数据的管理方式不尽相同,存在多接口对接的情况,涉及的系统较多、管理部门较多、研发单位不同、数据库类型不同等,这就容易造成数据不一致,且难以发现,即使发现也难以排查和溯源。这样就导致大数据法律监督模型推送的线索不准确,直接影响后面的线索排查和案件办理效果,构建模型的思路和规则可能会受到质疑,影响从事数字建模人员的工作积极性。因此,对利用接口方式获取数据方式应当对数据一致性问题从技术层面进行规制,确保应用模型数据的准确性。
(四)模型推送监督线索信任风险
现阶段,数字检察赋能法律监督主要通过构建大数据法律监督模型实现,遵循“梳理监督点位、提炼监督规则、获取治理数据、构建监督模型、进行案件办理、实现系统治理”一般化路径。检察官根据监督模型推送的监督线索进行案件办理,成案率是检验监督模型中的规则提炼是否合适、准确,除了监督规则本身之外,还有两个方面的问题会影响检察官根据监督线索调查核实后是否成案。第一个方面,监督模型使用的数据是否准确可靠,不管是检察内部数据还是外部数据都存在这样的问题,针对海量数据,人工核查和一般的技术性判断,均难以对数据的校验。第二个方面,监督模型中的监督规则对检察官是否透明可信,是否存在被篡改的风险,监督规则是监督模型的核心部分,由检察官根据个案办理总结、归纳、提炼,再由技术人员或者模型架构师予以实现,由于技术壁垒,检察官很难对编码后的规则和推送监督线索的实质内容进行核验,监督模型使用过程中,监督规则发生变化也难以发现。即便是用于检察官自主建模的低代码平台,同一个办案团队共同使用监督模型时对模型的管理也存在一样的风险。
(五)治理数据和模型应用的人员风险
应用大数据法律监督模型,首先是对数据的处理和治理,由于该项工作需要一定的技术基础,同时较为繁琐,占据模型应用大部分工作量,一般由检察机关的技术人员、运维人员,甚至是研发模型的科技公司承担。存在两方面的风险,一方面数据治理人员不一定是检察人员,如果在数据治理过程中存在恶意的主观行为,则可能导致数据泄露,影响数据安全,例如追求经济利益的数据违法交易等,甚至利用数据进行违法犯罪活动,例如基于身份信息的电信诈骗等,因为数据治理专业性特点,实施以上行为操作简单、隐蔽性强,实践中难以识别和发现。另一方面数据治理人员由于工作疏忽导致滞后的数据与原始数据存在偏差,影响数据的真实性。其次是模型推送监督线索的管理,研发模型初期,由于监督规则、线索呈现、模型界面等内容需要不断调整和完善,研发人员大多掌握模型推送线索的情况,因此也存在和数据治理一样的人员风险。亟需从制度上、技术上两个维度予以规制,避免以上情况的发生。
三、利用区块链技术解决数据信任与安全问题探析
区块链的类型包括公有链、联盟链、私有链,公有链的参与者是任何人或组织,联盟链的参与者仅是联盟成员,私有链是联盟链的特例,即联盟链中只有一个成员。检察机关可以根据自身需求选择相应的区块链类型。
(一)构建数字检察数据共享联盟链
联盟链常用于身份相互熟悉的单位或组织,一般具有身份认证和权限管理功能,区块链节点数量确定,数据在联盟成员间开放,非联盟成员无法访问,并可以将不同领域的数据进行区分和隔离。检察机关开展数字检察工作,从其他单位获取数据符合构建联盟链的条件,检察机关可共享其他单位的数据,其他单位间不能相互共享,共享时必须经过严格的身份认证和权限管理。因此,可基于工作需求构建数字检察数据共享联盟链。以检察机关共享公安机关的数据为例,检察机关、公安机关、审判机关、行政部门1、行政部门2、行政部门3等可以组建联盟链。
检察机关需要公安机关数据时,由公安机关将数据共享到区块链中,包括原始数据的散列值,同时将此次共享的信息同步到区块链上其他参与方的账本中,检察机关获取数据记录也会同步到各方账本中。制定相关权限等级,除了检察机关外,其他单位不能查看账本信息,其他机关仅知晓数据是否被修改,且仅有公安机关有权对数据进行修改,修改时同时更新原始数据的散列值。通过以上方式可以保证数据难以被随意篡改,以及公安机关共享、修改数据记录,检察机关获取数据记录可以全部被跟踪,能够抵御数据丢失或者恶意攻击造成的威胁,并通过散列值确保数据的原始性。通过以上方式确保海量数据的安全以及接口数据对接的一致性。检察机关及其他单位共享数据时,可根据设定的权限进行共享,过程与公安机关向检察机关共享数据类似。
(二)构建模型规则和线索管理私有链
私有链不对外开放,仅仅在组织内部使用,一般不对外开放,具有完备的权限管理体系,并要求使用者提供身份认证,用户的数量和节点状态都是确定的、可控的,没有用户可以很容易地篡改数据和信息,强行篡改也行根据账本找到嫌疑用户。检察机关构建大数据法律监督模型的规则和线索管理仅在单位内部完成,因此可以使用私有链来确保信任和安全。
模型规则设计完成之后,由规则管理员上传至区块链中,模型获取数据后运行时,调用区块链上的模型规则,模型推送的线索自动上传至区块链,检察官从区块链上获取线索。以上整个过程是通过智能合约执行的,通过程序代码的方式实现既定的业务规则逻辑,由规则设计员、规则管理员、检察官等共同参与智能合约的制定和维护,一旦部署自动执行。按照智能合约,模型规则的优化与变更均会导致线索的更新。模型规则的优化与变更、线索获取记录均在各参与方的账本中维护。
以上方式有四个优势。一方面,利用区块链技术的容错机制、不可篡改性等为监督模型规则设计和线索管理提供安全支撑,提升大数据法律监督模型推送线索的协同效率,降低信任和协同成本。另一方面,多方参与人员均有严格的权限划分,即便运维人员和科技公司研发人员也不能随意更改模型规则和获取线索,即便操作也能通过账本发现。还一方面,利用区块链智能合约的自动执行,可降低对模型构建和应用流程性的人为干扰,降低风险。再一方面,整个过程全程留痕,确保模型推送的线索经得起各方的检验,尤其是被监督单位。
(三)利用区块链融合与监督联盟链和私有链
数字检察数据共享联盟链维护的数据,模型规则和线索管理私有链维护的是规则和线索,两个链之间具有强关联性,可以也通过区块链的方式融合联盟链和私有链。模型的框架建于区块链上,并通过接口的方式访问联盟链和接入私有链,接口作为联盟量和私有链的区块存在。例如,模型需要联盟链中的某些数据,就通过接口的形式获取区块数据,不进行本地存储,然后通过接口的形式调用私有链的规则,模型基于数据和规则运行之后,将推出的线索推送至私有链中,如下图所示。整个过程也是基于智能合约自动执行的,所有操作记录既保存在联盟链或私有链的账本中,也都保存在自身区块链的账本中。通过区块链融合区块链的方式,确保系统、信息、数据对接的各个环节均不可篡改,并可溯源,还可实现数据的一致性。
同时,利用区块链实现对联盟链和私有链运行状态的监管,从事前(模型框架内嵌区块链的处理逻辑中)、事中(智能合约)、事后进行全面监管(账本记录),提高监管效率和监管的有效性。
四、总结
数字检察在快速推进与发展过程中,数据信任与安全问题亟需引起重视,区块链技术已用于经济社会各个场景,为解决数据问题提供了很好的技术手段,本文结合区块链的特点和核心技术、数字检察战略,分析数字检察中数据信任与安全的风险问题,探索提出用区块链技术解决数据问题的实施路径,旨在为更好促进数字检察发展夯实安全基础。
责任编辑:广汉


暂无评论