如何让大数据资源池发挥显著功效

日期:09-27

2013年以来,全国四级检察机关上线运行检察业务应用系统,实现了检察业务数据化。经过多年沉淀和扩容,检察系统已经积累了大量检察业务数据,形成了可进一步利用的数据资源池。如何激活这“一池春水”助推检察工作高质量发展?作为检察业务工作中枢和业务数据监督管理专责部门的案件管理部门责无旁贷。笔者从宁夏回族自治区检察机关业务数据资源化实践入手,浅谈对业务数据资源化的理解和把握。

业务数据为什么要实现资源化

“数化万物,万物皆数”已是当今数字时代的重要特征,每一个组织和每一个个体都是一个“实时数据库”,每时每刻都在产生各类数据。如果这些数据能够被有效收集、汇总、加工、利用,其产生的生产价值、社会价值将是巨大的。这也是国家层面将数据与土地、劳动力、资本、技术一起并列为生产要素的重要原因。为有效应对数字时代的新机遇、新挑战,国家已经从立法、制度机制等方面进行了顶层设计。检察机关自检察业务应用系统上线以来,已实现个案线上办理,沉淀了大量个案数据,但这些个案数据汇总形成的大数据资源池并没有得到充分利用,也没有发挥应有的价值,主要原因在于内部数据耦合性强、缺乏外部数据支撑、数据应用创新不够。为解决以上三个问题,需要对业务数据进行资源化处理。

什么是业务数据资源化

检察业务数据来自于检察业务工作,最终又要服务于检察业务工作,即业务生产数据、数据反哺业务。要实现这一目的,需将业务数据改造成为可以被进一步利用的生产要素,这个过程称之为业务数据资源化。业务数据资源化主要包括数据结构重构、数据多源重组和数据业务重塑三个方面。

一是数据结构重构。检察业务应用系统是以案件为中心进行业务数据设计的,案件数据的耦合性强、关联度高、逻辑性强,这种设计模式对于单个案件的办理是合适的。但在大数据应用中,需要以涉案人员为中心进行业务数据结构设计,现有数据结构便不能很好地满足实际需要,需要对现有数据结构解构后再重构,才能进一步使用。具体是以涉案人员的唯一编码为主标识,建立涉案人标识、涉案人标签(属性)和涉案人案件三个模块。为适应外部数据重组需要,建立涉案人模块,包括主标识(身份证号)及其他关联标识(手机号、社交账号等);为进一步记录涉案人信息,建立涉案人标签(属性)模块,包括涉案人的个人基本信息(年龄、性别、职业、学历等)及其他相关标签(是否是未成年人等);为关联涉案人案件信息,建立涉案人案件模块,包括案件基本信息、案件办理信息等。

二是数据多源重组。大数据应用的价值在于通过多源数据之间的比对碰撞分析,发现规律或者异常,但由于研发单位不同,多源数据在数据标准、数据结构、存储方式等方面是不统一的。为此,需对多源数据进行重新组合。具体可建立多源数据元数据库(元数据本质上即为构造数据库的基础信息,以此为基础可建立同样结构的数据库)、多源数据资源目录数据库、多源数据原始数据库三个数据库。为实现多源数据库逻辑结构识别,需要建立多源数据元数据库;为验证多源数据库的完整性、一致性,需要建立多源数据资源目录数据库;为保存原始多源数据,需建立多源数据原始数据库。

三是数据业务重塑。最高检提出要大力实施数字检察战略,破解检察机关法律监督职能作用发挥还不够充分这一核心问题。大数据法律监督工作是数字检察的一个重要突破口,就是要充分利用内外部数据实现对检察机关法律监督工作的系统性重塑,实现从个案办理到类案监督再到系统治理的新型业务模式。一线办案检察官要破除过去个案办理的思维定式,要敏于从个案办理中发现大数据法律监督规则,善于总结提炼形成大数据法律监督模型,精准发现类案监督线索,将被动式监督变为主动式监督,实现监督理念、手段、方式、成效的系统性重塑。

业务数据资源化如何展开

以宁夏为例,今年以来,宁夏回族自治区检察机关大力推动数字检察战略实施,出台《宁夏检察机关大数据赋能新时代法律监督实施方案》,明确推进数字检察战略实施的路线图、时间表;修订《宁夏回族自治区人民检察院对各市级人民检察院检察业务工作考评办法(2023年度)》,将数字检察工作列为考评范围并加大考评分值;举办全区检察机关大数据法律监督模型竞赛。其中,银川市检察院建设的大数据法律监督平台,优化重组检察业务结构化数据,识别并整合公安、法院的非结构化数据(不能直接用现有关系型数据库存储并处理的数据),创新法律监督方式,通过将公安、检察院和法院制发的刑事案件起诉意见书、起诉书、判决书进行“三书比对”,发现监督线索439份、成案36件。具体做法是对公安、检察院、法院的纸质起诉意见书、起诉书、判决书进行OCR识别、按照预先设定的数据标准自动存储,建立刑事案件“三书”数据库。在此基础上,建立刑事案件“三书”数据库之间的关联关系,并与检察业务应用系统中结构化数据建立关联关系,进而建立大数据法律监督模型,开展类案监督和系统治理工作。

下一步,宁夏回族自治区检察院将聚焦建设集数据治理、数据返还、模型管理、线索管理于一体的大数据法律监督管理平台,不断提升业务数据治理能力,完善数据安全保障体系,助推全区检察机关法律监督工作实现系统性重塑。

(作者为宁夏回族自治区人民检察院案件管理办公室副主任)

[版面编辑:李娜见习编辑:高航]

“鹰眼”确保每一秒监控都在眼前 女子摔椅大闹家长会,山西吕梁教育局回应