请升级浏览器版本

你正在使用旧版本浏览器。请升级浏览器以获得更好的体验。

吉林大学司法数据应用研究中心
研究成果 reseach
您现在的位置: 首页 > 前沿资讯 > 正文

  • 《最高人民法院关于规范和加强人工智能司法应用的意见》全文(中英文版)
    《最高人民法院关于规...

    《最高人民法院关于规范和加强人工智能司法应用的意见》全文(中英文版)文章来源:最高人民法院官网法发〔2022〕33号最高人民法院关于规范和加强人工智...

  • 中心主任蔡立东教授一行赴内蒙古自治区高级人民法院调研
    中心主任蔡立东教授一...

    中心主任蔡立东教授一行赴内蒙古自治区高级人民法院调研 8月1日上午,吉林大学司法数据应用研究中心主任蔡立东教授、侯德斌副教授、中心秘书郝乐一行三人...

  • 蔡立东教授组织学生召开线上疫情防控交流会
    蔡立东教授组织学生召...

    蔡立东教授组织学生召开线上疫情防控交流会 2022年3月13日晚6点,蔡立东教授组织学生召开线上疫情防控交流会,李晓倩副教授、姜楠副教授、龚浩川老师、齐...

  • 中心获批吉林省高校哲学社会科学实验室!
    中心获批吉林省高校哲...

    中心获批吉林省高校哲学社会科学实验室2022 年2月11日,吉林省教育厅发布了《关于公布首批吉林省高校哲学社会科学实验室名单的通知》,通过自主申报、专...

  • 吉林省委常委、省委政法委书记范锐平到吉林大学调研  对中心法律人工智能实验室未来发展作出重要指示
    吉林省委常委、省委政...

    文章来源:吉林大学官网        原文标题:吉林省委常委、省委政法委书记范锐平到吉林大学调研 作者:记者 张宏伟 郭倩君      编辑:陈钊     摄影: 记...

  • 中心正式成为吉林大学哲学社会科学重点实验室B类试点实验室
    中心正式成为吉林大学...

    2021年8月,经机构申报、学院推荐、学校专家组评审,中心正式成为吉林大学哲学社会科学重点实验室B类试点实验室。

  • 中心主任蔡立东教授受邀参加 2021中国网络诚信大会
    中心主任蔡立东教授受...

    7月15日,2021年中国网络诚信大会·网络诚信法治建设论坛在湖南长沙举办。论坛由国家互联网信息办公室网络法治局主办,中国法学会网络与信息法学研究会承...

司法数据应用研究

发布时间:2017/12/22 前沿资讯 浏览:

司法数据应用研究

——以吉林省法院司法数据应用为样本

来源:吉大司法数据                                                                                           作者:王淑媛


一、司法数据概述

对于“什么是司法数据”,法律界并没有统一明确的说法。借鉴维克托关于大数据的认识,本文将司法数据归纳为:司法数据是指应用新的处理模式,快速对司法相关信息进行捕捉、管理、处理而形成具有全面、准确、前瞻、科学的分析判断能力的、洞察优化能力的数据集合。

一般来说,数据大体具有时效性、概率性、再创性与分散性的特征。“大数据”时代赋予了数据新的特征,其可以具体总结为“4个V”:Volume(数据量大),Velocity(数据产生速度高),Variety(数据多样性)和Value(数据是有价值的)。而司法数据,除了拥有一般数据所共有的特性以外,还具有真实性、公正性、可处理性、持续性等特质。

大数据环境下,为了实现对司法数据的分类整理,需要以审判实践为基础对司法数据进行有效的分类:

1. 审判数据和管理数据

审判数据包括证据材料、庭审笔录、法律文书、合议笔录、审理报告等存在于审判卷宗当中的数据,这些数据是审判过程的鲜活体现,更是研究个案的基础。此类数据因审判的进程而形成,不存在修改和编辑的可能性。其存在于数据库中,可为使用者直接调取,故亦可称为直接数据。

管理数据包括审判流程管理、司法数据分析等在案件卷宗之外,对于某个案件、某类案件、某个地区案件或某一时段案件的审理情况。此类数据需要对直接数据所涵盖的信息按照不同的目的进行收集整理,故亦可称为间接数据。

2. 公开数据、有限公开数据与非公开数据

公开数据主要是指裁判文书等依法必须向社会公开的数据。其公开方式既包括裁判行为的公开,也包括裁判文书通过互联网数据化的公开。

有限公开数据是指仅对部分主体公开的数据或仅针对特定目的而公开的数据。其中,证据材料、庭审笔录等数据仅向涉案的相关主体和审判机关公开,而并非向全社会公开,部分审判管理和司法数据出于不同的需要,可以有针对性的向社会公开,而并非审判机关负有将其无条件全部公开的义务。

非公开数据指不得向社会公开甚至向当事人公开的数据。其中包括涉及个人隐私、商业秘密等信息的证据材料、庭审笔录等数据,也包括合议笔录、审理报告、关注案件等个案审判过程中形成的涉及审判秘密的数据。

3. 前台数据和后台数据

前台数据系指对案件和审判情况客观表述的数据。包括证据材料、庭审笔录、法律文书、审判管理、司法数据等数据。

后台数据系指审判人员的知识结构、审判组织的年龄结构、审判人员的个人信息等司法人事数据,以及法院内部管理运行过程中形成的行政管理、财务管理、装备管理等司法政务数据。这些数据游离于个案和审判管理工作之外,但却对审判工作具有一定影响的因素所指向的数据。

4. 结构化数据、半结构化数据和非结构化数据

结构化数据系指通常使用的审判执行、司法人事、司法政务、外部数据等数据库数据,目前约占据数据总量20%左右。半结构化数据系指文书、法规、网站、案例等以文本方式存储的类型数据。非结构化数据系指音视频数据、各类图片、档案扫描件和各类文档数据。



司法数据经过科学的整理分类,通过对项目指标和类别进行的量化处理,最终形成全面反映审判工作总体情况的司法资源信息库,可以有效实行司法工作的统计监督、为立法活动提供参考和依据、提供司法理论研究的前提、服务于领导决策、实现科学化的审判管理、保证司法平衡。司法数据及其应用发展历经了从传统到现代、从零散到系统、从手工到智能的积累过程。该过程不但体现出了从注重单纯数字统计向注重趋势分析的转变,而且显示出从发挥简单的信息留存作用到服务于司法决策的转变。传统司法数据主要是指司法统计所采集的司法数据,可归纳为通过手工记录、定期搜集、人工整理、适度分析的司法数据。自1982年至今,人民法院司法统计工作先后使用了6套制式报表,实现了对于司法数据信息容量的扩充。最初1982年版的6张式报表仅能包含4557个信息项,而当前所采用的报表,其信息项较最初制式报表增长了16倍。这一阶段的司法数据应用研究是以数量表现、数量界限反映人民法院审判工作、法律实施情况和社会矛盾状况的调查研究。它主要是为了帮助上级法院提供数据分析依据,特别是帮助最高人民法院做出科学决策,理解审判规律,完善司法政策和司法解释,更好地使法院作为一个整体参与社会治理。

undefined


 


现代司法数据可归纳为通过自动导入、实时搜集、计算机整理、智能分析、科学预测的司法数据。现代司法数据应用研究除了反映人民法院审判工作、法律实施情况和社会矛盾状况外,更多地是预测趋势、辅助决策、服务人民群众。现在的信息技术可以使各级法院自主地搜集和处理各类信息,依据本地情况以需求为导向进行数据分析,发现具有地方意义的数据关联性,从而可以更加深入地在微观尺度上理解审判规律,以数据形式展示审判活动同地区具体问题的内在联系。

二、司法数据应用的方向考察

(一)司法数据应用于审判程序

随着我国经济日新月异的快速发展,市场主体交易的日趋繁多,立案登记制改革后,民商事案件数量大幅增长。某些民事案件,比如医疗纠纷、劳动争议、执行异议等案件,当事人之间矛盾争议较大,法院处理案件中也会感到有难度、有压力。个别的案件,上、下级法院间处理意见也不一致,而越是这样的案件,越需要我们深入研究,统一法律适用和司法尺度。

根据涉案数量和审理难度,吉林省法院确定了15个民商事纠纷案件司法数据应用研究课题项目:民间借贷、离婚纠纷、动产买卖合同、机动车事故责任纠纷、劳动争议、房屋买卖、农村土地承包经营权、医疗损害责任、股权转让、担保合同、民事检察监督、建设工程施工合同、知识产权、消费者权益保护、执行异议之诉。经过对司法数据的分析和调研,总结出全省法院民商事类型案件审判实践中存在的普遍性、突出性问题,集体讨论,分析原因,并请最高人民法院、吉林大学法学院等相关领域专家指导,提出解决措施,从而在吉林省范围内统一民商事类型案件的法律适用标准,确保执法尺度的统一,提高法院司法公信力。

(二)司法数据应用于执行程序

执行难一直备受社会关注。其中被执行人财产难寻是执行难的重要原因。吉林省法院利用司法数据共享,与全国20多家银行,以及省内对应银行通过专线连接,实现对当事人银行存款的查询、冻结和执行。与此同时,利用此种共享方式陆续与工商、房产、车管、税务等协助执行单位进行数据联网,实现对被执行人的不动产、税票、合同等真实性的查控,改变过去法官奔波各地的财产查控方式。

(三)司法数据应用于精细化管理

司法数据能够客观、公正评价法官的审判绩效,全面提升审判质量、审判效率和法官的司法能力。吉林省法院依据审判权力运行机制、法官的职责权限,建立符合审判规律的绩效考评机制,对法官的办案数量、审判质效、司法技能等做出客观公正评价,切实发挥审判绩效考评的“指挥棒”作用,正向激励引导法官多办案、办好案。

undefined


(四)司法数据应用于社会公开新时期,随着全面深入推进依法治国的治国方略,人民群众的司法需求也日益多元化、精细化,呈现出了“量加质增”的发展趋势。可以说,任何程序瑕疵和回应迟延,都可能造成社会公众对于司法公信力的质疑和猜测。在司法资源有限的情况下,通过逐步推进共享司法数据,既能提高司法数据的使用效率,又能更好地为社会公众服务,而且还能通过整合资源,提高司法公信力,实现“让人民群众在每一个司法案件中都感受到公平正义”。2014年吉林省法院建立了司法公开网,向社会公众公开审务信息、裁判文书信息和执行信息,同时为诉讼参与人提供审判流程的查询服务。(五)司法数据应用于科学决策吉林省法院通过长期积累的司法数据建立标准化、专业化的司法审判资源库,在此基础上利用大数据分析技术,对现有的海量数据进行科学分析,为司法改革、重大案件、行政管理、人事变动、社会治理等司法决策服务。吉林省作为首批司法改革试点的地区之一,结合法院审级职能、受理案件数据量、法官办案量等指标,合理规划员额比例,并通过每季度对全省司法数据的分析,发布审判运行态势报告,跟踪员额制度运行情况,均衡办案任务。吉林省法院还利用司法数据预测受理案件趋势特点,调配办案资源,积极应对司法改革过渡期,缓解法院案多人少的矛盾。


(六)司法数据应用于电子诉讼

为了满足信息化发展的必然走向,为合理、合法的电子诉讼建设提供支持,吉林省法院积极与吉林大学法学院合作,根据“电子法院”建设特点,并参考域外电子诉讼实践经验,探讨“电子法院”的运行标准与范式,力争电子诉讼规范化发展。

三、司法数据应用的现实问题

(一)管理责任不明

在法院,司法数据管理一直奉行的是科层式的管理模式,其特征就是工作任务布置与完成上存在明显的结构性。一方面传递效率不高,另一方面缺少检验工作的标准和追责机制。因此,司法数据的采集和分析,相当一部分就是应景之作,质量无从谈起,更谈不上应用和推广。

(二)隐私保护不足

我国三大诉讼法均规定了涉及国家秘密、商业机密和个人隐私的案件不公开开庭审理。然而由于制度上的缺位,此类案件在司法数据采集、分析、利用过程中存在公开或者泄露等情况,对个人权益、国家利益造成了威胁和损害。

(三)数据质量不高

目前,司法数据普遍采取手工填报,再利用信息技术进行采集和分析。填报人员的专业素质、基础数据的详实程度、数据采集分类是否科学等因素直接影响司法数据的质量。从吉林省法院的司法数据实践来看,尚缺少一支高素质的填报人员队伍,手工翻检与电脑统计数字差距较大,数据采集分类的平台软件也有待完善。

(四)数据共享性差

经过多年信息化发展,法院已经开发了很多用于采集司法数据的信息系统和数据库系统,以吉林省案件为例,自2000年至2016年6月30日积累了316625件案件信息,105584件电子诉讼案件信息,176961份文书,50572件庭审录像,1224944件电子卷宗,721件信访信息,5006份法官等级信息,形成了二十几套司法数据资源信息库。这些基础数据产生于不同时期的信息采集系统,众多因素的制约,导致数据存储分散、司法数据冗余。各业务部门也未形成通用的标准和规范,不能提供统一的数据接口,数据之间无法共享,不同的应用系统之间形成彼此隔离的数据孤岛。

(五)应用能力不足

目前司法数据的应用更多的是反映司法工作过往规律,与大数据应用的要求存在差距。传统司法数据应用亟待转型,迫切需要向预测发展趋势转变。

(六)公开程度不够

司法公开是司法公信力的保障。司法数据是司法公开的应然范畴。目前我国的司法公开机制,暂时以强调裁判文书公开为主,对于司法数据公开的重视程度不够。法院系统有关司法数据的公开主要集中在法院年度报告的公开中,公开的内容也局限于数字的简单罗列或比例的增减,缺乏针对性问题的提出和具体原因分析。

四、司法数据应用的改善对策

(一)建设强有力的信息平台

法院能否用好数据,信息技术平台基础非常关键。信息技术需要和法院审判流程的完善共同演进。信息技术平台的建立必须以需求为导向,否则有缺陷的信息技术平台就会成为法院开展司法数据应用的障碍,信息平台中所采集的数据也无法为司法管理提供数据支持。针对目前吉林省法院业务工作需要,结合信息化发展程度,将法院业务应用系统分为审判业务、审判支持、司法辅助和司法公开四大平台,并根据数据采集需要设置相应的信息项目,按照规制为司法数据应用提高精准的数据源。

undefined

(二)建立司法数据应用组织建立专门的司法数据应用委员会,对于司法数据的应用建章建制,明确应用委员会组织结构、分工责任和司法机关使用司法数据的范围和要求。尤其是应该注重建立对隐私保护的管理制度,设置好数据库管理权限、隐私安全管理权限以及审计权限三个权限。保证三个权限相互独立、互不重叠,互不越权,且相互制衡。其中,数据库管理权限应设置成BI分析系统数据仓库、数据集市的维护和管理,数据库设计方案及规划的权限。数据库管理权虽然能够获取所有的数据但无法获取隐私信息保护的策略和密钥信息。隐私安全管理权限应设置成获取隐私信息属性,管理和配置去隐私处理的策略和密钥信息的权限。隐私安全管理权限虽然掌握所有区隐私处理使用的策略和密钥,但没有访问任何主数据库的权限,无法获取隐私信息。审计权限应设置成对数据库管理权限和隐私安全管理权限的审计权,一旦发现违规的行为可及时通告司法数据应用委员会和升级处理。(三)识别司法数据隐私


在对司法数据进行应用时,应识别司法数据隐私,判断哪些数据对外提供详细数据查询服务,哪些数据对外提供汇总数据查询,哪些数据对外提供加工后的咨询报告等。其一,要靠制度落实,司法机关应加强相关制度机制建设,根据新时期法院工作要求,研究制定新的制度、规定,防止司法数据被滥用,切实保护公民隐私。其二,要运用各种大数据、云计算、虚拟存储等现代技术在信息处理和信息存储方面的独特优势,彻底堵住数据造假和泄密的漏洞,让数据造假和数据泄露无缝可钻、无机可乘。其三,对于泄露公民隐私的个人和有关单位要建立惩罚机制。其四,要加强司法公开与监督,充分发挥各方面监督的力量,使监督无处不在,无时不在。其五,要建立健全问责机制,定期对涉密部门、涉密信息进行检查,做到有令行之,有禁止之,有责担之。

(四)提高司法数据质量

通常衡量数据质量的六大标准为:有没有、准不准、细不细、全不全、稳不稳、快不快。司法数据也同样适用于这六大标准,缺少一个司法数据的质量就会下降。这就需要可靠的数据共享单位和技术支持部门进行配合,提供数据、算法、服务。

(五)强化数据整合共享

司法数据的整合不仅仅是解决数据的互通问题,更需要从全局的角度来进行规划和设计,主要包括主数据整合、司法数据应用流程管理整合和司法数据生命周期管理。

(六)加强数据分析利用

司法数据的变现除了强化内部利用外,还应该积极探索借助“外力”,加强数据分析利用。例如,吉林省法院与吉林大学携手成立的“吉林大学司法数据应用研究中心”,就是借助“外力”的典型,通过引进科研机构的力量,充分挖掘审判业务资源和海量司法数据,分析司法活动中体现的普遍性、规律性问题,形成研究成果,以供司法决策参考。

(七)建立资产管理体系

司法数据资产管理体系的核心在于有效解决资产管理的实践性问题,既能帮助司法部门合理评估、规范和治理司法信息资产,又可以挖掘和发挥数据资产价值并促进持续增值。

(八)建立应用评估体系

对法院各部门司法数据的应用情况建立司法数据应用评估体系,为司法数据应用奖惩机制提供决策支撑,形成数据采集、更新、应用、考核的良性循环。