请升级浏览器版本

你正在使用旧版本浏览器。请升级浏览器以获得更好的体验。

吉林大学司法数据应用研究中心
研究成果 reseach
您现在的位置: 首页 > 前沿资讯 > 正文

  • 《最高人民法院关于规范和加强人工智能司法应用的意见》全文(中英文版)
    《最高人民法院关于规...

    《最高人民法院关于规范和加强人工智能司法应用的意见》全文(中英文版)文章来源:最高人民法院官网法发〔2022〕33号最高人民法院关于规范和加强人工智...

  • 中心主任蔡立东教授一行赴内蒙古自治区高级人民法院调研
    中心主任蔡立东教授一...

    中心主任蔡立东教授一行赴内蒙古自治区高级人民法院调研 8月1日上午,吉林大学司法数据应用研究中心主任蔡立东教授、侯德斌副教授、中心秘书郝乐一行三人...

  • 蔡立东教授组织学生召开线上疫情防控交流会
    蔡立东教授组织学生召...

    蔡立东教授组织学生召开线上疫情防控交流会 2022年3月13日晚6点,蔡立东教授组织学生召开线上疫情防控交流会,李晓倩副教授、姜楠副教授、龚浩川老师、齐...

  • 中心获批吉林省高校哲学社会科学实验室!
    中心获批吉林省高校哲...

    中心获批吉林省高校哲学社会科学实验室2022 年2月11日,吉林省教育厅发布了《关于公布首批吉林省高校哲学社会科学实验室名单的通知》,通过自主申报、专...

  • 吉林省委常委、省委政法委书记范锐平到吉林大学调研  对中心法律人工智能实验室未来发展作出重要指示
    吉林省委常委、省委政...

    文章来源:吉林大学官网        原文标题:吉林省委常委、省委政法委书记范锐平到吉林大学调研 作者:记者 张宏伟 郭倩君      编辑:陈钊     摄影: 记...

  • 中心正式成为吉林大学哲学社会科学重点实验室B类试点实验室
    中心正式成为吉林大学...

    2021年8月,经机构申报、学院推荐、学校专家组评审,中心正式成为吉林大学哲学社会科学重点实验室B类试点实验室。

  • 中心主任蔡立东教授受邀参加 2021中国网络诚信大会
    中心主任蔡立东教授受...

    7月15日,2021年中国网络诚信大会·网络诚信法治建设论坛在湖南长沙举办。论坛由国家互联网信息办公室网络法治局主办,中国法学会网络与信息法学研究会承...

刑事司法实证研究:以数据及其运用为中心的探讨

发布时间:2017/01/14 前沿资讯 浏览:

何挺

【摘要】 实证研究数据的核心内涵在于研究者基于自身经验的直接发现,其外延应基于这一核心内涵延展,而不受形式、载体等外在表现的过多限制。用数据进行测量是实证研究的基本观念,测量的实施需要经由概念化、操作化。刑事司法领域的测量具有自身的特点,如何在纷繁复杂的刑事司法实践中开展科学有效地直接测量,是实证研究的核心环节和难点。依据不同的标准将刑事司法实证研究涉及的数据划分为不同的类别,能够提供很多观察不同种类数据特征、优劣与运用规则的视角。刑事司法实证研究中数据的运用应当遵循寻求较佳数据、量力而行、组合运用以及不迷信数据的原则。我国刑事司法实证研究的数据运用亦存在多方面的问题值得反思。现阶段大数据尚未对刑事司法实证研究产生质的影响,但却能提供多方面的有益启示与思考。
一、实证研究中的数据
实证研究所依赖的数据,不仅指“进行各种统计、计算、科学研究或技术设计等所依据的数值”,而应做更为广义的理解。一项研究是否基于可以量化的数值并非判定其是否属于实证研究的关键,而是用于区分定量研究与定性研究的标准。实证研究强调的是获取数据的途径与研究者自身经验之间的密切程度,而非数据的形式。实证研究的独特价值,除了在“发现”的基础上进行逻辑推论,更重要的其实在于这种“发现”是研究者自身直接而非间接的发现。虽然强调实证研究数据的核心内涵是直接获取,但并不完全排斥间接获取数据的运用。
实证研究数据应当围绕上述核心内涵对外延进行充分地延展。研究者不应事先对一项实证研究可以运用的数据的形式、载体、来源等外在表现作过多地限制,而应该用最大的想象力来拓展其范围。研究者只应该按照两项标准来筛选可供运用的数据:一是某项研究的具体情境能够提供或者产生出哪些数据;二是某项具体研究需要哪些数据,或者说,某项研究所提出的问题或假设,需要哪些数据去回答或验证。
二、实证研究的基本观念:用数据进行测量
用数据进行测量,即在数据与拟回答的问题或拟验证的假设之间建立联接。科学研究中的测量,则是指对特定的研究对象进行有效地观测与量度,并在观测与量度的基础上描述研究对象。刑事司法实证研究中的测量具有很大的弹性和不确定性,并有自身的特点。如何在纷繁复杂的刑事司法实践中寻觅最为恰当且具有可操作性的测量标准,并采用相对较为科学的方法直接进行测量,是实证研究所独具的研究体验。
测量是一个将抽象的概念、理论与具体的实证数据相联接的过程,测量必须经历概念化与操作化两个步骤始能付诸实施。概念化,是指对抽象的概念进行清晰的界定与详述的过程。概念化的结果是使研究主题明确、清晰、丰满,并具有与经验事实及实证数据相联接的可能性。操作化的核心内容是确定测量的标准与具体方法。在刑事司法实证研究中,测量标准与测量方法实际上决定了研究成果的呈现形式和研究结论的依据,并进而决定了研究的结论。在受限于各种客观条件的情况下,如何在客观条件允许的范围内选择效度和信度相对更高的测量标准与方法,是刑事司法实证研究所必须面对和解决的问题。
三、刑事司法实证研究的数据分类
第一种分类是定量数据与定性数据。定量数据是定量研究所主要依据的数据,是基于一定规模或数量的研究对象而获得,以数字的形式呈现出来并可以进行统计分析的数据;定性数据则是定性研究所主要依据的数据,即以感受、文字和照片等形式呈现出来的对研究对象的性质、特征进行描述或概括的数据。两者的最大差别在于是否数值化及能否基于一定数量的样本进行量化分析。定性数据还可以借助内容分析法中的编码技术转化为定量数据。定量数据与定性数据本身并无高低之分,而是各具优势与缺陷,选用哪一种类数据完全取决于研究的需要和现实可操作性。一项理想的刑事司法实证研究应当综合运用定量数据与定性数据,集二者之所长。
第二种分类是主观性数据与客观性数据。主观性数据,指的是源自调查对象主观认识与判断的数据;客观性数据,则是指源自客观发生的现象、行为、状况等的数据。划分主观性数据和客观性数据的标准并不是数据描述的内容,而是数据的来源。主观性数据用于测量相关人员的主观认识,客观性数据则用于测量客观状况,不适当地使用甚至调换会明显降低测量的效度和研究的科学性。主观性和客观性数据的分类有时也会存在模糊的中间地带,基于特定的研究需要,还可以主动将客观性数据转化为主观性数据。
第三种分类是原生数据与新生数据。原生数据,即原本就会产生并以原始状态存在的数据,包括在刑事司法实证研究开展之前即已存在的数据,以及在实证研究期间未受实证研究影响而自行产生的数据;新生数据,指由于开展实证研究才新产生的数据。不同类型的研究对于原生数据与新生数据的倚重有所不同。划分原生数据与新生数据的目的主要在于凸显这两类数据与实证研究的匹配度上的差异。新生数据与实证研究对数据的要求具有较高甚至完全一致的匹配性。原生数据产生于研究设计之前,与实证研究的数据要求匹配性较差,规范性也相对较低,需要进行系统的筛选、分类、整理甚至技术处理之后才能运用,还可能存在原生数据缺失的情况。
第四种分类是关系主体数据和其他主体数据。关系主体数据,是指来源于与研究主题有利害关系的主体的数据。其他主体数据则是指来源于与研究主题没有利害关系主体的数据。关系主体数据通常覆盖面广且内容丰富,而且有很多研究必须要有来自关系主体的数据才能体现“经验性”。同时,关系主体在刑事司法中所具有的特定身份也会影响数据的真实性、客观性和中立性。其他主体数据的信息量较小,但同时其可靠性与中立性却相对较高。
第五种分类是一手数据与二手数据。一手数据即研究者为了某项研究所直接收集的新的数据。二手数据,则是指研究者所运用的其他研究者为了其他目而收集的数据。与二手数据所具有的“非直接性”这一“天生缺陷”伴生的则是其在收集、获取方面的便利性这一“天生优势”,二手数据在刑事司法实证研究的多个方面都有运用的价值。
第六种分类是真实数据与模拟数据。真实数据产生于真实的刑事司法情境和过程之中,模拟数据则源自为开展实证研究所人为模拟出来的情境。真实数据与实证研究所强调的“经验性”或“直接性”更为契合,但特定研究主题以模拟研究的方式收集模拟数据也是一种必要的替代。模拟数据的质量以及模拟研究中测量的效度,在很大程度上取决于模拟的情境与其所代表的真实情境之间的差距。
第七种分类是官方数据和研究者自行收集的数据。官方数据是一种二手数据,其优点在于覆盖的样本规模较大、内容全面、具有一定的权威性并且常常是公开的,方便研究者获取。在我国官方刑事司法数据薄弱的背景下,主要甚至完全建立在分析官方数据基础上的研究无疑在科学性上是存有问题的。
四、刑事司法实证研究数据运用的基本原则
一是寻求较佳数据原则。运用数据不能以获得最佳数据为目标,而应当在虑及各种客观制约因素的前提下,寻求“较佳”数据。以寻求较佳数据作为数据运用的一项基本原则,既可以避免脱离刑事司法实际“过度”追求完美无瑕的数据,也可以为研究者提供一项衡量实证研究科学性的务实标准。
二是量力而行原则。研究者走入真实的司法情境后,其开展实证研究的能力更多地受到研究者思考能力以外的其他因素的影响,包括研究经费、人手、时间及与实务机关的关系等。思量上述因素对研究能力的限制,量力而行地收集和运用数据,是数据运用需遵循的另一项原则。
三是组合运用数据原则。研究者应当以更宽广的视野和互补的思维看待可供收集与运用的数据,而不用执念于理论上某一类型的研究应当运用某一类型的数据。在大多数实证研究中,数据的组合运用应当成为一项原则。
四是不迷信数据原则。如果在分析和运用数据的过程中完全被数据所引导甚至误导,可能陷入迷信数据的泥潭之中。依靠数据但又不迷信数据,应该是对待数据的正确态度。
五、我国刑事司法实证研究数据运用的初步反思
我国刑事司法实证研究面临着较为逼仄的数据环境,这使实证研究中的数据运用处于一种先天不足的状态。在我国数据环境的很多方面短期内无法改变的情况下,更为重要的可能是如何在观念和技术层面提升数据收集与运用的科学性,以我国刑事司法实证研究数据运用的总体情况而言,下列问题值得反思与改进:
一是对于实证研究数据核心内涵的理解不准确,存在两种误区:一是从数据的形式进行界定,最常见的就是将定量数据等同于实证数据,并进一步将定量研究等同于实证研究;二是忽视研究者的自身经验对于实证研究的决定性作用。
二是测量的观念尚未确立,测量标准与测量方法未得到应有的关注。当前的迫切问题,并不在于测量标准的多元与不统一,而在于如何鼓励对相同或近似研究主题采用不同的测量标准与方法并进行争鸣与讨论,以及如何鼓励在研究成果中充分论证测量标准并说明测量方法的细节。
三是数据视野相对狭窄,运用的数据种类较为单一,组合运用数据的原则尚未确立。如何结合研究主题和司法环境的客观条件拓展运用的数据种类,并通过不同种类数据的组合运用提升研究结论的科学性是我国刑事司法实证研究在技术层面迫切需要解决的问题。
四是对某些种类数据的特点与运用规则的理解并不准确。例如,在一些单纯测量主观态度和评价的研究中不适当地引入了客观性数据,而在一些应当依据客观性数据的情形却又主要基于主观性数据得出结论。
五是缺乏对自身收集和运用数据方法的反思。只有建立在研究者对数据收集与运用方法的自我反思与学术共同体的共同反思基础之上,经由具体方法的科学化,我国刑事司法实证研究才能逐步走向成熟,并真正发挥其在推动理论发展和完善法律制度方面的独特功能。
六、大数据与刑事司法实证研究
真正主要运用大数据开展的刑事司法领域的专业研究尚不多见,在国内甚至可能尚付阙如。具体到刑事司法领域,如果现在就得出结论,认为大数据将极大地改变刑事司法研究的范式与方法为时尚早。即使放眼国际,真正运用大数据在这一领域开展研究也并不多见。大数据分析在刑事司法领域的扩展尚取决于三个前提条件的实现:一是刑事司法与犯罪领域所有过程与事件的量化与数据化;二是能够实现对这些数据化信息的实时收集与实时分析;三是建立公开和分享的机制,并使研究者有机会获得这些司法“大数据”。
虽然现阶段大数据尚不能对刑事司法实证研究产生质的影响,但仍可为我们现在所倡导的实证研究提供多方面的启示。首先,大数据思维同样体现了经验事实在研究中的决定性地位。其次,大数据思维为我们提供了一种更为宽广甚至没有边际的数据视野,来看待刑事司法领域中存在并可资研究运用的数据。再次,大数据思维还可能拓展实证研究中研究者直接获得数据的路径。最后,大数据分析中的个人信息保护还与实证研究伦理所要求的研究对象“自愿参与”、“匿名保密”及“有限欺骗”的原则相关,有待进一步研究。