《最高人民法院关于规范和加强人工智能司法应...

《最高人民法院关于规范和加强人工智能司法应用的意见》全文（中英文版）文章来源：最高人民法院官网法发〔2022〕33号最...
民事纠纷证据运用与裁判指引

民事纠纷证据运用与裁判指引本丛书共包含五本：《机动车交通事故责任纠纷：证据运用与裁判指引》《劳动纠纷：证据运用与...
中心主任蔡立东教授一行赴内蒙古自治区高级人...

中心主任蔡立东教授一行赴内蒙古自治区高级人民法院调研 8月1日上午，吉林大学司法数据应用研究中心主任蔡立东教授、侯德...
蔡立东教授组织学生召开线上疫情防控交流会

蔡立东教授组织学生召开线上疫情防控交流会 2022年3月13日晚6点，蔡立东教授组织学生召开线上疫情防控交流会，李晓倩副教...
中心获批吉林省高校哲学社会科学实验室！

中心获批吉林省高校哲学社会科学实验室2022 年2月11日，吉林省教育厅发布了《关于公布首批吉林省高校哲学社会科学实验室...

《最高人民法院关于规...
《最高人民法院关于规范和加强人工智能司法应用的意见》全文（中英文版）文章来源：最高人民法院官网法发〔2022〕33号最高人民法院关于规范和加强人工智...
中心主任蔡立东教授一...
中心主任蔡立东教授一行赴内蒙古自治区高级人民法院调研 8月1日上午，吉林大学司法数据应用研究中心主任蔡立东教授、侯德斌副教授、中心秘书郝乐一行三人...
蔡立东教授组织学生召...
蔡立东教授组织学生召开线上疫情防控交流会 2022年3月13日晚6点，蔡立东教授组织学生召开线上疫情防控交流会，李晓倩副教授、姜楠副教授、龚浩川老师、齐...
中心获批吉林省高校哲...
中心获批吉林省高校哲学社会科学实验室2022 年2月11日，吉林省教育厅发布了《关于公布首批吉林省高校哲学社会科学实验室名单的通知》，通过自主申报、专...
吉林省委常委、省委政...
文章来源：吉林大学官网原文标题：吉林省委常委、省委政法委书记范锐平到吉林大学调研作者：记者张宏伟郭倩君编辑：陈钊摄影：记...
中心正式成为吉林大学...
2021年8月，经机构申报、学院推荐、学校专家组评审，中心正式成为吉林大学哲学社会科学重点实验室B类试点实验室。
中心主任蔡立东教授受...
7月15日，2021年中国网络诚信大会·网络诚信法治建设论坛在湖南长沙举办。论坛由国家互联网信息办公室网络法治局主办，中国法学会网络与信息法学研究会承...

中国法院判决的大规模数字化：在中国法律领域如何使用数据文本

发布时间：2017/11/09 前沿资讯 浏览：

本文来源：吉大司法数据翻译：王怡聪

Mass Digitization of Chinese Court Decisions:

How to Use Text as Data in the Field of Chinese Law

Over the past five years, Chinese courts have placed tens of millions of court judgments online. We analyze the promise and pitfalls of using this remarkable new data source through the construction and examination of a dataset of 1,058,990 documents from Henan province. Courts posted judgments in roughly half of all cases in 2014 and, although the percent of cases posted online has likely risen since then, the single greatest challenge facing researchers remains documenting gaps in the data. We find that missing data varies widely by court, and that intermediate courts disclose significantly more documents than basic level courts. But court level, GDP per capita, population, and mediation rates are insufficient fully to explain variation in disclosure rates. Further work is needed to better understand how resources and incentives might be skewing the data. Despite incomplete information, however, a topic model of 20,321 administrative court judgments demonstrates how mass digitization of court decisions opens a new window into the practice of everyday law in China. Unsupervised machine learning combined with close reading of selected cases reveals surprising trends in administrative disputes as well as important research questions. Taken together, our findings suggest a need for humility and methodological pluralism among scholars seeking to use large-scale data from Chinese courts. The vast amount of incomplete data now available may frustrate attempts to find quick answers to existing questions, but the data excel at opening new pathways for research and at adding nuance to existing assumptions about the role of courts in Chinese society.

Keywords: Data; Law; Chinese Courts; Court Cases; Text as Data; Court Judgements

摘译

在过去的五年里，中国法院在网上公开了数千万份法院裁判。通过建立并检验河南省的1058,990份文件，我们分析了对于运用这一标志性新数据源的承诺，以及使用该数据源的缺陷。2014年，法院仅公开了大约一半的判决。尽管从那时起，网上公布的案件比例似乎在上升，但研究人员面临的最大挑战仍然是文件制作的漏洞。我们发现，未上传的数据在不同法庭间有很大差异（不同法院间对数据的隐瞒有很大差异），而中级法院披露的文件比基层法院要多得多。但是，法院层面、人均GDP、人口以及调解率并不足以解释信息披露率的差异。为了更好地理解资源和激励措施是如何影响数据，我们需要进一步的工作。然而，除了信息的不完整外，20321份以行政法院判决为内容的主题模型，显示了大规模数字化的法院判决为中国法律的日常实践打开了一扇新的窗口。无监督的机上学习以及近距离阅读经过选择的案例的密切结合，揭示了行政纠纷令人惊讶的趋势以及一些重要的研究问题。综合来看，我们的研究结果表明，寻求从中国法院获得大规模数据的学者需要更加谦逊的态度以及多元的方法论指导。目前可用的大量不完整的数据可能会阻碍人们对现有问题的快速回答，但这些数据在开辟新的研究途径方面表现得较为出色，并在向现有的关于法院在中国社会之角色的假设中添加细微差别方面也发挥着积极作用。

上一篇：“把手案例”之“检察文书”检索系统评测

下一篇：智慧法院建设：实施原则与制度支撑

相关推荐：

请升级浏览器版本

Chrome

Firefox

Opera

Edge

中国法院判决的大规模数字化：在中国法律领域如何使用数据文本