中文 English

您当前所在位置:首页 > 新闻资讯

新闻资讯

新闻|实验室主任王竹教授接受《民主与法制时报》采访,用大数据分析法条案由 《法律大数据·案由法条关联丛书》

时间:2017-11-30


image.png


该《丛书》主要面向律师、法官、检察官和法学研究者等专业人士。它的数据来源、编写方式、使用方法等,都与传统法条书有本质区别。每本书主要分为三编。

  

本社记者 任文岱

 

作为《法律大数据·案由法条关联丛书》(简称《丛书》)的第三本书,《物权纠纷》于2017年9月出版。此前,该系列《丛书》已经出版了《侵权责任纠纷与人格权纠纷》《婚姻家庭继承纠纷》两册。

在《侵权责任纠纷与人格权纠纷》一书的书评中,法律实务界一位读者评价称,该书与之前买的很多书不一样,它“首先着手点不一样,里面的法条都是人民法院审判用到过的法条。这对办案简直是‘神器’。其次,通过案由检索法条,再通过法条检索可以查找适用法条,比用关键词搜索法条更精准”。

《丛书》主编,四川大学法学院教授、博士生导师王竹对民主与法制社记者表示,该《丛书》主要面向律师、法官、检察官和法学研究者等专业人士,通过法律大数据,以较简洁的五颗星标记,为法律共同体展示司法实务中案由与法条之间、法条与法条之间的实际关联情况,为法律人检索法律适用提供依托司法实务的新思路和新方法。

十年磨一剑

 

王竹说,他对法条类书籍的编写,从10年前攻读博士时开始。在编写法条类书籍的过程中,他发现此类书籍原有编写方式存在致命缺陷。

据王竹介绍,市面上大多数法条类书目,包括他自己之前编写的法条书籍,在形式上大多是将法律条文列出,然后列出与某一法律条文相关的条文,如有需要,还根据编者的理解撰写一定的说明。

“这种编写方式中,法条之间的关联是基于编写者的主观认识,存在风险。比如,法条之间的联系是基于编写者个人的判断,或许符合学术观点和立法规划,但在司法实务中可能并非如此。或者,部分法条之间客观上存在明显的或者潜在的矛盾,但编写者只能全部列出,难以确定到底哪些法条才是实务中实际适用的。”王竹说。

随后,王竹找到了突破口。2008年至2009年,王竹在美国康奈尔大学法学院和耶鲁大学法学院完成博士论文期间惊讶地发现,英美判例报告的公开性、延续性、实用性,加上Westlaw和LexisNexis的数字化处理方式,与成文法有异曲同工之妙。

“实际上,不管我国台湾地区,还是我长期访学过的美国和英国,不少学者都深度参与编写法条书、经典案例集或建设法律、案例数据库。学者的这种参与,对司法实务有非常强的促进作用,也是跟进司法实务的绝佳方式。”王竹说,“但对法律条文的研究和阐释,如果不能与司法判例结合起来,就只可能沦落为法律人的纯粹想象而丧失其实用性。”

2014年初,最高人民法院正式开通“中国裁判文书网”,在网上公布裁判文书。同时,四川大学法学院法律大数据实验室开始酝酿,于2016年挂牌成立,并与成都星云律例科技有限责任公司创办的“法合实验室”建立了战略合作关系。《丛书》也在“用大数据说法”的思路指导下应运而生。

基于实务需求进行编排

 

“用大数据说法”是“法律大数据实验室”的宗旨。王竹认为,“法律+大数据分析”是未来法学研究的重要发展方向。

据了解,这套《丛书》是四川大学法学院法律大数据实验室与北京大学出版社共同策划的“法律大数据丛书”的第一个系列。《丛书》首先由“法合实验室”利用大数据分析技术对“中国裁判文书网”公布的超过3000万份裁判文书进行分析,提供基础数据支持。然后由“法律大数据实验室”组织司法实务和学术研究领域的法律专业人士进行分析,再与“法律+大数据分析” 的理念完美结合。

王竹介绍,《丛书》从数据来源、编写方式到使用方法,都与传统的法条书有着本质的区别,从实务需求出发,采用了特殊的编排方式。每本书主要分为“案由相关法条索引”“核心法律的条文主要适用案由、同时适用法条索引”“本书关联法条全文”三编。

“比如,每分册第一编‘案由相关法条索引’按照案由顺序展开,每个案由再分为‘主要适用的法条及其相关度’和‘常见适用的其他法条’两部分。其中,‘主要适用的法条及其相关度’部分,分析对象是依法可以在裁判文书中作为裁判依据引用的全国性、实体性的法律、法规和司法解释等法律规范性文件。同时,我们会根据在超过3000万份裁判文书中实际引用的情况和法律专业人士的经验判断,将法条权重标记为五星到一星。”王竹说。

此外,为方便查阅,“法律大数据实验室”与“法合实验室”共同设计了“法合码”,包括“法合索引码”与“法合二维码”两部分。在全部案由和每部法律规范性文件标题旁边均附有由“法合二维码”及其对应的“法合索引码”组成的完整“法合码”。用户可以根据需要直接扫描“法合二维码”获得查看详细内容和更新信息。

助推司法实务

 

王竹表示,在运用大数据分析法条案由的编写过程中,数据的清洗给编写团队带来了一定困难。

“一方面是立案案由,另一方面是裁判依据。大量裁判文书书写不规范,以《中华人民共和国合同法》这10个字为例,在3000多万份裁判文书中,竟然有超过300种不同的写法。有的是明显笔误,可以进行纠正,如《中共人民共和国合同法》;有的则无法判断,如《中华人民共和国合同物权法》;有的引用了不存在的条文号,例如《民法通则》第256条。”王竹说。

王竹发现,除此之外,还存在“套改”判决书的情况,即以一份判决书为基础,修改为新的一份判决书;还有不少判决书存在错误引用法条的情况,尤其以错误引用《民法通则》第109条为甚。错误引用该法条的判决书数量竟然超过正确引用《民法通则》第109条及其相关条款判决书总数量的三倍。

王竹认为。对各级、各地方法院在法官自由裁量权基础之上的判决差异,进行数据分析很有意义。他表示,某种意义上,中国的司法实务存在“司法联邦”现象,即以各省、自治区、直辖市为单位,在同一高级人民法院之下的中级和基层法院,在裁判尺度上相对统一,在高级人民法院之间可能存在一定差异。

“当然,《丛书》以最高人民法院公布的判决书的数据量为基础进行大数据分析,个体性差异的影响就显得微乎其微。我们在积累足够数据量后,可以通过数据库的方式进行差异化分析。因此,对这种存在不同裁判尺度的差异化数据进行分析,也很有意义。”王竹说。

据了解,本套《丛书》计划分三批出版。第一批是《侵权责任纠纷与人格权纠纷》《婚姻家庭继承纠纷》《物权纠纷》和《合同和无因管理、不当得利纠纷》。这四本书对应的是未来《民法典》的分则部分;第二批涉及民商法中的劳动法、知识产权法和商法领域;第三批则是刑法和行政法司法的适用。

“近期我正在酝酿出版该套丛书的英文版,让全世界的法律人士都有机会通过这套法律大数据丛书了解中国的司法实务。”王竹说,“《丛书》除在精确地展示司法实务中不同案由和不同法律条文的实际适用情况,以及体现法律专业人士的经验判断外,还将持续跟进‘中国裁判文书网’公布案件的进度、司法实务及理论进展,基于最鲜活、权威的法律大数据,服务法律共同体,推动中国法治化进程。”