中文 English

您当前所在位置:首页 > 新闻资讯

新闻资讯

新闻|“法律大数据分析”课开讲了!带你了解数据思维和人工智能

时间:2018-07-09

2018年7月9日,“法律大数据”课程在四川大学江安校区正式行课。“法律大数据分析”是一门由四川大学计算机学院、数学学院、法学院联合开办的,旨在帮助同学们了解人工智能在法律中是如何应用的前沿课程。本门课程由来自数学学院的翁洋副教授、计算机学院的张意副教授、法学院的李鑫老师和法学院的王竹教授担任授课人,分布讲授机器学习、深度学习、人工智能司法应用和计算法概论等课程内容。课程开始后,王竹教授首先就课程内容、师资阵容、课程规划作介绍。


image.png


翁洋老师作为本课程的第一位主讲人向校内外同学展示了数据思维的应用和如何形成数据思维的方法。数据是近年来十分火热的话题。有关数据很多提法,例如“数据思维”却是很早以前就已经出现。古埃及人观察尼罗河泛滥的现象总结出了汛期出现的规律。在“数据热”之前,由于对数据收集不全面、不丰富,难以从中发现有效的信息,因此“数据思维”没有得到重视。但是在近几年来现代社会收集和储存的数据量超过了人类几千年收集的数据总量,对数据的挖掘分析的手段超过了以往简单的描述,使得数据挖掘有了从量变到质变的可能。


image.png


以美国ESPN和OPTA为例,他们通过2010年世界杯以来的22904场正式比赛的数据,研究了梅西和其他16574名足球运动员与足球的相关数据,发现了为什么梅西异常厉害的原因。因为梅西兼具通常在一人身上不可能同时并存的多种因素,比如禁区内外的射门成功率都很高、轻推进球还是远射这两者都是世界顶级水平、独立实现的进球数和射门成功率都居世界首位、得到其他球员的助攻进球也很多等等。以此为例,启示同学们要重视客观存在的数据、遵循数据驱动(Data Driven)的原则产生重大决策和形成挖掘数据中有用信息的思维和方法。


image.png


那么如何去挖掘数据中的信息?首先是需要收集获取足够多的数据,并用合适的模型描述,再寻找求解模型的方法,最后使用模型进行预测。现实生活中的数据则更为复杂,需要寻找数据之间的相关性并用数理思维处理数据。

以谷歌流感趋势为例,谷歌公司发现全球每星期会有数以百万计的用户在网上搜索健康信息。特别是在流感季节,与流感有关的搜索会明显增多;到了过敏季节,与过敏有关的搜索会显著上升;而到了夏季,与晒伤有关的搜索又会大幅增加。他们认为搜索流感相关主题的人数与实际患有流感症状的人数之间存在着密切的关系。并且通过对这些搜索查询的出现次数进行统计,可以估测出世界上不同国家和地区的流感传播情况。虽然疾病预防控制中心每年都会收集整理相关流感数据。但谷歌流感趋势较之更优的一点是它可以及时并且实时反馈流感趋势,并对未来的流感趋势进行有效预测。


image.png


数据应用的另一大体现就是人工智能。人工智能领域有许多热门的发展分支,例如图像识别、自然语言识别等等。人工智能的应用通常是从高数据行业开始,逐步向低数据行业扩展。医学和金融作为较早开始数据电子化的两大领域,为数据分析提供了足够丰富的样本。


image.png


法律领域作为一个具有高技能和高数据特点的行业,特别是司法裁判文书上网后,法律大数据分析就变得十分值得关注。以裁判文书为数据源,建立以原被告等法律实体为主的知识图谱,将其与相关法律知识进行融合。这对于智能辅助量刑、智能辅助计算赔偿金额和精准的类案推介有着积极意义。

“法律大数据分析”课程已采用同步录像,视频稍后整理后公开。欢迎大家分享学习!