中文 English

您当前所在位置:首页 > 学术成果

学术成果

论文|王竹:人工智能技术与法学慕课

时间:2020-05-19

本文原载《法学家茶座》第50辑,由四川大学法学院王竹教授创作,系四川大学“智慧法治”超前部署学科系列学术成果。后续会持续分享四川大学“智慧法治”超前部署学科系列学术成果,欢迎大家阅读。


慕课(MOOC),即大规模开放在线课程(Massive Open Online Course)”,是新近涌现出来的一种在线课程开发模式,属于“互联网+教育”的产物。从2014年“侵权责任法”作为第一门法学类课程登录“中国大学MOOC”平台以来,四川大学法学慕课教学团队已经连续五年运行民法学慕课群,横跨“中国大学MOOC”和“智慧树WEMOOC”两个平台,从“侵权法”课程群发展到“马工程”《民法学》教材配套慕课群,包括本科和研究生两个慕课教学层次,同时向超过200所国内高校进行直播,并制作“双语字幕版”侵权法课程用于“中国-南亚法律人才研修班”对外教学授课,国内外总选修人数超过20万人次。“侵权责任法”入选2017年“首批国家精品在线开放课程”,上线“学习强国”论坛慕课栏目并获得首页推荐,宣传片被中央电视台“法治中国”纪录片选作素材,在全国法学界引起了广泛关注。

001.png


五年来的制作与运行中,法学慕课教学团队积累了大量的经验与教训,并形成了对法学慕课教学的深入思考,结集出版了《慕课的制作与运行指南》(高等教育出版社2015年版)。几乎是与慕课上线同时开始酝酿的智慧法治交叉学科,从小规模预研的交通事故案件智能化要素式审判系统上线,到年检索次数超过200万次的类案精准推荐系统,再到大规模展开的高质高效智慧审判平台构建,不但实现了文、理、工学科大交叉,更为重要的是让法律人了解了人工智能的前沿,让技术人理解了法律的思维方式,提高了交叉学科的沟通效率,加深了交叉学科的融合程度。就人工智能技术在法学慕课制作中的可能运用,主要包括人工智能合成主播制作法学慕课和慕课双语字幕翻译以及英文慕课合成制作;就人工智能技术在法学慕课运行中的可能运用,主要包括BBS智能助教和反作弊预警两个方面。
一、人工智能合成主播
2018年11月7日,新华社联合搜狗在第五届世界互联网大会上发布全球首个合成新闻“AI合成主播”,人工智能合成主播开始走入人们的视野。2019年3月3日,新华社联合搜狗公司又发布了全新升级的站立式AI合成主播,并推出全球首个AI合成女主播“新小萌”。从技术成熟度来评估,利用人工智能合成主播制作慕课的技术已经基本具备。在法学慕课制作领域,相关技术的主要研究方向是,如何将人工智能合成主播技术与法学慕课制作的教学需求结合起来。

002.png


(一)利用现有慕课录像作为训练数据集形成慕课教师授课语音特征库
四川大学法学慕课教学团队的“侵权法”慕课已经经历了1.0到3.0三个版本,例如笔者拍摄的“民法学”慕课群和“侵权责任法疑难问题专题研究”慕课,总时长超过5000分钟。这样的时长已经可以作为深度学习的训练数据集,形成笔者独特的授课语音特征库。
(二)利用人工智能技术将授课教师的语音特征嵌入到合成语音中
在民法典编纂完成之后,笔者将依据“马工程”《民法学》教材,制作全套的“马工程”《民法学》教材配套慕课教案,在此基础上形成授课的字幕文件。与传统慕课制作,先授课,后制作字幕,然后制作时间轴的顺序不同,合成语音是先制作字幕,然后利用人工智能技术将授课教师的语音特征嵌入到合成语音中,包括语速、语调、语气等,这样也就省去了时间轴的制作。
(三)利用人工智能技术合成教师形象主播并实现慕课智能更新
为了让合成语音与授课教师的口型能够对应,还需要同时利用人工智能技术合成教师形象主播。慕课不同于新闻,还需要配合后期剪辑制作,包括动画和部分课件内容在慕课录像中的综合展示,这对于法学类慕课的法律条文和定义等内容尤其重要。需要指出的是,我国现行法律体系已经进入修改频繁期,每次法律的修改和新的法律、司法解释的出台,都需要相应地修改慕课。而利用人工智能合成制作慕课,对于法学慕课的更新更为及时、便利,更新后的慕课也浑然一体,学员体验更为顺畅。
二、法律人工智能翻译
2019年4月12日,一场法律翻译人机对抗赛在北京大学法学院凯原楼举行。比赛的最后结果为:由一位在校生与“秘塔MT”组成的“人机联队”战胜人类选拔赛前三甲组成的“精英联队”。在速度和正确率两方面,AI均获得胜利。机器翻译在中文法律语境下的进步,为利用人工智能技术进行慕课双语字幕翻译奠定了技术基础。在慕课制作领域,相关技术的主要研究方向是,如何将字幕翻译的技巧与法律英语翻译的技术结合起来。
(一)利用“侵权法教材”中英文对照书稿作为细分专业语料库
尽管已经拥有了一定精确度的法律人工智能翻译模型,但侵权法作为民法的分支,仍然需要用该专业领域的语料库进行针对性的训练,才能更好地胜任侵权法字幕的翻译工作。杨立新教授所著《侵权责任法》已经在欧洲出版(YANG Lixin, Tort Liability Law of China, translated by WANG Zhu & DONG Chunhua, Jan Sramek Verlag, 2018.);笔者主持翻译的《美国侵权法:实体与程序》(第七版)(原作James A. Henderson Jr., Richard A. Pearson, Douglas Kysar, John A. Siliciano, The Torts Process (7th), Aspen Publishers 2007.)已经在北京大学出版社出版,这些中英文对照的翻译文本可以作为语料库对模型进行针对性训练。初步的实验表明,“秘塔MT”对已经断句的中文字幕可以进行较好的对应性翻译。
(二)利用“侵权法”中英文对照字幕训练翻译软件的“断句”模型
英文字幕翻译的疑难问题在于,中英文语序有所不同,因此如果直接进行中文字幕的对应性翻译,尽管每段字幕可以实现对应性翻译,但打断了中文字幕原有的整句含义。笔者主讲的“侵权法”有人工翻译的“双语”字幕,下一步需要尝试利用该中英对照文字幕训练“断句”模型,确保英文字幕的断句相对合理性。
(三)基于英文字幕的英文慕课合成制作
在利用人工智能翻译的英文字幕基础上,可以再利用前文提到的人工智能合成主播制作英文版的法学慕课。如利用通用语音模型,可以制作以笔者为主播形象的通用语音引擎版本的英文慕课。利用笔者平时的英文授课录像、录音作为训练素材,则可能生成个性化英文合成慕课。 
三、BBS智能助教
苹果Siri、微软Cortana、百度度秘等人工智能助手类产品,已经能够进行限定范围的多轮对话和服务推荐,并且能够较为顺畅地与人进行交流。国家重点研发计划“公共安全风险防控与应急技术装备”重点专项(司法专题任务)指南中,就有“面向案件审判执行全流程的智能问答技术”的研究设置,将支持处理立案、审判、执行等不少于20类法院业务场景的问题,支持多轮交互问答,支持自定义多模式情感化问答配置。在慕课运行领域,相关技术的主要研究方向是,如何将在法律行业的多轮问答技术与慕课BBS回答学生提问的需求结合起来,实现BBS智能助教。
(一)基于慕课群BBS学生提问形成问题素材库
在慕课教学团队五年来20万人次的选修过程中,基于“马工程”《民法学》教材配套慕课群,尤其是“侵权责任法”慕课的BBS学生提问,形成了上万条的问题库。这些问题来自于真实的学生提问,经过去重和分层整理之后,对应到慕课教案,形成了体系化的问题素材库。
(二)基于FQA形成疑难问题多轮问答库
慕课教学团队在每一门慕课均配备了慕课助教,长期持续回答学生提问。对于简单问题,由助教根据自己的知识进行回答;对于复杂问题,请示慕课教师团队后回答;对于常见的问题,则形成了FQA(frequently questions & answers)。这种积累下来的FQA库,结合问题素材库,形成疑难问题多轮问答库,能够较好地支撑限定课程学习内容范围内的多轮问答。
(三)根据民法典编写的民法典配套法条全书形成法律体系库并持续更新
在民法典编纂完成之后,笔者将编写民法典配套法条全书,整理民法典在现行《民法通则》和各民事单行法被废除之后,与现行行政法规、司法解释之间的关系,并持续更新,确保法律体系变更前后的法律体系库的完整,再结合问题素材库涉及到的与法律相关的问题,支持法律问题相关法律规则的查找和关联法条的推荐。
四、人工智能反作弊预警
人脸识别技术在近年来已经比较成熟,商汤科技、旷视科技、云从科技等企业的产品已经广泛地在机场、高铁站安检和单位门禁等领域投入使用,走入我们的生活。相较而言,步态识别是一种新兴的生物特征识别技术,旨在通过人们走路的姿态进行身份识别。步态识别的优势在于无需识别对象主动配合参与,并且难以伪装。利用“人脸识别+步态识别”双模式识别,可以极大地提高用户识别的精准度。而在大数据时代背景下,用户画像技术可以将用户的具体信息抽象成标签,利用这些标签将用户形象具体化。在慕课运行领域,近年来出现的慕课作弊,包括外挂刷题、雇人代看录像、代人机考等商业化运作,在各大第三方交易平台均可找到踪迹,严重冲击慕课教学的秩序,并危及到了慕课教学的推广。可以借鉴上述技术的思路,主要研究方向是利用人工智能技术反作弊预警,包括利用人脸识别,相当于慕课运行过程中“步态”的日志数据(主要是鼠标和键盘使用习惯)识别,以及学员答题画像综合确定学习主体确为注册学员本人。
(一)利用人脸识别技术确定注册学员
传统慕课平台为了吸引学员,注册方式尽量简化,一般通过邮箱、手机号或者微信即可登录。但由于商业化代看录像和代人机考的出现,确定注册学员已经成为难以避免的技术选择,具体步骤初步考虑如下:第一,在慕课注册时进行人脸识别,并确定其面部特征;第二,为避免用户体验太差,在每次学习开始时只是随机而非每次都进行人脸识别,但如果学习开始时未进行人脸识别,则学习过程中会进行随机的人脸识别抽样;第三,在期末考试机考时进行人脸识别。为避免采用照片或者视频模拟的方式蒙混过关,会随机要求人脸识别过程中学员眨眼、点头或者摇头。上述识别方式可能涉及个人隐私,可以由采用的课程选修服务协议规定,并由学员自行确定是否参与。对于不申请学分的学员,可以豁免。
(二)利用学员学习过程的日志数据辅助确定注册学员
与步态类似,每个人使用电脑的习惯不同,尤其体现在鼠标和键盘使用习惯上。就鼠标使用习惯,首先是左撇子与右撇子不同,其次是点击速度、鼠标移动速度、右键使用习惯等有所不同。就键盘使用习惯,敲击频率、错误率(Delete键的使用)、中文输入法选择、中文输入中空格与其他字母的间隙、拼音缩写的使用习惯等因人而异。另外,作为输入选择,鼠标和键盘部分功能具有相互替代性,例如笔者本人就极少使用鼠标,而使用快捷键组合替代。当然,鼠标和键盘使用习惯识别技术,可能因为学员使用电脑更换而差别较大,或者偶然因为身体暂时的不适而有所差别,所以主要用于辅助人脸识别技术确定学习主体为注册学员本人。
(三)利用学员答题画像辅助确定注册学员
如果要进行学员答题画像,那么在题库设计上,对于每个知识点,都要在弹题题库、章节测试题库和期末考试客观题库中予以对应。当然,从题目数量来讲,弹题最多,章节测试次之;期末考试客观题库数量虽然不少,但因为抽题之后,由于试卷容量原因数量较少。在上述题库设计基础上,根据数量最多的弹题,可以进行学员答题画像,包括掌握的知识点、准确率、难易知识的接收程度等,再与章节测试、期末考试客观试题的作答情况进行对比判断是否为同一人。该技术受制于弹题、章节测试和期末考试客观试题数量的有限性,主要是辅助人脸识别技术确定注册学员。