中文 English

您当前所在位置:首页 > 新闻资讯

新闻资讯

新闻|“法律大数据分析”课程:三步弄懂深度学习

时间:2018-07-10

2018年7月10日下午,由四川大学计算机学院、数学学院、法学院联合开办的“法律大数据分析”课程第二次专题研讨课在四川大学江安校区顺利开课。计算机学院张意副教授主要从计算机应用角度出发深入浅出地介绍了深度学习(Deep Learning)。


blob.png


深度学习是一个近几年来十分火热的计算机研究方向。提到深度学习,与它相关的其他概念,例如机器学习、人工智能,常常会让人难以辨明。从应用的时间线和概念范畴进行比对,深度学习是机器学习的一个子集,而机器学习则是涵盖在人工智能之内。


blob.png


具体而言,机器学习可以约等于寻找适合的函数。例如输入一段语音,需要函数具有识别声音波段的功能来输出识别的反馈内容。因此,机器学习的流程大致可以划分为三步:第一步,通过大量前期人工处理的数据,定义函数集合,建立模型;第二步,定义一个标准寻找函数的优劣;第三步,再通过监视学习作为验证模型的评价标准,找出最优模型。深度学习的流程与机器学习不同之处在于,第一步建立的是神经元网络模型。

神经网络模型是一种仿生人脑的神经元而建立的模型,模型结构的原理是仿真人的神经元受刺激的过程。其中,以向量(Neuron)仿真神经元核心,以添加不同参数、权重等仿真人脑受到刺激的过程。神经网络模型从本质上讲就是函数集。仿真的神经元结构搭建出函数框架(Function Set),再根据训练数据(Training Data)确定定义的学习目标(Learning Target)添加参数、权重、偏移,最终通过不同的验证方式找出最优模型。


blob.png


 

为什么通过神经网络模型找出最优函数的方式会被称为“深度学习”?这里需要对“深度”(Deep)进行解释。深度是指输入层和输出层之间的众多层数,一般三层以上的神经网络可以称为使用了深度学习方法。那么,这样多层设计结构有什么优势呢?目前存在一个已经被证明的结论:数学上的任何一个函数都可以用一层神经网络实现。但是仅用一层神经网络解决复杂问题,那这个网络会异常庞大。神经网络模型增加层数的方式比之一层网络增加参数的方式,有着减少参数和数据量的优点。在图片识别领域,伴随着层数的增加,识别的精准度也会提高。


blob.png


深度学习的第二步是定义函数优劣的标准。这里引用一个概念Loss,是指输出结果和目标结果之间的差距。评判的标准就是使得总的Loss尽可能小的函数可能就是好的函数。

张意老师认为,深度学习的难点在于第三步流程。其中,参数的调整需要耗资较高的设备支撑。参数的调整,在深度学习领域,目前大多使用的是梯度下降法:通过寻找函数梯度为0的地方,求取局部函数最小值。具体是先随机挑选初始值,再对一个或者多个参数W进行求导。由于随机挑选的初始值不同,可能出现一个局部函数极值,因此需要调整参数不断尝试。对此张意老师的说法是,如何确定网络结构的层数和参数,都是需要依靠在调试过程中不断积累的试错经验和个人灵光闪现的直觉。