「一开始我就相信这是可行的」:卷积神经网络之父 Yann L

2020-05-22 浏览(4641) 评论(87) 当前位置:主页 > 新奇动力 >「一开始我就相信这是可行的」:卷积神经网络之父 Yann L

过去 20 年互联网高速发展,产生了大量需要被处理的数据,而这些数据让人类处理,因此人工智能成为大热。在某种程度上来说,人工智能已经充斥着我们生活的各个角落了。

其中 AI 图像识别是一个人工智能中热门课题,而 Yann LeCun 研发的卷积神经网络是应用于图像识别的主要技术。

以反向传播算法学习算法为研究方向

出生在巴黎的 Yann LeCun 在 1987 年 从巴黎第六大学修读计算机科学博士时,以神经网络的反向传播算法学习算法为主要研究方向。

但许多在那时候研究人工智能的人,例如深度学习之父 Geoffrey Hinton 等,都在面临极大的困难。当时,整体科学界对 AI 研究走向沉寂,大家所投入的兴趣、资金均大幅减少。

一方面,那时候电脑的运算能力还远达不到要求。 早期的软体驱动器在複杂程度上与现代的智慧型手机相比是小巫见大巫,电脑晶片在 1989 年以前也容纳不了数百万个组件,现今这个数字可以达到 80 亿。

另一方面,人工智能的研发亦到达樽颈,研究人员取得的成果无法达到最初设想之后,令人们开始觉得人工智能不可行而开始放弃。

甚至在读博士的时候, LeCun 的导师对神经网络一无所知,他就说:「我可以给你的论文签字,你似乎挺聪明的,但是从技术角度讲我确实没办法帮助你。」

但 Yann LeCun 没有像其他人一样对人工智能抱持悲观的心态,相反,他在毕业后加入了美国新泽西州 Holmdel 的 AT&T 贝尔实验室的自适应系统研究部,在那里他开发了许多新的机器学习方法,包括改变了 AI 图像识别的卷积神经网络。

卷积神经网络

卷积神经网络(Convolutional Neural Network, CNN)对比深度学习神经网络(DNN)多了Convolutional(卷积)及池化(Pooling) 两层,用以维持形状资讯并且避免参数大幅增加。

卷积层由小型传感器互联形成的系统把图像等内容分解成非常细小的部分,在每个部分中提取出图像的不同特徵,并识别出其中的模式。

而池化层的功能就是将输入的图片尺寸缩小(大部份为缩小一半)以减少每张feature map维度并保留重要的特徵最后根据所有的输入数据确定它们看到了什幺。

它的人工神经元可以响应一部分覆盖範围内的周围单元,对于大型图像处理有出色表现,因此与其他深度学习结构相比,卷积神经网络在图像和语音辨识方面能够给出更好的结果。

相比较其他深度、前馈神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。

相信自己的方向 并一直坚持下去

虽然他在90年代已经提出了这个网络,但这个神经网络并没有在那个时候得到广泛的应用。

他们当时将卷积神经网络应用到支票识别系统中,正当他们準备出现成果时,AT&T 被拆分成了三个公司,AT&T、朗讯和 NCR,当时卷积网络的专利被分给另一个公司,没法继续开发这个技术,令他们失去了所有字符识别方面的研究成果。

但 Yann LeCun 却没有放弃。他曾在访谈中表示:「一开始我就相信这是可行的,虽然它需要运算很快的计算机和很多数据,但我一直相信这是一种正确的做法。」

「我喜欢做的事,而且可能还是我做的不错的一件事,就是一直向下挖掘,去发现一个疑问背后真正的问题是什幺。」

在 2012 年的时候,Geoff Hinton 领军的研究团队在 ImageNet 竞赛中以深度学习技术写下图片辨识率达85%的新纪录并获得冠军,而在前一届2010年的竞赛中,辨识率最高仅72%,这让诸多研究者看到深度学习的技术潜力,也让处于寒冬数十载的人工智慧迎来曙光。

从此之后,计算机视觉在进入出现了爆炸式增长。计算机开始学会识别图像中的物体,接着又能识别视频中的物体,最后又发展到能够识别摄像头拍摄的实时画面中的物体。

目前 LeCun 不仅保留着纽约大学(NYU)的教职,而且也是 Facebook 人工智能实验室(FAIR)的负责人。