大数据时代,一方面,传统方法无法处理体量浩大、多源异构、变化快速的数据,提取稀疏而珍贵的价值,神经网络具有强大的特征提取与抽象能力,能够整合多源信息,处理异构数据,捕捉变化动态,是大数据实现价值转化的桥梁。
另一方面,体量浩大的大数据为神经网络提供了充足的训练样本,使得训练越来越大规模的神经网络成为可能,随着硬件技术发展和计算能力的提升,训练大规模神经网络处理大数据的速度不断提高。神经网络与大数据双剑合璧,成为人工智能、大数据、认知科学、神经科学等学科跨领域的前沿热点研究问题。
(1)语音识别
自2006 年Hinton等提出深度学习的概念,神经网络再次回到人们的视野中,语音识别是第1个取得突破的领域。传统语音识别的方法主要利用声学研究中的低层特征,利用高斯混合模型进行特征提取,并用隐马尔可夫模型进行序列转移状态建模,并据此识别语音所对应的文字。历经数十年的发展,传统语音识别任务的错误率改进却停滞不前,停留在25% 左右,难以达到实用水平。
2013 年,Hinton 与微软公司合作,利用神经网络改进语音识别中的特征提取方法,将错误率降低至17.7%,并在大会现场展示了同声传译产品,效果惊人。此后,研究者们又陆续采用回复式神经网络改进语音识别的预测和识别,将错误率降至7. 9%。这一系列的成功使得语音识别实用化成为可能,激发了大量的商业应用。至2016 年,同声速记产品准确率已经突破95%,超过人类速记员的水平。
(2)计算机视觉
计算机视觉一直以来都是一个热门的研究领域。传统的研究内容主要集中在根据图像特点人工设计不同的特征,如边缘特征、颜色特征、尺度不变特征等。利用这些特征完成特定的计算机视觉任务,如图像分类、图像聚类、图像分割、目标检测、目标追踪等。
传统的图像特征依赖于人工设计,一般为比较直观的初级特征,抽象程度较低,表达能力较弱。神经网络方法利用大量的图像数据,完全自动地学习特征。在深度神经网络中,各层特征形成了边缘、线条、轮廓、形状、对象等的层次划分,抽象程度逐渐提高。
2012 年,在大规模图像数据集ImageNet 上,神经网络方法取得了重大突破,准确率达到84.7%。在LFW 人脸识别评测权威数据库上,基于深度神经网络的人脸识别方法DeepID 在2014、2015 年分别达到准确率99.15% 和99.53%,远超人类识别的准确率97.53%。
(3)医学医疗
医学医疗因为其应用的特殊性一直是科学研究的前沿,既要快速的推进,又要求格外严谨。如何利用好大数据解决医学和医疗中的问题,进一步改善医疗条件,提高诊治水平,是值得人们关注和研究的。随着神经网络各类应用的成功和成熟,在医学和医疗领域也出现了新的突破。
2016 年1 月,美国EnliTIc 公司开发的基于深度神经网络的癌症检测系统,适用于从X 光、CT 扫描、超声波检查、MRI 等的图像中发现恶性肿瘤,其中,肺癌检出率超过放射技师水平。
同年,Google 利用医院信息数据仓库的医疗电子信息存档中的临床记录、诊断信息、用药信息、生化检测、病案统计等数据,构建病人原始信息数据库,包括病人的用药信息、诊断信息、诊疗过程、生化检测等信息,采用基于神经网络的无监督深度特征学习方法学习病人的深度特征表达,并借助这一表达进行自动临床决策,其准确率超过92%。这些成果为实现基于医疗大数据的精准医疗打下了扎实基础。
(4)智能博弈
围棋被誉为“最复杂也是最美的游戏”,自从国际象棋世界冠军被深蓝电脑击败后,围棋也成为了“人类智慧最后堡垒”。2016 年,Google 旗下Deep-Mind 团队的AlphaGo对战人类围棋世界冠军李世乭九段,不但引起围棋界和人工智能界的热切注视,还吸引了众多群众的关注。
最终AlphaGo 以4:1战胜李世乭九段,其背后成功的秘诀正是采用了神经网络与增强学习相结合,借助神经网络强大的特征提取能力捕捉人类难以分析的高层特征; 再利用增强学习,采用自我对弈的方法产生大量的数据,从自己的尝试中学习到超越有限棋谱的技巧,成功掌握了致胜技巧。
这一结果在人工智能界非常振奋人心,因为它提出了一种自发学习到超越现有数据的学习方法,标志了增强学习与神经网络的成功结合,也是“大数据+ 神经网络”的成功的应用。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)