深度学习是人工智能技术的一种方法,它通常利用大型的数据集来训练神经网络,最终以较高的准确率得出问题的结果。深度学习(Deep Learning)从快速发展到实际应用,短短几年时间里,已经改变了语音识别、图像分类、文本理解等众多领域的算法设计思路。最近,科学家又成功将深度学习算法应用到复杂的植物分类领域。
据发表在 8 月 11 日的 BMC 进化生物学杂志上的一项研究显示,研究人员运用深度学习方法成功地对数千种植物标本的图像进行了自动识别,而且,人工智能成功做出了正确的分类。这是研究人员首次尝试将人工智能技术运用到物种识别领域上。宾夕法尼亚州立大学的古植物学家 Peter Wilf 说,这是第一次尝试,但肯定不会是最后一次尝试。这种技术是博物学界物种识别分类领域的未来。
此次研究人员用了 26 万份植物标本的扫描图像来训练深度学习算法,这些植物标本的物种数超过了 1000 个。该算法最终以接近 80% 的准确率识别出了这些物种。Wilf 说,这可比人类的分类学家做得好多了。
如今,世界各地的自然历史博物馆都在竞相将他们的标本藏品数字化,把他们的标本放在公开的数据库中,让任何地方的研究人员都可以通过这些数据库对标本进行使用。比如,美国国家科学基金会的 iDigBio 项目,其实就是一个数据聚合器,它拥有超过 1.5 亿张来自全国各地的植物和动物的收藏标本图片。
世界上大约有 3000 个植物标本馆,据估计这些植物标本馆拥有 3.5 亿份标本,其中只有一小部分被数字化。但是,不断膨胀的标本数据集,以及计算机技术的进步,吸引了来自哥斯达黎加理工学院的计算机科学家 Erick Mata-Montero 和法国农业研究中心的植物学家 Pierre Bonnet 的关注,他们总觉得这些庞大的标本数据会有一些其他的用途。
Bonnet 的团队已经通过 pl@ntnet 项目实现了植物识别的自动化。pl@ntnet 是法国研究人员基于深度学习技术开发的一个 APP,它已经积累了数以百万计的植物图像,并能对部分植物进行自动识别,它的这些植物图像通常是人们用智能手机拍照上传得来的,图像数据越多,它识别的准确率就越大。此外,它还会向拍照者询问图像里的植物是一朵花还是一片叶子等,以增加识别的准确度。
Bonnet 说,虽然这种人工智能技术极大地提高了植物学家进行植物识别分类的效率,但是有一些植物学家担心,这种高效技术会降低植物学领域的门槛,会让民众觉得植物学家已没有什么专业技术价值。但是 Bonnet 却坚持认为,这种人工智能技术是很有作为的,因为它是基于人类的专业知识。它永远不会消除人类的专业知识。何况,植物学家还需要对这种技术的结果进行最后验证。
这种新技术可以帮助植物标本馆快速地处理新样本,简化一项需要数小时工作的艰巨任务。另外,Bonnet 说,这种技术还可以更有效地帮助小型植物标本馆进行物种识别。他的研究小组发现,从大型植物标本馆中获得的大型数据集的深度学习算法改进了对世界上相对数据缺乏的标本馆的植物物种的识别。这一发现对于那些生物多样性丰富但拥有很少植物标本收藏的地区来说尤其有用。
这种人工智能物种识别技术并不只是局限于植物标本。Nelson 目前正在努力实现对蝇幼虫的自动识别。此外,古植物学家 Peter Wilf 正在与人合作来对植物化石进行类似的分析识别。对植物化石的分析相当困难,因为植物化石的形式多种多样,比如石化了的水果和花朵,石化树干或压印在岩石里的石化树叶。相比之下,植物标本的识别就容易多了,它们扁平,干燥,而且通常是放在标准尺寸的纸上的。
总之,包括 Wilf 在内的一些博物界研究人员非常确信,这种深度学习技术将会逐步解决各种识别分类问题,并且会最终成为物种识别领域的基本技术手段。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)