考虑到许多天文学数据库的规模都大得惊人,区分并不是一件简单的事,但是,人工智能算法给此事带来前所未有的希望。
近日,英国华威大学的大卫·阿姆斯特朗博士(David Armstrong)领导的研究团队开发了一项新的机器学习算法,从美国航空航天局(NASA)的陈旧数据中,识别出太阳系外的行星。他们确认了50颗系外行星的存在,从海王星大小的气体巨行星到比地球还小的岩石世界,无所不包。
方法是,计算出每个行星的成为候选星球的概率。
历史 上天文学家一般相信在太阳系以外存在着其它行星,然而它们的普遍程度和性质则是一个谜。直至1990年代人类才首次确认系外行星的存在,而自2002年起每年都有超过20个新发现的系外行星。
许多太阳系外行星调查都通过望远镜中的大量数据来搜索行星在望远镜与恒星之间通过的迹象,这就是所谓的过境。这会导致望远镜探测到的恒星发出明显的光线下降,但这也可能是由于来自背景物体的干扰,甚至相机中的微小误差所致。这些误报可以在行星验证过程中筛选出来。
华威大学(Warwick U)物理系和计算机科学系以及艾伦·图灵学院的研究人员建立了一种基于机器学习的算法,该算法可以在NASA的开普勒和TESS等望远镜任务发现的数千个候选行星的大样本中区分出真实的行星和虚假的行星。
AI算法接受了识别真实行星的训练,使用了两大已确认的行星样本和现已退役的开普勒任务的误报。
然后,研究人员在开普勒尚未确认的候选行星数据集上使用了该算法,产生了50个新的确认行星,其中第一个将通过机器学习进行验证。以前的机器学习技术只对候选行星进行排序,但从未自行确定候选行星是否是真正行星的概率,而这是行星验证的必要步骤。
通过确认这50颗行星是真实存在的,天文学家现在可以优先利用专门的望远镜对它们进行进一步的观察。
华威大学物理系的大卫·阿姆斯特朗博士说:“我们开发的算法可以让我们挑选50个候选行星进行行星验证,并将它们升级为真正的行星。”我们希望将这项技术应用于当前和未来的TESS和PLATO等任务中的大量候选样本。
天文学家有两种方法探测太阳系外的行星。一种是径向速度方法,它用来监测恒星是否有行星引力引起的小反运动。第二种是更敏感的技术, 也是凌日系外行星巡天卫星和开普勒采用的技术, 它主要依靠宿主星的亮度变化。
问题是,第二种方法产生了大量恒星的亮度数据,其中许多恒星不会有可见的系外行星。
于是,人工智能上场了。
论文中也强调:“我们的算法模型只要短短几秒就能对数千个肉眼看不见的候选行星进行识别,确认其是否真的是行星。我们现在不仅能说哪些候选行星‘更可能’是行星,而是可以用确切的数据说明这种可能性有多大:如果候选天体是‘假行星’的可能性小于1%,就可以被确认为是真正的行星。”
阿姆斯特朗博士,谈道:“就行星验证而言,之前没有人使用过机器学习技术。机器学习已经被用于对候选行星进行排名,但从来没有在概率框架中使用过,而概率框架是你真正验证一颗行星所需要的。我们现在可以说出精确的统计可能性,而不是说哪些候选者更有可能是行星。如果一个候选行星的假阳性概率小于1%,它就被认为是经过验证的行星。”
华威大学的计算机科学系副主任、阿兰·图灵研究所(Alan Turing Institute)研究员Dr Theo Damoulas博士说:
阿姆斯特朗博士补充说:“到目前为止,几乎30%的已知行星仅用一种方法就被验证了,这并不理想。仅仅因为这个原因,开发新的验证方法是可取的。但机器学习也能让我们做得非常快,更快地确定候选人的优先级。”
研究人员认为,它应该是未来用来验证行星的工具之一。
根据新的研究,在所有确认的系外行星中,大约有三分之一是用单一的分析方法确认的,这并不理想。科学家们用已确认身份的系外行星数据和“假行星”的数据来训练神经网络(一种人工智能算法),这样能在新的数据中识别出那些明显的迹象(信号)。
新技术比以前的技术更快,可以自动化,并且可以通过进一步的"训练”加以改进效果。
论文《利用机器学习验证系外行星:50颗新验证的开普勒行星》发表在《皇家天文学会月刊》上。阿姆斯特朗博士的研究得到了英国研究与创新部门科学技术设施委员会(STFC)通过Ernest Rutherford奖学金的支持。
GitHub上也有不少天文学软件包,比如, allesfitter, 用于对光度和RV数据进行建模。它可以容纳多个系外行星,多星系统、星点、恒星耀斑和各种噪声模型。
尽管取得了突破,但是,该算法仍处于早期阶段。在陈旧数据中找到错失的金子,提高了人类 探索 未知宇宙世界的效率。验证行星的新工具问世了,新老方法共同为系外行星 探索 出力。
(全文结束)
《亲爱的数据》出品
《数据库原理及应用》
第1章 绪论
1.1 数据管理技术的发展
1.1.1 人工管理阶段
1.1.2 文件系统阶段
1.1.3 数据库管理阶段
1.2 数据库系统结构
1.2.1 三级模式结构
1.2.2 数据库系统的二级独立性
1.2.3 数据库系统的二级映像
1.3 数据库、数据库管理系统和数据库系统
1.3.1 数据库
1.3.2 数据库管理系统
1.3.3 数据库系统
1.4 数据库技术的发展
小结
习题
第2章 数据模型
2.1 数据模型的概念
2.1.1 数据的三个范畴
.2.1.2 数据模型的组成要素及分类
2.2 e-r模型
2.2.1 基本概念
2.2.2 e-r图设计
2.3 面向对象模型
2.3.1 对象建模的基本知识
2.3.2 类图
小结
习题
第3章 关系数据库
3.1 关系数据模型
3.1.1 关系数据模型概述
3.1.2 基本术语
3.1.3 关系的性质
3.2 关系的完整性
3.3 关系代数
3.3.1 传统的集合运算
3.3.2 专门的关系运算
3.3.3 关系代数运算的应用实例
3.3.4 关系代数的扩充 *** 作
小结
习题
第4章 结构化查询语言sql
4.1 sql概述
4.1.1 sql语言的发展
4.1.2 sql语言的特点
4.1.3 sql语言的基本概念
4.2 数据定义语句
4.2.1 基本表的定义
4.2.2 基本表的修改与删除
4.2.3 基本表的删除
4.3 查询
4.3.1 单表查询
4.3.2 连接查询
4.3.3 嵌套查询
4.3.4 集合查询
4.4 数据 *** 纵
4.4.1 插入数据
4.4.2 修改数据
4.4.3 删除数据
4.5 视图
4.5.1 视图的定义与删除
4.5.2 查询视图
4.5.3 更新视图
4.5.4 视图的作用
小结
习题
第5章 存储过程、触发器和数据完整性
5.1 sql server编程结构
5.1.1 变量
5.1.2 显示信息
5.1.3 注释语句
5.1.4 批处理
5.1.5 流程控制语句
5.2 存储过程
5.2.1 存储过程的基本概念
5.2.2 创建存储过程
5.2.3 使用sql server管理控制台执行存储过程
5.2.4 修改和删除存储过程
5.3 触发器
5.3.1 触发器的基本概念
5.3.2 创建触发器
5.3.3 修改和删除触发器
5.4数据库完整性
5.4.1 约束
5.4.2 默认值
5.4.3 规则
5.4.4 用户定义的数据完整性
小结
习题
第6章 关系数据库设计理论
6.1 问题的提出
6.2 基本概念
6.2.1 函数依赖
6.2.2 码
6.3 规范化
6.3.1 第一范式
6.3.2第二范式
6.3.3 第三范式
6.3.4 bc范式
6.3.5 多值依赖与第四范式
6.3.6 关系模式规范化
6.4 函数依赖的公理系统
6.4.1 armstrong公理系统
6.4.2 闭包
6.4.3 函数依赖集的等到价和最小化
6.5 模式分解
6.5.1 模式分解的准则
6.5.2 分解的函数依赖保持性和无损连接性
6.5.3 模式分解的算法
小结
习题
第7章 索引
7.1 索引的概念
7.1.1 聚集索引
7.1.2 非聚集索引
7.1.3 唯一索引
7.1.4 何时应该创建索引
7.1.5 系统如何访问表中的数据
7.2 sql server 2005中的索引
7.2.1 索引的结构
7.2.2 管理索引
小结
习题
第8章 数据库设计
8.1 数据库设计概述
8.2 数据库设计的过程
8.2.1 数据库设计的步骤
8.2.2 需求分析阶段
8.2.3 概念设计阶段
8.2.4 逻辑设计阶段
8.2.5 物理设计阶段
8.2.6 数据库实现阶段
8.2.7 数据库的运行与维护阶段
8.3 数据库设计实例:电网设备抢修物资管理数据库设计
8.3.1 需求分析
8.3.2 概念模型
8.3.3 逻辑模型
小结
习题
第9章 数据库安全
9.1 安全性概述
9.1.1 用户标识与鉴别
9.1.2 存取控制
9.1.3 自主存取控制方法
9.1.4 强制存取控制方法
9.1.5 视图机制
9.1.6 审计
9.1.7 数据加密
9.2 sql server的安全性
9.2.1 sql server 2005的身份验证模式
9.2.2 sql server 2005的安全机制
9.3 用户管理和角色管理
9.3.1 登录用户和数据库用户
9.3.2 用户管理
9.3.3 角色管理
9.3.4 sql server的固定角色
9.4 权限管理
9.4.1 授予权限
9.4.2 收回权限
9.4.3 禁止权限
9.5 架构
小结
习题
第10章 数据库保护
10.1 事务
10.1.1 事务的定义
10.1.2 事务的acid性质
10.1.3 事务的状态
10.2 并发控制
10.2.1 并发 *** 作与数据的不一致性
10.2.2 封锁
10.2.3 并发 *** 作的调度
10.3 数据库的恢复
10.3.1 存储器的结构
10.3.2 恢复的原则和实现方法
10.3.3 故障类型和恢复方法
10.4 sql server数据库备份与恢复
10.4.1 数据库备份方法
10.4.2 数据库恢复
小结
习题
第11章数据库技术新进展
11.1 数据仓库
11.1.1 数据仓库的概念、特点与组成
11.1.2 数据的技术
11.1.3 数据仓库的几个重要概念
11.1.4 数据仓库的结构
11.1.5 数据仓库的多维数据模型
11.1.6 数据仓库系统设计
11.1.7 数据仓库的未来
11.2 数据挖掘
11.2.1 支持数据挖掘的基础
11.2.2 数据挖掘的分析方法
11.2.3 数据挖掘常用的基本技术
11.2.4数据挖掘技术实施的步骤
11.2.5数据挖掘技术发展
11.3 数据库技术的研究及发展
11.3.1 数据库技术的研究热点
11.3.2 数据库技术的发展方向
11.4 结语
小结
习题
附录a sql server 2005的安装及使用
a.1 sql server简介
a.2 sql server 2005的安装
a.3 sql server配置管理器
a.4 启动sql server服务
a.5 使用sql server management studio管理数据库
附录b 实验
实验一 通过sql server management studio创建及管理数据库
实验二 通过sql语句创建与管理数据表
实验三 单表查询
实验四 复杂查询
实验五 视图的创建与使用
实验六 存储过程
实验七 触发器
实验八 实现数据完整性
实验九 索引及数据库安全
参考文献
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)