数据库系统的基本概念
数据:实际上就是描述事物的符号记录。
数据的特点:有一定的结构,有型与值之分,如整型、实型、字符型等。而数据的值给出了符合定型的值,如整型值15。
数据库:是数据的集合,具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序共享。
数据库存放数据是按数据所提供的数据模式存放的,具有集成与共享的特点。
数据库管理系统:一种系统软件,负责数据库中的数据组织、数据 *** 纵、数据维护、控制及保护和数据服务等,是数据库的核心。
数据库管理系统功能:
(1)数据模式定义:即为数据库构建其数据框架;
(2)数据存取的物理构建:为数据模式的物理存取与构建提供有效的存取方法与手段;
(3)数据 *** 纵:为用户使用数据库的数据提供方便,如查询、插入、修改、删除等以及简单的算术运算及统计;
(4)数据的完整性、安生性定义与检查;
(5)数据库的并发控制与故障恢复;
(6)数据的服务:如拷贝、转存、重组、性能监测、分析等。
主要特点
(1)实现数据共享。
数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。
(2)减少数据的冗余度。
同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。
(3)数据的独立性。
数据的独立性包括数据库中数据库的逻辑结构和应用程序相互独立,也包括数据物理结构的变化不影响数据的逻辑结构。
(4)数据实现集中控制。
文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。
CREATE TABLE t_user (
id INT(11) NOT NULL AUTO_INCREMENT,
sex CHAR(2) NULL,
PRIMARY KEY (id),
CONSTRAINT sex CHECK (sex in('男','女')));
扩展资料:
1、数据库:在MySQL中,要存储数据,必须从数据库开始,因此首先要创建数据库,但由于学校的MySQL服务器对学生数据帐号有限止。
2、学生不得创建数据库,故每个学生的帐号中已事先由信息中心为大家建立了一个名为帐号名的数据库。但我们必须了解创建数据库的语句为CREATE DATABASE <数据库名>
3、数据表结构:创建一个数据表的第一步即为创建数据表结构,在数据表结构中的内容包括:有几个字段,每个字段的名称,字段的类型,字段的长度,字段的属性。
4、字段:它是构成数据表结构的必须元素,一列数据就是一个字段。
5、字段名:用来描述字段的名称,它可以用中文、英文字母、数字等字符来描述。
6、字段类型:用来限定数据的一种方式,即每一个字段下的数据必定类型是相同的。
7、字段长度:即每一列字段中的数据位数。
回答这个问题既要了解相关专业名词的概念,还应知晓国家相关政策,最后了解多种查询方法
一、专业名词概念
(一)税务类名称
1 税务登记证号
(1)定义
税务登记证号是各地市统一发放给纳税企业的税务申报号码,是企业向国家和地方政府报税时使用的编码。它既是企业办理税务登记时候证书号码,也是法人代表或经营者的身份z号码。
(2)认识误区
由于有部分企业只缴纳地税,不缴纳国税,可以只办地税的税务登记证,这样该企业的的纳税人识别码就与地税税务登记证号相同了,据此多数人认为纳税人识别码就是地税的税务登记证号或税务登记代码、纳税人代码、税号,这几个词用途一样,无区别,只是叫法不同。
(3)位置
税务登记上税字后面号码即为税务登记证号。
2 税务登记代码
税务登记代码即税务登记证号。
3 税务管理码
税务管理码是各税务机关区分的管理代码。是各级税务机关进行税务管理的一个编码,不具有唯一性,即便是同一地区的国税局和地税局对同一纳税人的税务管理码也并不相同。
4国家组织机构代码
(二)企业、个人信息类名称
1 纳税人识别码
纳税人识别号是全国统一编码的,用来区分纳税企业的编码。是各地税务机关对自己管辖纳税人的电脑编号,这个号码只是为了电脑查询方便,没有其他意义
纳税人识别码通常简称为“税号”,是与税务登记证上的号基本一致,每个企业的识别号都是唯一的,相当于企业的“身份z”号,一律由15位、18或者20位码(字符型)组成。
2 税号
税号是纳税人识别号的简称。
3 纳税人代码
纳税人代码即纳税人识别号。税号、纳税人识别码、纳税人代码这三个名词在使用上无差别,只是叫法不同而已
纳税人编号(码)
纳税人编号(纳税人编码)是主管税局给企业编的代码,也是主管税务局给的纳税人的一个档案编号,主要是用于企业报税的管理和对企业纳税资料的归档。
(三)税务登记证号和纳税人识别号的异同
1 相同性
(1)都是15位数字;
(2)有的企业俩号码相同,有的企业俩号码不同;
(3)都在同一张税务登记证本上(地税字号,纳税人识别号)。
2 相异性
税务登记证号是各地市统一发放给纳税企业的税务申报号码,纳税人识别号是全国统一编码的来区分纳税企业的,报税使用前者,后者是身份z一样。目前国税新证已统一为一个号码,地税仍为两个号码。
二、国家相关政策
(一)编码规则
1 税务登记代码的编制
已领取组织机构代码的纳税人,税务登记代码编号方式为:
区域码+国家技术监督部门设定的组织机构代码(9位码)。
2 纳税人识别码的编制
(1) 编制规则
纳税人识别码的编制一律由15位、18或者20位码(字符型)组成。其中:
(1)数字代码的编制方法
国家税务总局下达的纳税人代码为15位,其中:
1—2位为省、市代码;
3—6位为地区代码;
7—8位为经济性质代码;
9—10位行业代码;
11—15位为各地自设的顺序码。
(2)企业、事业单位等组织机构纳税人识别码
企业、事业单位等组织机构纳税人以国家技术监督局编制的9位码(其中区分主码位与校验位之间的“-”符省略不打印)并在其前面加挂6位行政区划码共15位码,作为其“纳税人识别号”。即企业、事业单位等组织机构纳税人识别码按以下方法编制:
6位行政区划码+国家技术监督局编制的9位组织机构代码(其中区分主码位与校验位之间的“-”符省略不打印)
(3)对应其他区不同纳税人的具体编制方法
从事生产、经营的港、澳、台人员税务登记代码与纳税人识别码的编制为:
区域码+相应的有效证件(如香港、澳门、台湾居民往来大陆通行证等)号码。
个体工商户税务登记代码为其居民身份z号码。因此个体工商户和其他缴纳个人所得税的中国公民,以公安部编制的居民身份z18位号码为其“纳税人识别号”。
外国人以其国别和护照号码作为其“纳税人识别号”。
即外国在中国纳税的纳税人识别码为:国别+个人护照号码
(4) 3LX的含义
纳税人识别号一般是根据技术监督局代码引申而来的,而技术监督局代码一般为9位数,所以前面要加上地区编码,如果地区编码加上技术监督局代码,再加效验码位数不足的,中间加L,如果效验码无法析出的加X,表示是1-9。
(二)相关规定
1 纳税人识别号原则上是无含义代码。对于取得技术监督局9位组织机构代码的纳税人,其纳税人识别号采用6位行政区划码加9位技术监督局组织机构代码。引用6位行政区划代码的目的是为了首次赋码的便捷、防止重码出现,保证纳税人在全国范围内被赋予唯一的纳税人识别号,本身不具有任何语义。
2 纳税人识别号是纳税人数据信息内外部交换共享的基础,应保持不变。对于已存在的纳税人识别号不必随国家行政区划代码的调整而调整。对于同一税务机关,如果本地区不同时期的行政区划代码不同,其所辖纳税人的纳税人识别号的前六位可以有不同的区划代码。对新开办企业可使用新的行政区划代码。
3 有的企业由于是国、地税两局的共管户,可能拥有两个识别号,针对这种情况,文件中规定:国税局、地税局的共管户,如果拥有两个纳税人识别号,可由当地国税局、地税局双方协商确定其纳税人识别号的前六位编码。
4 对于以后数据信息采集的数据清分方法,文件中也给予了明确的规定:以后将采用主管税务机关的识别号做为数据清分的识别代码,所以文件中要求税务机关指导纳税人正确填写主管税务机关的代码,同时纳税人也应该注意将自己主管税务机关的代码填写正确。
(三)最新信息
纳税人识别号,通常简称为“税号”。纳税人识别号就是税务登记证上的号,每个企业的识别号都是唯一的。2015年1月12日,根据国家税务总局本周公布的《中华人民共和国税收征收管理法修订草案(征求意见稿)》,未来每个公民可能都将拥有一个由税务部门编制的唯一且终身不变、用来确认其身份的数字代码标识。这个属于每个人自己且终身不变的数字代码很可能成为我们的第二张“身份z”。
(二)国家组织机构代码
1 简介
组织机构代码证是各类组织机构在社会经济活动中的通行证。代码是“组织机构代码”的简称。组织机构代码是对中华人民共和国境内依法注册、依法登记的机关、企、事业单位、社会团体和民办非企业单位颁发一个在全国范围内唯一的、始终不变的代码标识。
2 组织机构代码的编制标准
组织机构代码按照强制性国家标准GB11714《全国组织机构代码编制规则》编制,由八位数字(或大写拉丁字母)本体代码和一位数字(或大写拉丁字母)校验码组成。
3 组织机构代码证书
组织机构代码证书包括正本、副本和电子副本(IC卡),代码登记部门在为组织机构赋码发证的同时,还要采集28项基础信息,并按照国家标准对这些信息进行编码,将这些信息存入代码数据库和代码证电子副本(IC卡)中,供代码应用部门使用。代码登记部门所采集的基础信息包括:机构名称、机构地址、机构类型、经济性质、行业分类、规模、法人代表等。
三、多种查询方法
(一)网络查询
登录当地的国家税务局或地方税务局网站进行查询。以北京、上海为例可做以下查询:
1 企业信息查询
(1)北京国税总局或地税局
(2)上海国税、地税局
2发票真伪查询
(1)北京国税总局或地税局
(2)上海国税局或地税局
(二)电话查询
拨打拨打全国统一的发票真伪电话号码12366即可查询。
方法是:区号+12366
(三)当地税务主管机构查询
到该企业在当地登记的税务主管机构进行查询。可查询该企业的税务登记证号、纳税人识别代码、以及该企业开具的发票真伪。
资料来源
北京国家税务总局(官网) >
上海国家税务局、地方税务局 >
百度经验 >
百度百科 >
1、实现数据共享
数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。
2、减少数据的冗余度
同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。
3、数据的独立性
数据的独立性包括逻辑独立性(数据库中数据库的逻辑结构和应用程序相互独立)和物理独立性(数据物理结构的变化不影响数据的逻辑结构)。
4、数据实现集中控制
文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。
5、数据一致性和可维护性,以确保数据的安全性和可靠性
主要包括:①安全性控制:以防止数据丢失、错误更新和越权使用;②完整性控制:保证数据的正确性、有效性和相容性;③并发控制:使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用。
6、故障恢复
由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。比如对系统的误 *** 作造成的数据错误等。
扩展资料:
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。
数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。
以内模式为框架所组成的数据库叫做物理数据库;以概念模式为框架所组成的数据叫概念数据库;以外模式为框架所组成的数据库叫用户数据库。
1、物理数据层。
它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令 *** 作处理的位串、字符和字组成。
2、概念数据层。
它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。
3、用户数据层。
它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。
数据库不同层次之间的联系是通过映射进行转换的。
参考资料:
有这么一种说法,哥们要找性格相似的,对象要找性格互补的。这句说法对不对,我认为,这种说法不完全对。
我的少年好友,是一位性格内向的少年,与我一起度过了小学时光,包括成年后,我们都时常联系,这种感情,很是特别。由此去想,我的好朋友是一个什么样的人,我就是一个什么样的人,我也是一个内向的人。我以前认为这个内向不好,从初中开始,我都有意识的去改变自己的性格,上大学后,我也积极参加社团活动,但是最后,我并没有成功,我跟少年时候的我,并没有太多的改变。应该很多人都有同样经历,发现自己的好友,都是跟自己性格差不多,在一起更能够聊得来,相反,如果你不爱说话,那么跟自己性格迥异的人,在一起就多了一个屏障。那么,是不是性格相反的人,就聊不来呢,不是的,我也有性格很外向的朋友,在一起也相处的特别愉快。
再把话谈开来,人的相似性,不仅仅是性格的相似性,也包含其他方面,比如态度和价值观的相似,性别,年龄,学历,社会地位方面的相似性,等等,人与人对事物的看法一致,更聊得来,人与人有相对的品味,喜欢相同的书籍、**和音乐,这些都会拉近人与人的距离;性别一致,小学生时代,总是那么男女有别;学历相似,有相似学历的人,应该会更有话题聊天;社会地位的相似,科长估计是跟省长之间,没有多少时间去说话,我想跟马云成为朋友,估计不太可能。这些相似性,让人的距离缩短。
可是,很多人找对象都想去找那种与自己性格相反的人呢,这个就是相异的魅力;正因为你不具备这方面的能力,所以你特别想去弥补这方面的能力,这些都是出于功利主义的想法。如果两个人没有其他方面的相似点,多半会分道扬镳。
总而言之,人与人之前的相似点越多,越有吸引力。
数月前,我长途跋涉来到位于纽约州约克城高地的IBM研究实验室的林间园区,为的就是能早早一窥那近在眼前却让人期待许久的人工智能的未来。这儿是超级电脑“沃森”(Watson)的研发地,而沃森在2011年就在“危险边缘”(Jeopardy!)节目的比赛里拔得头筹。最初的沃森电脑仍留于此处——它是一个体积约与一个卧室相当,由10台直立的冷柜式机器围成四面墙的计算机系统。技术人员可以通过系统内部的小细孔把各种线缆接到机器背部。系统内部温度高得出奇,仿佛这个计算机集群是活生生的一般。
如今的沃森系统与之前相比有了显著差异。它不再仅仅存在于一排机柜之中,而是通过大量对用户免费开放的服务器传播,这些服务器能够即时运行上百种人工智能的“情况”。同所有云端化的事物一样,沃森系统为世界各地同时使用的客户服务,他们能够用手机、台式机以及他们自己的数据服务器连上该系统。这类人工智能可以根据需求按比例增加或减少。鉴于人工智能会随人们的使用而逐步改进,沃森将始终变得愈发聪明;它在任何一次情况中所获悉的改进点都会立即传送至其他情况中。并且,它也不是一个单一的程序,而是各种软件引擎的集合——其逻辑演绎引擎和语言解析引擎可以在不同的代码、芯片以及位置上运行——所有这些智慧的因素都汇集成了一个统一的智能流。
用户可以直接接入这一永久连接(always-on)的智能系统,也可以通过使用这一人工智能云服务的第三方应用程序接入。正如许多高瞻远瞩的父母一样,IBM想让沃森电脑从事医学工作,因此他们正在开发一款医疗诊断工具的应用程序,这倒也不足为奇。之前,诊疗方面的人工智能尝试大多以惨败告终,但沃森却卓有成效。简单地说,当我输入我曾经在印度感染上的某种疾病症状时,它会给我一个疑似病症的清单,上面一一列明了可能性从高到低的疾病。它认为我最可能感染了贾第鞭毛虫病(Giardia)——说的一点儿也没错。这一技术尚未直接对患者开放;IBM将沃森电脑的智能提供给合作伙伴接入使用,以帮助他们开发出用户友好界面为预约医生及医院方面服务。“我相信类似沃森这种——无论它是机器还是人——都将很快成为世界上最好的诊疗医生”,创业公司Scanadu的首席医疗官艾伦·格林(Alan Greene)说道,该公司受到**《星际迷航》中医用三录仪[2]的启发,正在利用云人工智能技术制造一种诊疗设备。“从人工智能技术改进的速率来看,现在出生的孩子长大后,很可能不太需要通过看医生来得知诊疗情况了。”
医学仅仅只是一个开始。所有主流的云计算公司,加上数十家创业公司都在争先恐后地开展类似沃森电脑的认知服务。根据量化分析公司Quid的数据,自2009年以来,人工智能已经吸引了超过170亿美元的投资。仅去年一年,就有322家拥有类似人工智能技术的公司获得了超过20亿美元的投资。Facebook和谷歌也为其公司内部的人工智能研究小组招聘了研究员。自去年以来,雅虎、英特尔、Dropbox、LinkedIn、Pinterest以及推特也都收购了人工智能公司。过去四年间,人工智能领域的民间投资以平均每年62%的增长速率增加,这一速率预计还会持续下去。
纵观所有这些活动,人工智能的未来正进入我们的视野之中,它既非如那种哈尔9000(HAL 9000)(译者注:小说及**《2001:太空漫游》中的超级电脑)——一台拥有超凡(但有潜在嗜杀倾向)的类人意识并依靠此运行的独立机器那般——也非让奇点论者心醉神迷的超级智能。即将到来的人工智能颇似亚马逊的网络服务——廉价、可靠、工业级的数字智慧在一切事物的背后运行,偶尔在你的眼前闪烁几下,其他时候近乎无形。这一通用设施将提供你所需要的人工智能而不超出你的需要。和所有设施一样,即使人工智能改变了互联网、全球经济以及文明,它也将变得令人厌倦。正如一个多世纪以前电力所做的那样,它会让无生命的物体活跃起来。之前我们电气化的所有东西,现在我们都将使之认知化。而实用化的新型人工智能也会增强人类个体(加深我们的记忆、加速我们的认知)以及人类群体的生活。通过加入一些额外的智能因素,我们想不到有什么东西不能变得新奇、不同且有趣。实际上,我们能轻易地预测到接下来的一万家创业公司的商业计划:“做某项事业,并加入人工智能”。兹事体大,近在眼前。
大约在2002年时,我参加了谷歌的一个小型聚会——彼时谷歌尚未IPO,还在一心一意地做网络搜索。我与谷歌杰出的联合创始人、2011年成为谷歌CEO的拉里·佩奇(Larry Page)随意攀谈起来。“拉里,我还是搞不懂,现在有这么多搜索公司,你们为什么要做免费的网络搜索你是怎么想到这个主意的”我那缺乏想象力的无知着实证明了我们很难去做预测,尤其是对于未来的预测。但我要辩解的是,在谷歌增强其广告拍卖方案并使之形成实际收益,以及进行对YouTube的并购或其他重要并购之前,预测未来是很难的。我并不是唯一一个一边狂热地用着谷歌的搜索引擎一边认为它撑不了多久的用户。但佩奇的回答让我一直难以忘怀:“哦,我们实际上是在做人工智能。”
过去数年间,关于那次谈话我想了很多,谷歌也收购了14家人工智能以及机器人方面的公司。鉴于搜索业务为谷歌贡献了80%的收入,因此乍一看去,你可能会觉得谷歌正在扩充其人工智能方面的投资组合以改善搜索能力。但是我认为正好相反。谷歌正在用搜索技术来改善人工智能,而非使用人工智能来改进搜索技术。每当你输入一个查询词,点击搜索引擎生成的链接,或者在网页上创造一个链接,你都是在训练谷歌的人工智能技术。当你在搜索栏中输入“复活节兔子”(Easter Bunny)并点击看起来最像复活节兔子的那张时,你都是在告诉人工智能,复活节兔子是长成什么样的。谷歌每天拥有12亿搜索用户,产生1210亿搜索关键词,每一个关键词都是在一次又一次地辅导人工智能进行深度学习。如果再对人工智能的算法进行为之10年的稳固改进,加之一千倍以上的数据以及一百倍以上的计算资源,谷歌将会开发出一款无与伦比的人工智能产品。我的预言是:到2024年,谷歌的主营产品将不再是搜索引擎,而是人工智能产品。
这个观点自然也会招来怀疑的声音。近60年来,人工智能的研究者都预测说人工智能时代即将到来,但是直到几年前,人工智能好像还是遥不可及。人们甚至发明了一个词来描述这个研究结果匮乏、研究基金更加匮乏的时代:人工智能之冬。那么事情真的有变化吗
是的。近期的三大突破让人们期待已久的人工智能近在眼前:
1 成本低廉的并行计算
思考是一种人类固有的并行过程,数以亿计的神经元同时放电以创造出大脑皮层用于计算的同步脑电波。搭建一个神经网络——即人工智能软件的主要结构——也需要许多不同的进程同时运行。神经网络的每一个节点都大致模拟了大脑中的一个神经元——其与相邻的节点互相作用,以明确所接收的信号。一项程序要理解某个口语单词,就必须能够听清(不同音节)彼此之间的所有音素;要识别出某幅,就需要看到其周围像素环境内的所有像素——二者都是深层次的并行任务。但直到最近,标准的计算机处理器也仅仅能一次处理一项任务。
事情在十多年前就已经开始发生变化,彼时出现了一种被称为图形处理单元(graphics processing unit -GPU)的新型芯片,它能够满足可视游戏中高密度的视觉以及并行需求,在这一过程中,每秒钟都有上百万像素被多次重新计算。这一过程需要一种专门的并行计算芯片,该芯片添加至电脑主板上,作为对其的补充。并行图形芯片作用明显,游戏可玩性也大幅上升。到2005年,GPU芯片产量颇高,其价格便降了下来。2009年,吴恩达(Andrew Ng)(译者注:华裔计算机科学家)以及斯坦福大学的一个研究小组意识到,GPU芯片可以并行运行神经网络。
这一发现开启了神经网络新的可能性,使得神经网络能容纳上亿个节点间的连接。传统的处理器需要数周才能计算出拥有1亿节点的神经网的级联可能性。而吴恩达发现,一个GPU集群在一天内就可完成同一任务。现在,一些应用云计算的公司通常都会使用GPU来运行神经网络,例如,Facebook会籍此技术来识别用户照片中的好友,Netfilx也会依其来给5000万订阅用户提供靠谱的推荐内容。
2 大数据
每一种智能都需要被训练。哪怕是天生能够给事物分类的人脑,也仍然需要看过十几个例子后才能够区分猫和狗。人工思维则更是如此。即使是(国际象棋)程序编的最好的电脑,也得在至少对弈一千局之后才能有良好表现。人工智能获得突破的部分原因在于,我们收集到来自全球的海量数据,以给人工智能提供了其所需的训练。巨型数据库、自动跟踪(self-tracking)、网页cookie、线上足迹、兆兆字节级存储、数十年的搜索结果、维基百科以及整个数字世界都成了老师,是它们让人工智能变得更加聪明。
3 更优的算法
20世纪50年代,数字神经网络就被发明了出来,但计算机科学家花费了数十年来研究如何驾驭百万乃至亿级神经元之间那庞大到如天文数字一般的组合关系。这一过程的关键是要将神经网络组织成为堆叠层(stacked layer)。一个相对来说比较简单的任务就是人脸识别。当某神经网络中的一组比特被发现能够形成某种图案——例如,一只眼睛的图像——这一结果就会被向上转移至该神经网络的另一层以做进一步分析。接下来的这一层可能会将两只眼睛拼在一起,将这一有意义的数据块传递到层级结构的第三层,该层可以将眼睛和鼻子的图像结合到一起(来进行分析)。识别一张人脸可能需要数百万个这种节点(每个节点都会生成一个计算结果以供周围节点使用),并需要堆叠高达15个层级。2006年,当时就职于多伦多大学的杰夫·辛顿(Geoff Hinton)对这一方法进行了一次关键改进,并将其称之为“深度学习”。他能够从数学层面上优化每一层的结果从而使神经网络在形成堆叠层时加快学习速度。数年后,当深度学习算法被移植到GPU集群中后,其速度有了显著提高。仅靠深度学习的代码并不足以能产生复杂的逻辑思维,但是它是包括IBM的沃森电脑、谷歌搜索引擎以及Facebook算法在内,当下所有人工智能产品的主要组成部分。
这一由并行计算、大数据和更深层次算法组成的完美风暴使得持续耕耘了60年的人工智能一鸣惊人。而这一聚合也表明,只要这些技术趋势继续下去——它们也没有理由不延续——人工智能将精益求精。
随着这一趋势的持续,这种基于云技术的人工智能将愈发成为我们日常生活中不可分割的一部分。但天上没有掉馅饼的事。云计算遵循收益递增(increasing returns)[4]法则,这一法则有时也被称为网络效应(network effect),即随着网络发展壮大,网络价值也会以更快的速度增加。网络(规模)越大,对于新用户的吸引力越强,这又让网络变得更大,又进一步增强了吸引力,如此往复。为人工智能服务的云技术也遵循这一法则。越多人使用人工智能产品,它就会变得越聪明;它变得越聪明,就有越多人来使用它;然后它变得更聪明,进一步就有更多人使用它。一旦有公司迈进了这个良性循环中,其规模会变大、发展会加快,以至于没有任何新兴对手能望其项背。因此,人工智能的未来将有两到三家寡头公司统治,它们会开发出大规模基于云技术的多用途商业智能产品。
1997年,沃森电脑的前辈、IBM公司的深蓝电脑在一场著名的人机大赛中击败了当时的国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)。在电脑又赢了几场比赛之后,人们基本上失去了对这类比赛的兴趣。你可能会认为故事到此就结束了,但卡斯帕罗夫意识到,如果他也能像深蓝一样立即访问包括以前所有棋局棋路变化在内的巨型数据库的话,他在对弈中能表现得更好。如果这一数据库工具对于人工智能设备来说是公平的话,为什么人类不能使用它呢为了探究这一想法,卡斯帕罗夫率先提出了“人加机器”(man-plus-machine)比赛的概念,即用人工智能增强国际象棋选手水平,而非让人与机器之间对抗。
这种比赛如今被称为自由式国际象棋比赛,它有点儿像混合武术对抗赛,选手们可以使用任何他们想要用的作战技巧。你可以单打独斗;也可以接受你那装有超级聪明的国际象棋软件的电脑给出的帮助,你要做的仅仅是按照它的建议来移动棋子;或者你可以当一个卡斯帕罗夫所提倡的那种“半人半机”的选手。半人半机选手会听取人工智能设备在其耳边提出的棋路建议,但是也间或不会采用这些建议——颇似我们开车时候用的GPS导航一般。在接受任何模式选手参赛的2014年自由式国际象棋对抗锦标赛上,纯人工智能的国际象棋引擎赢得了42场比赛,而半人半机选手则赢得了53场。当今世上最优秀的国际象棋选手就是半人半机选手Intagrand,它是一个由多人以及数个不同国际象棋程序所组成的小组。
但最令人惊讶的是:人工智能的出现并未让纯人类的国际象棋棋手的水平下降。恰恰相反,廉价、超级智能的国际象棋软件吸引了更多人来下国际象棋,比赛比以前增多了,棋手的水平也比以前上升了。现在的国际象棋大师(译者注:国际象棋界的一种等级)人数是深蓝战胜卡斯帕罗夫那时候的两倍多。现在的排名第一的人类国际象棋棋手马格努斯·卡尔森(Magnus Carlsen)就曾接受人工智能的训练,他被认为是所有人类国际象棋棋手中最接近电脑的棋手,同时也是有史以来积分最高的人类国际象棋大师。
如果人工智能能帮助人类成为更优秀的国际象棋棋手,那么它也能帮助我们成为更为优秀的飞行员、医生、法官以及教师。大多数由人工智能完成的商业工作都将是有专门目的的工作,严格限制在智能软件能做到的工作之内,比如,(人工智能产品)把某种语言翻译成另一种语言,但却不能翻译成第三种语言。再比如,它们可以开车,但却不能与人交谈。或者是能回忆起YouTube上每个视频的每个像素,却无法预测你的日常工作。在未来十年,你与之直接或者间接互动的人工智能产品,有99%都将是高度专一、极为聪明的“专家”。
实际上,这并非真正的智能,至少不是我们细细想来的那种智能。的确,智能可能是一种倾向——尤其是如果我们眼中的智能意味着我们那特有的自我意识、一切我们所有的那种狂乱的自省循环以及凌乱的自我意识流的话。我们希望无人驾驶汽车能一心一意在路上行驶,而不是纠结于之前和车库的争吵。医院中的综合医生“沃森”能专心工作,不要去想自己是不是应该专攻英语。随着人工智能的发展,我们可能要设计出一些阻止它们拥有意识的方式——我们所宣称的最优质的人工智能服务将是无意识服务。
我们想要的不是智能,而是人工智慧。与一般的智能不同,智慧(产品)具有专心、可衡量、种类特定的特点。它也能够以完全异于人类认知的方式来思考。这儿有一个关于非人类思考的一个很好的例子,今年三月在德克萨斯州奥斯汀举行的西南偏南音乐节(South by Southwest festival)上,沃森电脑就上演了一幕厉害的绝技:IBM的研究员给沃森添加了由在线菜谱、美国农业部(USDA)出具的营养表以及让饭菜更美味的味道研究报告组成的数据库。凭借这些数据,沃森依靠味道配置资料和现有菜色模型创造出了新式的菜肴。其中一款由沃森创造出的受人追捧的菜肴是美味版本的“炸鱼和炸薯条”(fish and chips),它是用酸橘汁腌鱼和油炸芭蕉制成。在约克城高地的IBM实验室里,我享用了这道菜,也吃了另一款由沃森创造出的美味菜肴:瑞士/泰式芦笋乳蛋饼。味道挺不错!
非人类的智能不是错误,而是一种特征。人工智能的主要优点就是它们的“相异智能”(alien intelligence)。一种人工智能产品在思考食物方面与任何的大厨都不相同,这也能让我们以不同的方式看待食物,或者是以不同的方式来考虑制造物料、衣服、金融衍生工具或是任意门类的科学和艺术。相较于人工智能的速度或者力量来说,它的相异性对我们更有价值。
实际上,人工智能将帮助我们更好地理解我们起初所说的智能的意思。过去,我们可能会说只有那种超级聪明的人工智能产品才能开车,或是在“危险边缘”节目以及国际象棋大赛中战胜人类。而一旦人工智能做到了那些事情,我们就会觉得这些成就明显机械又刻板,并不能够被称为真正意义上的智能。人工智能的每次成功,都是在重新定义自己。
但我们不仅仅是在一直重新定义人工智能的意义——也是在重新定义人类的意义。过去60年间,机械加工复制了我们曾认为是人类所独有的行为和才能,我们不得不改变关于人机之间区别的观点。随着我们发明出越来越多种类的人工智能产品,我们将不得不放弃更多被视为人类所独有能力的观点。在接下来的十年里——甚至,在接下来的一个世纪里——我们将处于一场旷日持久的身份危机(identity crisis)中,并不断扪心自问人类的意义。在这之中最为讽刺的是,我们每日接触的实用性人工智能产品所带来的最大益处,不在于提高产能、扩充经济或是带来一种新的科研方式——尽管这些都会发生。人工智能的最大益处在于,它将帮助我们定义人类。我们需要人工智能来告诉我们,我们究竟是谁。
以上就是关于数据库关系有什么性质全部的内容,包括:数据库关系有什么性质、MySQL数据库中建表字段性别(sex)的类型、怎样查询税号真伪等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)