深度学习是这么一个过程,它将节点分解为输入层、输出层以及中间的隐藏层,且同一层之间的节点不能相连,只能与相邻层的节点相连。
如果我们将输入层的序号定为0而将输出层的序号定位N,那么节点也可以赋予一个序号列,记为$x_{i,n}$,其中n表示层的序号,i表示x在层中的序号。激活函数记为f,连接权重记为$\omega^i_{i,n}$,表示从n层的第i个节点连接到n+1层第j个节点的连接。这样一个多层神经网络中的数据流转过程就可以记为下述方程:
这里采用Einstein约定,相同指标自动求和。
上述方程可以通过如下符号形式改写:
我们将原来层内指标i改记为x,每个节点的输出值从x改记为$\phi$,层序号用t标记,连接权重改成了函数G。
这只是符号的改变,意义并没有发生丝毫变化。
但这个方程的形式却值得玩味,因为如果忽略激活函数f,那么下述方程的形式其实是量子力学中用两点关联函数(Green函数)改写的离散本征态系统的波函数演化方程:
因此,一个很直接的想法,就是如果x是连续,会怎么样?
也即,如果我们将离散的每一层节点构成的空间,连续化为一维空间,会得到什么?
答案很直接:
第二步直接取了反函数,这对于sigmoid激活函数来说不成问题,但对于ReLU激活函数来说恐怕不能这儿干,因为其在负半轴是常值函数0,反函数不存在。对于基于ReLU改造的Swish激活函数也不好用,因为它在负半轴非单调,会出现双值,所以也没有反函数。
因此,这个写法颇为形式性。
对空间(神经元节点指标)的连续化挺“顺利”的,如果我们忽略反函数不存在所带来的问题的话。
而对于时间(神经元层指标)的连续化则有点麻烦。
我们先来对上面的结果做一些形变:
然后就可以做很强硬的形式上的连续化:
这里其实就等价于引入了一个隐形的归一化条件:
或者可以写得对激活函数更加“普适”一点:
更准确地说,由于这里无论是节点输出值$\phi$还是激活函数f还是两点连接函数G,都是已知的,所以上式的归一化要求事实上是对G的一次归一化调整,即:
我们可以取归一化调整之后的两点连接函数为新的两点连接函数,从而有最终的运动方程:
从形式上来说,可以看做是非相对论性哈密顿量显含时的薛定谔方程,或者,更加类似的其实是热扩散方程(因为没有关键的虚数单位i)。
我们可以将两点关联函数做一个分离。两点关联函数我们归一化到1,那么此时动力学方程为:
对最后的方程再做一次形变:
由于现在两点关联函数是归一化的,我们可以很任性很形式化地认为它是运动项与非定域的包含了波函数与波函数的动量项的非定域势(原因下面会说),而后面减掉的那一项则可以认为是一个定域的势能项与质量项的结合。
让我们对比一下非相对论性薛定谔方程:
是不是感觉形式上很像?
主要的区别就在于中间的积分那一项。
所以下面我们就来处理这一项。
将积分的部分做一下形变(同时我们这里直接取层内指标为坐标的形式,从而为矢量):
其中,第一步是将全空间分解为一系列以x为圆心的同心球,第二步中的$\vec n$是同心球上的单位径向量,第三步利用了Stokes定理,第四到第六步则利用了D维空间中的散度的特性。
最后的结果,第一部分是一个径向梯度,加上一个中心势,从而就是前面所说的“运动项与非定域的包含了波函数与波函数的动量项的非定域势”。
接下来,我们取无穷小曲面,即r只在0的邻域范围内,宏观范围的两点关联函数为0,这么一种特殊的情况,其对应的深度神经网络稍后再说,那么此时就有:
假如我们取G的对称部分为$\hat G$而反对称部分为$\tilde G$,则有:
第二部分,将G看做是一个Finsler度量函数,从而这里给出的就是Finsler度量下的二阶微分算符$\nabla^2_G$,乘上一个Finsler度量下指标球相关的常数系数$g_G$。
而第一项则是Finsler度量的反对称部分诱导的类纤维丛联络与波函数梯度的矢量积,乘上另一个指标球相关的常数系数$A_G$。
这方面可以看以前写的老文: 《从弱Finsler几何到规范场》 。
因此,在无穷小连接函数的约束下,上面的方程就是:
形式上是不是很简洁?
而每一项的意义也都明确了:
连接系数给出了Finsler度量,其反对称部分给出了类似纤维丛联络的规范力,其全局变更给出了类时空曲率变化的引力;而激活函数要求的连接系数的归一化系数则是时空上的全局势。
因此深度神经网络的整个学习过程,就是通过输入与输出的散射矩阵,来逆推整个时空的Finsler联络和全局势。
所谓的无穷小邻域内才有效的两点关联函数,在连续化之前,其实对应的就是卷积神经网络中的最小卷积核(33卷积)。
假如我们继续引入卷积神经网络的另一个要求,即卷积核是同一层内相同的,那么就等于将Finsler度量限定为只是时间t的函数:
很明显,整个结构被简化了许多。
如果这个卷积网络还是所有层都共享参数的,那么等于把上述方程中的时间t也取消了,那就更简单了。
而假如我们取激活函数为f(x)=nx,那么就等于取消了全局势。最关键的是,如果两个这样的函数在原点处拼接起来,得到的也是取消全局势的激活函数,这样的激活函数中最著名的就是ReLU函数了,其在负半轴(当然$\phi$的取值也不可能到负半轴……)$\Gamma$恒为0,而在正半轴$\Gamma$恒为1,从而等效的势能函数V恒为0。
从而,ReLU对应的可以认为就是某Finsler时空中的“自由”量子系统或者“自由”热扩散系统了,吧…………
对于不是无穷小邻域的情况,其实可以通过无穷小邻域的情况在有限区间内做积分来获得,从而实际上是一个关于一阶与二阶导的非定域算符。
同样的,残差网络引入了不同间隔的层之间的连接,可以看做是将原本对时间的一阶导替换为一阶导的(时间上)非定域算符。
至于说循环神经网络,因为引入了与层数n不同的“时间”,所以这里暂不考虑——或者可以认为是引入了虚时间???
如果我们采用量子场论的视角(虽然很显然不是量子场论),那么深度学习的就是这么一个过程:
首先,我们通过实验知道系统的初态(输入层)与末态(输出层的目标值),而我们不知道的是系统所处的时空的度量(连接系数)与时空上的势能(激活函数)。
于是,我们通过大量的实验(通过大量输入与输出的学习素材)来分析这个时空的特性,通过选择恰当的系统能量函数(Hinton最早给出的RBM与热统中配分函数的相似性,用的就是一维Ising模型的能量函数来类比输出层的误差函数),使得整个系统的最低能态对应的时空就是我们要找的目标时空——这个也容易理解,时空上的测地线一般就是最低能态,而测地线在有相互作用的时候对应散射矩阵,散射矩阵刻画的就是末态与初态的关联,所以反过来知道末态初态就可以设法找出散射矩阵,从而可以设法得到测地线,从而可以设法获得测地线为最低能态的时空,从而得到时空的属性,这个逻辑很合理。
最终,我们利用找到的时空来预测给定初态对应的末态——利用神经网络学习到的结果来进行预测与应用。
所以,训练神经网络的过程,完全可以看做是物理学家通过实验结果来反推时空属性的过程。
很科学。
最后需要说明的是,虽然上面的推导很High,但实际上对于我们解决神经网络的学习这类问题来说,一点帮助都没有。
充其量,只能算是换了一个角度看待神经网络,吧…………
本文遵守 创作共享CC BY-NC-SA 40协议
宇宙到底是什么?其由什么构成?
曾经不止一次地看到过这样一个观点:宇宙就是一个庞大的生命体,其中所有物质都是其细胞和其他构成。
这看上去像是一个根据人类对生命发展演变研究而来的观点,只是很多年宇宙起源与本质的一种猜测。当然,没有人会评判这个猜想的真假,因为 目前谁都没有正确答案。 就像现在,就有物理学家认为宇宙本身就是一个巨大的神经网络。
去年8月份,美国物理学教授 文维塔利·范丘林(Vitaly Vanchurin) 在预打印服务器arxiv上发布了一段关宇宙的惊人言论。在名为《作为神经网络的这个世界》这篇论文中,范丘林打破了以往学界主流观点中的宇宙形成,重新定义了宇宙的本质, 认为宇宙本身就是一个巨大的神经网络。
说实话,刚看到这个观点时候,脑子里冒出来的第一个想法就是:提出这个观点的是人确定一名物理学家?
这并非完全否认此观点的正确性,而是这个观点确实 冲击了现实世界存在的本质可能, 有些难以想象。就拿人的大脑来说,如果宇宙在基本层面上是一个神经网络,那么宇宙中各种的物质就成了这个网络的组成部分,可能是代表其某一个功能的“树突”,这个“树突”难道就是各个类似于室女座那样的超星系团?
范丘林的观点该怎么理解呢?其实我们可以不用像上面的例子那样将其观点太过具象化,而是 将宇宙和神经网络运行理念进行结合。
神经网络的中一切活动,我们看作是量子或者原子的运动表现,符合经典的量子力学计算法则;非常明显的,在宇宙中, 所有空间的物质运动挪用量子力学观点的的话同样适用。
反过来, 神经网络部分原理可以用来描述宇宙实际的物理运行变化, 不管是用来推敲一个星系的运行的规律,还是研究一个超星系团的构成,都可以和神经网路的某些通路解释对上。
这么来理解的话,似乎也能将宇宙和生命体之间的存在的联系解释出来。那么宇宙和生命的形成又是否存在共性呢?
从物质组成上看,世间万物我们都已将其看作是一颗 原子 ,这么说来 万物的本质都是以一样的, 只是后期的组合方式不同引起不同形态偏差。
正如部分人想象的那样, 宇宙是个巨大的细胞或者生命体,我们都是这个细胞内的物质或者微生物。 而根据题目中观点,再结合现代 科技 下观测到的宇宙形态,我们也不难想象到其中的联系。
比如曾在2012年《自然》6月刊杂志上发布的一篇关于大脑神经和宇宙结构的构成对比的论文。生命的神经元和神经间质之间的影响和构成关系,正同宇宙星体构成星系团的过程及其相似。
总的宇宙形态 看上去就像是由一个个圆形的星际物质构成的网状物, 和大脑神经元系统的构成几乎一模一样。
这样的现象一时之间不知道到底应该感叹造物主的神奇,还是感叹宇宙或者生命的奇妙?所以,宇宙有没有可能真的就是一个巨大的神经网络?如果宇宙真的是活的,那人类又是什么?
从宇宙是个神经网络的观点来说看的话,宇宙就是活的,它的诞生就像是一个生命细胞的出现,随着细胞分裂(宇宙大爆炸)、物质或能量重组(星球诞生)、物质成型(星系运动变化)和生命成熟(宇宙“神经元”构成)等, 就像是一个完整的生命出现的机制。
而恰巧, 大脑中有1000亿个神经细胞, 每个神经细胞又会延伸出2000到数万个不等的“树突”连接。生命体中所有物质组成部分从根上说就是同一种原子构成,后面形成了不同的组织, 这就对应这宇宙空间中不同形态的星球和星系, 那人类在其中的分量几乎就可以忽略不计了。
从生命体本身异同上来说,虽然所有部分都受到心脏或者大脑的控制,但同时各个部分又有各自的不同功能表现, 既有统一,又有差异; 宇宙也正是这样,太阳系、银河系再到超星系,既可以拆分出来独立研究,也能将其作为一个整体观测。
而当中出现的某些精密的运行法则,不论是计算物质最小的幺米(ym)还是宇宙最大的天文单位,皆可利用固定论法则计算。
当然,关于宇宙是个巨大的神经网络这个观点 并没有那么被科学界完全接受, 也并不存在更多的现实证明,只能说在理论上,宇宙和神经元的确 有相似的重合规律。
首先什么是逻辑;2007年,Mossakowski等人评论说:“对于‘逻辑’没有一个被广泛接受的正式定义,这很令人尴尬。”那就读读费曼的这篇文章;“如果你认为你了解量子力学,那你根本就不了解量子力学。”然后读一读韦氏词典对逻辑的定义;思考某事的适当或合理的方式。这句话来自维基百科上的量子力学"量子力学有很多数学上等价的公式"
所以逻辑没有很好的定义,QM的发明者认为它不是逻辑的,你不能把逻辑与常识或直觉分开——根据字典。QM并不是一个,而是无数个等价的公式。真的像看起来那么无望吗。我认为不是。
我最初是通过一个朋友认识量子力学的,他在帝国理工学院开始攻读理论物理学博士学位,和他一起的不是别人,正是阿卜杜勒·萨拉姆本人。他一开始很困惑,告诉我;我们被告知,找出粒子是什么或它是如何形成的并不重要——只要我们有一种工具,可以预测粒子的一切行为。这就是所有歧义的来源。QM一开始是一种“曲线拟合”过程或“数学建模”过程——以使已知的物理结果有意义,而这些结果与当时现有的工具不同。导致物理学家放弃了直线的路径而寻找捷径。但是,如果我们试图用普通物理学来描述最终模型的元素,我们无疑会面临真正的困难。
我最初是通过一个朋友认识量子力学的,他在帝国理工学院开始攻读理论物理学博士学位,和他一起的不是别人,正是阿卜杜勒·萨拉姆本人。他一开始很困惑,告诉我;我们被告知,找出粒子是什么或它是如何形成的并不重要——只要我们有一种工具,可以预测粒子的一切行为。这就是所有歧义的来源。QM一开始是一种“曲线拟合”过程或“数学建模”过程——以使已知的物理结果有意义,而这些结果与当时现有的工具不同。导致物理学家放弃了直线的路径而寻找捷径。但是,如果我们试图用普通物理学来描述最终模型的元素,我们无疑会面临真正的困难。
我最初是通过一个朋友认识量子力学的,他在帝国理工学院开始攻读理论物理学博士学位,和他一起的不是别人,正是阿卜杜勒·萨拉姆本人。他一开始很困惑,告诉我;我们被告知,找出粒子是什么或它是如何形成的并不重要——只要我们有一种工具,可以预测粒子的一切行为。这就是所有歧义的来源。QM一开始是一种“曲线拟合”过程或“数学建模”过程——以使已知的物理结果有意义,而这些结果与当时现有的工具不同。导致物理学家放弃了直线的路径而寻找捷径。但是,如果我们试图用普通物理学来描述最终模型的元素,我们无疑会面临真正的困难。
模型构建依赖于输入和输出,而不关心中间发生了什么——这就是黑盒术语。最好的例子是神经网络类型模型。这样的模型是由成千上万的行节点连接在一起组成的。每个节点几乎不能增加,但这个盒子能比最好的工程师更准确地指出燃气轮机的问题。如果您现在尝试将节点与问题的各个部分相关联,那么您将遇到不可能的情况。这个问题没有魔法——一切都是合乎逻辑和常识的,但这个任务仍然是不可能的。
除了建模工具,QM依赖于能量和概率论证,这两者都是我所谓的“粗率方法”,就像建模不关心开始和结束之间的中间过程。如果有许多条通往山顶的道路,能源争论会告诉你,你需要同样的汽油才能通过其中任何一条(忽略摩擦)。那么,我能否得出这样的结论:大自然真的不在乎我走哪条路才能登顶不是的,因为如果你发现除了汽油,比如磨损,还有其他的因素需要担心,那么你走哪条路就会有很大的不同。
除了建模工具,QM依赖于能量和概率论证,这两者都是我所谓的“粗率方法”,就像建模不关心开始和结束之间的中间过程。如果有许多条通往山顶的道路,能源争论会告诉你,你需要同样的汽油才能通过其中任何一条(忽略摩擦)。那么,我能否得出这样的结论:大自然真的不在乎我走哪条路才能登顶不是的,因为如果你发现除了汽油,比如磨损,还有其他的因素需要担心,那么你走哪条路就会有很大的不同。
QM依赖于运营商。它们用变量对坐标的导数替换变量。似乎没有多少人意识到这意味着一种转变。这就是你的空间距离,速度等等不是正规的而是它们的变换对应项。只有反向转换才能恢复原始变量。Heaviside发明的d算子方法有一个类似的例子。他把代数变量的导数当作新代数变量来处理。他最后得到了一个代数。
如何回答人的意识是哪儿来的?有两种截然不同的回答,代表对立的两条哲学路线,代表两种各自相互独立的哲学上的党派性。恩格斯明确指出,全部哲学,特别是近代哲学的重大的基本问题,是思维和存在的关系问题。为什么这么说呢?怎么样理解这句话?这就是区分唯物主义和唯心主义的界限和分水岭,世界的本质是精神的,还是物质的?承认物质第一性、精神第二性,世界统一于物质,这是唯物主义;认为精神第一性,物质第二性,世界统一于精神,则是唯心主义。列宁提出存在着两条对立的认识路线:从物到感觉和思想呢?还是从思想和感觉到物?后者否认思想和感觉的客观基础,认为物质是思想和感觉的产物,世界是人的表象。所谓从物到感觉和思想,是唯物主义认识路线,认为人的感觉、思想、意识是对物的反映。意识是人的大脑的属性,是物质高度发展的产物,感觉和意识是人脑对世界的反映,感觉本身不是物质,是客观世界转化主观意识的中间环节,作为认识主题,通过感性认识,经过眼耳鼻舌身及嗅觉、味觉、触觉、视觉、听觉和第六感觉,身临其境,在为生存生活的现实、实践活动的 社会 环境中,受到影响得到反映,渗透到大脑意识中来,经过大脑加工处理形成意识或思想。 社会 实践活动具有主观见之于客观的特点,具有直接的现实性,是形成意识和思想的基础。人类意识的产生,是同语言与思维一起,从猿到人的进化与劳动中过程中,通过三百多万年的、从古猿到直立行走的类人猿,再经过三百多万年,直立人制造工具,钻木取火,其大脑容量扩大、身体物理生物生理特征,更加接近我们人类。在这里,猿人聚集行动,为了生存需要制造工具,劳动是猿转化为人的根本动力,是人和动物区别的根本标志。猿人的劳动是大脑意识形成与进化成为人的大脑意识的根本的实践基础。
瞌睡家不揣浅陋,聊一聊个人的理解,以待有识之士。“意识”这个词本源上是佛教词汇,是佛教传入中国之后产生的。
按照佛教的世界观,我们人类有“眼、耳、鼻、舌、身”再加上一个会思考的大脑佛教中称为“意”的一共六种感受器官,称之为 “六根” 。与其相对应的,世界有又有六种特性可以被这“六根”所感受,分别是“色、声、香、味、触、法”,称之为 “六境” 或者 “六尘”。 这六根在内,六尘在外,共同作用下产生了 “ 六识 ”。 因为六根、六尘是识产生的基础,所以又合称 “十二入”。
所谓 “识” , 意思是依于尘境而其分别 ,简单说 就是明了识辨事物的功能,与六根、六尘分别对应为“眼识、耳识、鼻识、舌识、身识、意识”,称之为 “ 六识 ”。
注:这里说的“六根”“六境”“六识”合称“十八界”,是佛学中的重要概念。
所谓 “意识” ,我们常说是“第六识”,也不过是“六识”之一。要理解“意识”是哪里来的,可以参考其他五识。眼根若对色尘,即生眼识;耳根若对声尘,即生耳识;鼻根若对香尘,即生鼻识;舌根若对味尘,即生舌识;身根若对触尘,即生身识。也就是眼睛的视觉能力,耳朵的听觉能力,鼻子的嗅觉能力,舌头的味觉能力,身体的触觉能力。我们很容易理解这五种感官能力是生理构造上的原因形成的,没有什么太过神秘的。但是这个“意识”,一般人很难理解。实际上前五识感受的都是外部世界,而意识是我们的大脑也就是意根对着这感受的分析,就像计算机能计算,大脑也能分析,所以意识也是一种生理功能。
因为我们普遍的把“意识”当成了我们自己,甚至是连“识”都不管了,直接把“意”当做了我们自己。我们自己如何理解我们自己?“意”在我们看来就是心念,就是你心里那个旁白,也可能是一种声音,一个画面。这个在你脑子里不停讲话翻来覆去的家伙绝不是你自己。很简单就可以证明,你大多数时候做不到不让它讲话,也做不到不让它出现。如果它是你的话,你怎么控制不了它?这个“意”就像是你眼睛里的色彩,耳朵里的声音,当它也是你的一种感受,不过是以念头的形式出现。而深藏在幕后的那个你能够分辨哪个意念是好的,哪个意念是坏的,哪个意念是你想要的,哪个意念是你讨厌的,这个动作就是“识”。对你自己的意念的分别和分辨,就是“识”。这两种状态合并在一起就是“意识”。
“意”不是你自己,“识”也不是你自己。观音菩萨“行深般若菠萝蜜多时”能够照见“五蕴皆空”,能够断六根,绝六尘,能够无“眼界”乃至无“意识界”,最终可以远离颠倒梦想究竟涅槃。能够认清这个“第六识”的意识,也不是很容易的。
意识从哪儿来?这个问答说了很多次了。不太想说了。
意识是人脑的“产物”;人脑“分泌物”---信息,量子信息,自然量子编码信息。
意识是人脑神经网络,量子神经网络的产物,量子神经网络拓扑空间上的,神经网络张量上的经验函数空间,泛函空间。
人类习得的每一个经验,都是人脑神经网络上,一条信号的量子干涉路径,形成的量子信号路径函数。这个经验是以泛函形式,存储在整个神经网络拓扑上。人的意识是量子信息,将量子信号路径函数“编码”在大脑神经网络拓扑上。
人的意识每次产生,都将形成大脑神经网络上的一次拓扑形变,一个神经网络张量空间上的一个变换,一个流形“划过”。
人的意识是整个大脑整体运行,拓扑形变的结果,没有所谓的脑细胞运用了百分之多少一说。什么爱因斯坦只用了其大脑的10%、5%,这都是神棍在哪骗人瞎说!
人的意识是量子信息过程。人的梦境是人的潜意识海,量子叠加态信息。人清醒状态的意识是量子本征态信息。这里又分为两种模:实波量子干涉信号和几率波量子干涉信号。
实波量子干涉信号是大量粒子(电子、离子、光子)流,通过脑细胞的离子通道,形成的实波量子干涉信号;就是人的正常交往、管理信号和经验信号。
几率波量子干涉信号是单个或若干个粒子流,通过脑细胞的离子通道,形成的几率波量子干涉信号---狄拉克单量子干涉信号;就是人的抽象思维状态。
生命体的意识到底是哪来的你要真想知道答案,那么让我告诉你,它是从生命的夲体中来的。这并不是问题的关键,意识的出现也不是关键,关键是你如何认识这个本体。
你要是认为你这个物质的身体夲身就是夲体,那么正如传统的科学家所说的,你就是你大脑中的电波,数据和苻号。这些电波,数字和符号通过你感官的反映不断地产生着意识。而一旦你物质的身体死亡,那些依附大脑构造而产生出来的电波,数据和符号也将随之消失,意识也就无处可来,当然也就不存在了。
反之,你如果认为你生命的夲体,是目前科学家还没有证实到的,是与物质的身体共存的,非物质的夲原的话,那么,这个夲体也同样会随着你感官的反映不断地产生着意识,你的意识也就出现了。即使你物质的身体死亡之后,你那非物质的本体也将独立地存在,并随缘而进入不同时空的境界或生物体内,循环往复,不断进化,直到永远……。
想要求证这一点,目前从量子及弦理论上,从波粒二象性的分折中己可见端倪,但离真正发现宇宙的秘密和真相,十万八千里还多一点。
无生物转化为有生物,同时无生物能量就转化为有生物能量。生物能量的运动形态就是"意一一反应";"识一一认知"。两种运动功能相结合,就是意识。所以,意识是生物能的表现形弍,它是无生物原素,如碳、氮、氧、磷、硅等在地球这样自然环境中,通过水、温度、阳光、运动形态和时间等条件下逐渐化合,转化成氨基酸、蛋白质,结成有意识运动形态的原子团、分子团、细胞体,发展成单细胞生物、多细胞生物,发展成植物、动物;経过数亿年的发展,形成人类的恼细胞、恼神经细胞而产生人们意识运动。这种意识的渊源已经被科学家的试验研究证明了的。但是要解开人脑几千亿颗人脑不同的分子、原子团、细胞团的运动规律之迷,还需经过科学研究的长期艰苦的 探索 过程,总有一天人类能够自己认识自己,完全掌握生物能的应用,向宇宙人类发展。但是这种生物能的存在,已经为地球上生物的生存活动,所完全证明了的。比如如果没有生物能、氨基酸、蛋白质就不能自然生存;单细胞生物就不能生生灭灭:植物就不能反应春秋; 动物就不能径过基因传承,这就是最有力的事实证明啊!
意识这个课题,是困扰当今科学家和哲学家的一个近乎于无解的课题。这涉及到对世界的一个根本认识的问题,从古至今基本上就是分为两大观点,一个是唯物论,一个是唯心论,现代科学基本上是建立在唯物论的基础之上,而我们从小接触最多的哲学观点是辩证唯物论。在量子力学的兴起以后,量子的不确定原理,引发了哲学界更大的争论,很多科学家都认为意识是独立存在的,意识与物质之间是相互影响。如果再加入多维空间的理论,那么意识就可以看作是一个多维空间存在的物质驱动程序!用常用的电脑做例子,硬件好比人的身体,意识就是各个硬件的驱动程序, *** 作系统就是不同纬度空间的界面,应用程序就是在这个空间个性化功能展示!
人的意识从何而来呢?上帝为什么选择了人类而非其它物体?为何又让意识的个人载体速朽?
其实,这里有个脑洞,意识是本来就有的,正如最近被证明了的“知识不是学习得来的,而是先天存在于人脑之意识中的。学习,只是在内部掘矿的过程”一样。
意识先于人类存在,因意识需要投射至具体形态以作载体,且需要具态主动来契合意识,去主动靠拢它并接受它王者般的垂顾投射,而非意识主动去靠拢具象。因为意识是上帝所生养的无比尊贵的公主,上帝按照意识所要求的既定尺寸与形状赋形完毕后,便给这个新创生命起了名字:人。
上帝的女儿便下嫁给了人类。
其它动物先于人类被创造出来,因其具态已成型,非与意识的特殊要求与身份相配,所以失去了意识投射与寄寓的机会与荣光。
人类以速朽的躯壳,承载金石般永生的意识,本是不配的,但在上帝的安排下,人类个体的繁衍又很好地解决了意识的传承问题。上帝为何不让个体永生?因为怕人类完成对意识的完全开发。
所以上帝只许人类个体以百年之期,而在此期内,是绝对无法完成彻底脑开发的,正如速度被绝对限制在光值以内。
准确的说,不是生命体的意识,应该是人的意识是怎么来的。生命处在人的状态时,人就产生了思想意识和思维,它们是怎么产生和发展存在的呢?生命体(不是灵魂)的觉知性与身体的眼耳鼻舌身的结合以后,对外界就开始了认识,认识的过程是先有概念,然后是判断,最后是推理。这样就不断的形成了系统文化,不同的判断产生了不同的理论,文化等,简单说认识的不同就产生了不同的意识,于是在人类的 历史 中沿续发展。意识没有生命体的觉知性和身体眼耳鼻舌身相结合就不可能产生存在。
这么重大的问题,因为不怕天下人耻笑,所以也来掺合两句,不一定准确。老子在道德经里讲,无,名天地之始,有,名万物之始。此两者同出而异名。在这里我们也应该明了了,世间的有无只是名相的不同!有无一体,没有分别!无就是有,有就是无。因此不必太执著有,因为有了还无,或者说有本身就是无。这里的无究竟指的是什么呢?其实它就是宇宙的本觉体性,在人它就是我们的灵知之性。在此,我们不拿物质来界定,因为如果物质能产生灵知之性,世界上的事就变得非常简单了。这种灵知之性,具有见所发识的本能!为什么不说见物发识,因为人们很容易把物和物质相混淆,在两千多年前人们应该还没有物质这一概念。这里的所,可以理解成东西的概念,不一定是物质的概念。注意,见所发识是人的本觉灵性的一种能力!可以用佛家的一句话,叫法尔自然。在大脑可以说只起网络的做用。在宇宙间有,声,光,味,嗅,触,法等现象。所以,可以得出结论,意识是人的本觉之性的能力。
导语
最先进的人工智能算法已经开始在探测星系的演化、计算量子力学波函数、 探索 新的化合物等领域施展拳脚。那么,还有没有那种无法自动化而只能由科学家完成的工作?
如今的物理学和天文学实验会产生海量的数据,已经没有人或团队能够跟进所有的这些数据了。其中一些数据每天以TB级的规模增加,而且这个趋势不会减弱。在二十一世纪 20 年代中期射电望远镜 Square Kilometer Arra 将投入使用,它每年产生的数据量和整个互联网的数据量一样多。
面对数据洪流,许多科学家开始求助于人工智能。只需要少量的人工输入,人工智能系统(如神经网络)就能够在数据海洋中漫游,识别异常,挖掘出人类尚未发现的模式。
当然,利用计算机来辅助科学研究的 历史 可以追溯到约 75 年前,然而人类几千年前就在手工调查研究数据来寻找其中的有意义的模式。但是,近期一些科学家认为以机器学习、人工智能为代表的新技术能以一种全新的模式去进行科研工作。其中一种被称为生成模型的方法,能从对观测数据的诸多解释中找到最可信的理论,更为重要的是,该方法在研究中无需预先编入对于系统可能起作用的物理过程。其拥护者认为,生成模型的创新程度足可以被视为理解宇宙的潜在的“第三种方法”。
在传统上,我们是通过 观测 来了解自然的。回想一下,开普勒就是通过研究第谷的行星位置表,辨识潜在的行星运行模式,才得以推断出行星是沿椭圆轨道运行的。同样的,科学可通过 模拟 来获得进步。一位天文学家可能会模拟银河系及其邻近的仙女座星系的运动,并预测它们将在几十亿年后碰撞。观测和模拟都有助于科学家生成假设,然后用进一步的观测来检验假设,而生成模型不同于这两种方法。
瑞士联邦理工学院的天文物理学家 Kevin Schawinski 也是一位生成模型的积极支持者。他认为:“ 生成模型是介于观测和模拟之间的第三种方法, 这是解决问题的另一种方式。”
Kevin Schawinski 是一名天体物理学家,他经营着一家名为 Modulos 的人工智能公司,他认为一种名为生成模型的技术提供了第三种了解宇宙的方式。
一些科学家仅仅把生成模型及其它新技术当作传统科研中的工具,但是大多数研究者都认为 AI 的影响力巨大,并且在科学研究领域会发挥越来越大的作用。费米国家加速实验室的天体物理学家 Brian Nord 使用人工神经网络来研究宇宙。他担心没有什么是不能通过自动化完成的事情,“这个推测倒是有点令人恐慌。”
来自“生成”的 探索
从研究生毕业时起,Schawinski 就因用数据驱动科学研究而闻名。在攻读博士学位期间,他面对的任务是,根据星系的外观数据对数千个星系进行分类。因为没有什么现成的软件能帮助他完成这项工作,他决定用众包的方式完成这项工作——于是,银河动物园(Galaxy Zoo)公民科学项目诞生了。
从 2007 年开始,普通的电脑用户只要记录下他们推测的星系最佳归类,就能帮助到天文学家。通过多数票胜出来判定,通常能带来正确的分类结果。
这是一个成功的项目,但 Schawinski 也注意到, AI 让这个模式过时了——今天,一个具有机器学习和云计算背景的天才科学家只需要花费一个下午就能完成这个工作。
在 2016 年,Schawinski 把目光投向了生成模型,这个强大的新工具。本质上来说,生成模型是在求解,当给定条件 X 和观测结果 Y 时,概率 P(X,Y) 有多大。这个方法已经被证明是非常有效的。
生成模型中最为著名的就是生成对抗网络(GAN)。经过充分的训练后,GAN 模型能够修复损坏和像素缺失的图像,也能让模糊的图像变得清晰。该模型通过竞争(对抗)来学习推断缺失的信息,这个神经网络的一部分被称作生成模型(generator):生成虚拟的数据;另一部分被称为判别模型(discriminator):把生成出来的虚假数据和真是数据分割开来。两个部分交替训练,逐步优化(类似于博弈)。
或许,你已经看过最近流传甚广的GAN生成的假面孔。正如那个标题所言“这些人并不存在却又真实得吓人”。
上面看到的脸孔都不是真实的,上面的 A 列,和左侧的 B 列都是由生成对抗网络(GAN)使用真实的面部元素构建的。然后,GAN 将 A 中的面部的基本特征(性别,年龄和脸形)与 B 中的面部的精细特征(头发颜色、眼睛颜色)相结合,构建出了上图表格中的所有人脸图像。
潜在空间
概括地说,生成模型获得数据(大多数是图像),并把他们分解成抽象的基本要素——科学家将其称为数据的“潜在空间”。算法能控制潜在空间中的元素,以此来探究这些元素如何影响原始的数据。这个方法有助于揭示该系统运作的物理过程。
潜在空间是一个抽象的难以想象的概念。不过我们可以做一个类比:当你在试图确定一个人脸的性别时,你的大脑可能在做什么呢?也许会注意到人的发型、鼻子的形状,甚至在运用一些你无法用言语描述的判断模式。同样的,计算机程序也在数据中寻找显著的特征。即便计算机并非不知道什么是性别,什么是小胡子,但如果我们提供给机器学习系统的数据集标注了“男性”和“女性”,并且一部分人还有一个标签叫“小胡子”,计算机能快速地推断出其中的关联性。
生成模型与星系演化
12月发表在《天文学与天体物理学》(Astronomy & Astrophysics)上的一篇论文中,Schawinski 与他在苏黎世联邦理工学院的同事 Dennis Turp 和 Ce Zhang 使用生成模型来研究星系在演化过程中所经历的物理变化。
因为他们使用的软件与 GAN 相似,但其在对潜在空间处理的技术与 GAN 有所差异,所以从技术角度来说这不是 GAN。他们的模型创建了人工数据集,去测试假设的物理过程。比如说,他们想知道恒星形成的“淬熄”(形成速率快速下降)与星系环境密度的增加之间的关系。
对 Schawinski 来说,关键问题是仅从数据中能挖掘出多少和恒星与星系演变相关的信息。“让我们忘却所有的关于天体物理学的知识。仅依靠数据本身,我们能在多大程度上重新发现这些知识?”
首先,星系的被压缩至他们的潜在空间,然后 Schawinski 在这个空间中调整元素,使其能对应上星系的特定环境变化,比如周围物质的密度。这样就有了一个假设生成器。通过重构这个星系,让大量原本处于低密度环境中的星系处于高密度环境中以此来看看带来了什么不同。
这三位研究者注意到随着星系从低密度环境走向高密度环境,它们的颜色会变得更红,恒星也变得更加集中。Schawinski 指出这一点与现有的星系观测相吻合,问题是,为什么会这样?
Schawinski 说,后续的工作还没有实现自动化,“人类必须参与其中,那么,什么样的物理原理可以解释这种效应?”对于这个过程,可能有两种解释,一是在高密度环境中,星系更红是因为其中包含了更多的尘埃;或者是因为恒星的形成减少了(换句话说,恒星更老了)。
现在有了生成模型,这两种思路都能接受检验。改变与与尘埃和恒星形成率相关的潜在空间元素,就能观测这种改变对星系颜色的影响。Schawinski 说:“答案很显然,星系更红是因为恒星形成率在下降,而不是因为尘埃。因此,我们应该采纳这个解释。”
利用生成模型,天体物理学家可以研究星系如何从低密度环境走向高密度环境,以及这些变化背后的物理原理。
生成模型相较于传统方式的优势
这种方法与传统的模拟方法相近,但与之有关键的差别。Schawinski 表示:“模拟本质上是由假设驱动的。也就是说,我们自认为已经洞悉了观测现象背后的物理法则。所以,我们把恒星形成规律、暗物质行为的原理等等这些我们自认为正确的假设放在一起,模拟运行。但是,模拟环境真的与实际情况吻合吗?”。他用生成模型所做的事情与模拟完全相反,“我们不知道任何事情,不做任何假设,我们希望数据本身能告诉我们可能会发生什么。”
生成模型在这项研究中取得的成功并不意味着天文学家和研究者就是多余的。但这似乎提醒研究者们——仅仅掌握了大量数据的人工智能系统就能够完成对天体物理学的学习。Schawinski 说:“这不是完全自动化的科学,但这意味着我们至少有能力去构建部分工具,使科学过程自动化。”
虽然生成模型非常强大,但这是否真的代表了一种新的科学研究方法还有待商榷。
对于纽约大学和 Flatiron 研究所的宇宙学家 David Hogg 来说,这项技术令人印象深刻,但充其量也只是一种从数据中提取模式特征的复杂方法——这是天文学家几个世纪以来都在做得事情。换而言之,这是观测、分析的高级形式。
和 Schawinski 相同,Hogg 的工作也充分应用人工智能;他一直在利用神经网络来对恒星进行基于光谱特征的分类,并使用数据启动的模型来推断恒星的其他物理属性。但是他认为他的工作和 Schawinski 的一样,都是经过检验的科学。Hogg 表示:“我不认为这是第三种方法。只是我们这个社群在对数据处理的方法上更加复杂而已。特别的是,我们越来越善于将数据与数据进行比较。但是依我看来,我的工作仍然是在做观测。”
人工智能:
勤奋而“难以捉摸”的科研助手
无论在概念上是否有创新性,人工智能和神经网络已经显然在当代天文学和物理学研究中发挥了关键作用。在海德堡理论研究所工作的物理学家 Kai Polsterer 领导着一个天体信息学小组,这个小组主要关注以数据为中心的天体物理学研究新方法。从星系数据集中提取红移信息曾经是一项艰巨的任务,而现在他们小组使用机器学习算法就能解决这个问题。
Polsterer 认为这些基于基于人工智能的新系统是“勤奋的助手”,可以连续处理数据数个小时而不抱怨单调无聊,不抱怨工作条件。这些系统可以完成所有枯燥乏味的繁重工作,研究者就能脱身去做“又酷又有趣的科学工作”。
Polsterer 警告说,这些系统并不是完美的,算法只能去做他们被训练过的事情,系统对输入的数据是“无感觉的”。给 AI 系统一张星系它可以估算其红移和年龄,但是你给同一个系统一张自拍照或者一张臭鱼烂虾的照片,它也会照方抓药估算出一个(错误的)年龄。Polsterer 认为,人类科学家的监督工作非常重要。工作还是要回到研究者身上,研究者才是要负责解释这些现象的人。
就这一点而言,费米实验室的 Nord 警告道,神经网络不仅要给出结果,也要给出相关的误差线,如果在科学研究中,你做了一个测量但没有报告相关的误差估计,就没有人会认真对待这个结果。
就像许多的人工智能研究员一样,Nord 也关注神经网络给出的结果的可解释性,通常来说,一个 AI 系统在给出结果时无法明确地表示出这个结果是如何获得的。
然而,并不是每个人都觉得结果不透明是一个必须关注的问题,法国CEA Saclay理论物理研究所的研究员 Lenka Zdeborová 指出,人类的直觉同样难以捉摸,给你看一张猫的,你能立刻认出这是一只猫,但是你并不知道你是怎样做到这一点的,从这个角度上来说,人的大脑就是个黑盒。
并不仅仅是天体物理学家和宇宙物理学家在向人工智能助力、数据驱动的科学研究发展。Perimeter 理论物理研究所和安大略滑铁卢大学的量子物理学家 Roger Melko 已经使用神经网络来解决该领域中的一些最棘手最重要的问题,例如多粒子系统的波函数的数学表示。
因为波函数的数学形式可能会随着它所描述的系统中的粒子数量呈指数级增长,这被 Melko 称为是“指数维度诅咒”,在这样的工作中 AI 就是不可缺少的组成部分了。
这个困难类似于在国际象棋和围棋中找到最好的走法:玩家会试图多看一步,想想对手会出什么招,然后再选择自己的最佳应对策略。但是随着思考步数的增加,复杂性也大为增加。
当然, AI 已经攻克了这两个领域。 1997 年 5 月 11 日, 深蓝计算机在国际象棋领域战胜了人类;2017年4月10日 ,AlphaGo 战胜了柯洁,AI 在围棋领域战胜了人类。Melko 认为,量子物理学也面临同样的问题。
机器的思想
无论是 Schawinski 所声称的他找到的是科学研究的“第三方法”,还是如 Hogg 所说的这“仅仅是传统上的观测和数据分析”。我们可以明确的是, AI 正在改变科学 探索 的方式并且在加速科学发现,值得探讨的是,这场 AI 革命在科学领域能走多远?
有时候,人们会对“人工智能科学家”的成就大肆褒奖。十年前,一个名叫亚当的 AI 机器人化学家研究了面包师傅的酵母的基因组,并找出了负责制造某种特定氨基酸的是哪些基因。(亚当观察缺少某些特定基因的酵母菌落,并与拥有这些基因的菌落的行为进行比较,由此找到差异完成研究。)
当时Wired杂志的标题是:机器人独立完成科学发现。
最近,格拉斯哥大学的化学家 Lee Cronin 在使用机器人去随机混合化学物质,由此来观测会形成什么样的化合物,并通过质谱仪、核磁共振机和红外分光计实时监控反应,这个系统最终能学会预测哪些组合的化学反应最为剧烈。Cronin 表示即使这个系统不能带来新的发现,机器人系统也能让化学家的研究效率提高 90%。
去年,苏黎世联邦理工学院的另一组科学家们在训练神经网络从数据中推导物理定律。他们的系统类似于“机器人开普勒”,利用从地球上观测到的太阳和火星的位置信息,重新发现了日心说;并且通过观测小球碰撞模型发现了动能守恒。因为物理定律通常会有多种表述形式,科学家们想知道这个系统能否提供种更简洁的方法来思考已知的物理定律。
这些都是 AI 启动、助力科学 探索 的例子。尽管在每一个例子中,这些新方法的革命性都会收到争议。但在这个信息浩如烟海且高速增长的时代,最值得商榷的问题可能是:仅从数据中,我们能获得多少信息?
在 《The Book of Why: The New Science of Cause and Effect》一书中,计算机科学家 Judea Pearl 和科学作家 Dana Mackenzie 断言到:数据“愚蠢至极”。他们写到: 关于因果性的问题“永远不能仅凭数据去寻找答案”。
“每当你看到以无模型的方式分析数据的论文或研究时,你可以肯定的是这项研究成果仅仅是总结,或许做了转述,但绝对不是在解释数据。”Schawinski 对 Pearl 的观点抱有同感,“只使用数据”这个想法有点类似于“稻草人”。他也从未生成以这样的方式做因果推断。他想说的是:“和我们通常的工作相比,我们可以用数据多做点事。”
另一个经常听到的观点是: 科学需要创造力。
可是到目前为止,我们还不知道,如何将创造力编入计算机。(Cronin 的机器人化学家只是在简单地尝试科研工作,似乎不能算是特别有创造力)Polsterer 认为:“创建一套理论,有理有据的理论,我认为需要创造力,而创造力离不开人类。”
然而,创造力来自何方呢?Polsterer 怀疑这和 不喜欢无聊 有关,这恐怕是机器所没有的体验。“要拥有创造力,你必须厌恶无聊,然而我认为电脑就永远不会感受到无聊。”然而,“创造力”、“灵感”却常常用来描述深蓝、AlphaGo 这样的 AI 程序。我们在描述机器的思想时的困难映射出我们在描述自己思维过程时的困难。
Schawinski 最近离开了学术界,去了私人企业。他现在经营着一家名为 Modulos 的初创公司,该公司雇佣了许多联邦理工学院的科学家。根据该公司的网站介绍,该公司位于“人工智能和机器学习这股风潮的风眼中”。无论当前人工智能技术和成熟的人工智能之间存在多大的差距,他和其他专家都认为机器已经准备好了去完成更多的科学家的工作。不过,AI 的局限性还有待考证。
Schawinski 畅想道:“在可以预见的未来,有没有可能去制造出一台能过发现物理定律、数学原理的机器,甚至超越当今最聪明的人类的能力极限?科学的未来终将被人力所不能及的机器所掌握么?这是一个好问题,但我不知道答案。”
推荐阅读
Nature机器智能:破解因果推断难题
物理学家要失业?机器学习能自学量子力学!
做科研做到绝望是一种什么样的体验?
科研投入越来越多,重大成果的产出却越来越少?
要不要加入我们?一起影响世界!
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarmaorg
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)