初识数据结构

初识数据结构,第1张

可被计算机识别并加工处理的对象。

由数据组成的具有一定意义的基本单位。

是组成元素的,不可分割的最小单位。(表示一个事物的一组数据称作一个数据元素,构成数据元素的数据称作该数据元素的数据项,如下图所示,每一行为一个数据元素,每一列为一个数据项。)

是指某一数据对象及该对象中所有元素之间的关系组成(包括逻辑结构,存储结构,数据的运算)。
除了第一个元素和最后一个元素外,每一个元素都只有一个唯一的前驱元素和唯一的后续元素。相对B来说,A就是B唯一的前驱元素,C是B唯一的后继元素。

一个简单的线性结构(例如班级信息)。

除根节点外,每一个元素都有一个唯一的前驱元素,可有0个或若干个后继元素,B的唯一前驱元素是A,同时B拥有两个后继元素C与G。

一个简单的树状结构(例如江苏省包含十三个市)。

每个数据都有0个或若干个前驱元素与0个或若干个后继元素。

一个简单的图形结构

数据元素之间除了“属于同一个集合”的联系外没有其他关系。(例如,学生存在于某个班级中,若不考虑学生之间的其他关系,则可视为班级为一个集合结构。)

辅助理解:我们可以从生活中的一些物与物之间的逻辑关系更好地理解上面的数据逻辑结构。线性结构比如火车车厢的关系、或者一群小孩子拉着手围成圈做游戏,每一个个体都只有两只手去拉别人,在离散数学图论中,可以将它们看作每个节点最多有且只能有一个入度和一个出度;树形结构,比如我们中学历史课本上的附庸关系、工作中的严格上下级关系等,每个人只有一个直系长官,每个长官下面可以有多个下属,每个节点能有一个入度和多个出度;网状结构,比如开party,所有人随机和别人谈话,节点的入初度不严格规定,每个节点可以有多个入度和多个出度。

任何需要计算机管理和处理的数据都必须要按照某种方式储存在计算机中,数据在计算中的储存方式称为数据的存储结构,基本形式有顺序存储和链式储存

把元素储存在一块连续地址空间的内存中。在逻辑上相邻的元素在储存中也相邻,例如我们常见的数组

顺序存储结构

使用指针把相互直接关联的节点连接起来,逻辑上直接相邻的元素,起物理存储不一定相邻

链式储存结构

该方法通常是 在存储节点信息的基础上,还建立附加啊的索引表 。索引表中的每一项称作索引项,索引项的一般关键形式是: (关键字,地址) 。关键字唯一标识节点,地址做指向节点的指针。

该方法的基本思想是 根据关键字直接计算出节点的存储地址。

WGCNA其译为 加权基因共表达网络分析 。该分析方法旨在寻找协同表达的基因模块(module),并探索基因网络与关注的表型之间的关联关系,以及网络中的核心基因。

适用于复杂的数据模式, 推荐5组(或者15个样品)以上的数据 。一般可应用的研究方向有:不同器官或组织类型发育调控、同一组织不同发育调控、非生物胁迫不同时间点应答、病原菌侵染后不同时间点应答。

从方法上来讲,WGCNA分为 表达量聚类分析和表型关联 两部分,主要包括基因之间相关系数计算、基因模块的确定、共表达网络、模块与性状关联四个步骤。

第一步计算任意两个基因之间的相关系数(Person Coefficient)。为了衡量两个基因是否具有相似表达模式,一般需要设置阈值来筛选,高于阈值的则认为是相似的。但是这样如果将阈值设为08,那么很难说明08和079两个是有显著差别的。因此, WGCNA分析时采用相关系数加权值,即对基因相关系数取N次幂 ,使得网络中的基因之间的连接服从 无尺度网络分布(scale-freenetworks) ,这种算法更具生物学意义。

第二步通过基因之间的相关系数构建分层聚类树, 聚类树的不同分支代表不同的基因模块 ,不同颜色代表不同的模块。基于基因的加权相关系数,将基因按照表达模式进行分类,将模式相似的基因归为一个模块。这样就可以 将几万个基因通过基因表达模式被分成了几十个模块 ,是一个提取归纳信息的过程。

基因之间不仅仅是相关与否,还记录着它们的相关性数值,数值就是基因之间的 联系的权重(相关性)。

模块(module):表达模式相似的基因分为一类,这样的一类基因成为模块;

Eigengene(eigen +‎ gene):基因和样本构成的矩阵, >人工智能已经不再遥远,它已经渗透到我们生活中,那么人工智能是啥?它和机器学习、深度学习、神经网络又有什么关系?有什么区别和联系呢?

神经网络有两种:

讲(人工)神经网络前,得先思考一个问题,人为什么可以思考?是怎么思考的?

人之所以可以思考,是因为脑细胞中的神经网络(神经元、触点、细胞等组成的网络),这里指的是生物神经网络,神经网络让人能产生意识,进而思考和行动。

科学家和生物学家们,一直在思考,如何制造出模仿人脑的机器,然后就有了人工神经网络,神经网络是一种仿生物思考的算法模型。

神经网络算法由来已久,自1943年提出神经元模型,沿用至今,下面是神经网络的发展简史,神经网络算法80年代就已经十分成熟,期间也是沉寂多年,到近几年才得以大规模的发展应用。

人工智能的底层模型是"神经网络"(neural network)。机器学习和深度学习都是基于它。

走在人工智能最前沿,应该是google x 实验室,google x lab有很多稀奇古怪的项目,比较出名的当初自动驾驶和机器人。

上图的altas机器人是boston dynamics这个公司,google曾经收购过并成立谷歌机器人部门Replicant,由安卓之父Andy Rubin负责,写安卓都应该知道他了,十分痴迷于研究机器人。

看上去人工智能还离我们很远?

非也,其实人工智能早已渗透我们的生活,比如抖音、头条,比如siri、小米音响,阿里的鲁班系统(替代设计师画图)。

推荐系统最早应用于电商,国外的亚马逊,国内最开始引入的是豆瓣,头条算是后起之秀,但是应用的如火纯青,最有商业化价值。

抖音的用户粘性045,是的没看错。
怎么理解?游戏的粘性为03~06,众所周知游戏很容易入迷,03-06的意思就是一个月有9-18天会玩游戏,有135天会打开抖音,这个粘性是惊人的。

如slogan所言,你关心的,才是头条。相信很多人都有过,多次卸载头条的经历,因为头条前期模型,也是不断在训练,到后期有足够的数据集才稍具智能,而且推荐系统的弊端是,用户很容易困在信息茧房里,只看自己喜欢的,沉浸在自己的世界里。

头条的用户停留时长也非常高,据不完全统计,说微信+头条占用了网民的1/3使用时长。

推荐算法由来已久,到了近几年才得以发挥,所以数学对人类的发展有多重要,不言而喻。

人工智能、机器学习和深度学习,这三者有什么关系?

机器学习是一种实现人工智能的丰富,深度学习是一种实现机器学习的技术。

先说关系,神经网络是实现机器学习的一种方式。
实现机器学习还有其它方式:

1、当我们还是婴儿的时候,我们如何认出猫和狗?
大人告诉我们,狗长这样子,猫长那样子,刚开始我们还是会认错,知道认得多了,不断纠正,我们提取出了猫狗的特征,之后我们就可以一样鉴别了。

机器学习同样如此,当我们给计算机几百分狗的照片,,从里提取狗的体征,他得到了足够的数据集训练后,算法模型就成熟了。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/13502138.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-20
下一篇 2023-08-20

发表评论

登录后才能评论

评论列表(0条)

保存