vpn的全称是Virtual Private Network,也就是虚拟专用网络的意思,可以用来连接外部的网络,一般我们是用不到的,如果不小心打开了可以按照下面的步骤关闭即可:
1、进入手机桌面,找到并且点击【设置】图标。
2、点击【VPN】右边的按钮关闭即可,然后我们就会发现手机上的VPN图标不见了。
扩展资料:
VPN优点
VPN能够让移动员工、远程员工、商务合作伙伴和其他人利用本地可用的高速宽带网连接(如DSL、有线电视或者WiFi网络)连接到企业网络。此外,高速宽带网连接提供一种成本效率高的连接远程办公室的方法。
设计良好的宽带VPN是模块化的和可升级的。VPN能够让应用者使用一种很容易设置的互联网基础设施,让新的用户迅速和轻松地添加到这个网络。这种能力意味着企业不用增加额外的基础设施就可以提供大量的容量和应用。
VPN能提供高水平的安全,使用高级的加密和身份识别协议保护数据避免受到窥探,阻止数据窃贼和其他非授权用户接触这种数据。
完全控制,虚拟专用网使用户可以利用ISP的设施和服务,同时又完全掌握着自己网络的控制权。用户只利用ISP提供的网络资源,对于其它的安全设置、网络管理变化可由自己管理。在企业内部也可以自己建立虚拟专用网。
连续系统是指系统状态的改变在时间上是连续的,从数学建模的角度来看,可以分为连续时间模型、离散时间模型、混合时间模型。其实在simpowersystem的库中基本所有模型都属于连续系统,因为其对应的物理世界一般是电机、电源、电力电子器件等等。离散系统是指系统状态的改变只发生在某些时间点上,而且往往是随机的,比如说某一路口一天的人流量,对离散模型的计算机仿真没有实际意义,只有统计学上的意义,所以在simpowersystem中是没有模型属于离散系统的。但是在选取模型,以及仿真算法的选择时,常常提到的discrete model、discrete solver、discrete simulate type等等中的离散到底是指什么呢?其实它是指时间上的离散,也就是指离散时间模型。
下文中提到的连续就是指时间上的连续,连续模型就是指连续时间模型。离散就是指时间上的离散,离散模型就是指离散时间模型,而在物理世界中他们都同属于连续系统。为什么要将一个连续模型离散化呢?主要是是从系统的数学模型来考虑的,前者是用微分方程来建模的,而后者是用差分方程来建模的,并且差分方程更适合计算机计算,并且前者的仿真算法(simulationsolver)用的是数值积分的方法,而后者则是采用差分方程的状态更新离散算法。
在simpowersystem库中,对某些物理器件,既给出的它的连续模型,也给出了它的离散模型,例如:
离散模型一个很重要的参数就是采样时间sampletime,如何从数学建模的角度将一个连续模型离散化,后面会有介绍。在simpowersystem中常用powergui这个工具来将系统中的连续模型离散以便采用discrete算法便于计算机计算。
QQ截图20130914190906.png (69.79 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:09 上传
2.连续模型的数学建模vs离散模型的数学建模
Note:这里的连续和离散都是指时间上的连续和离散,无关乎现实世界的连续系统和离散系统。所谓数学建模就是用什么样的数学语言来描述模型,
连续系统的数学模型通常可以用以下几种形式表示:微分方程、传递函数、状态空间表达式,这三中形式是可以相互转换的,其中又以状态空间表达式最有利于计算机计算。
①微分方程:
一个连续系统可以表示成高阶微分方程,即
QQ截图20130914190955.png (19.33 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:10 上传
②传递函数
上式两边取拉普拉斯变换,假设 y 及 u 的各阶导数(包括零阶)的初值均为零,则有
QQ截图20130914191024.png (17.29 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:10 上传
于是便得微分方程的传递函数描述形式如下:
QQ截图20130914191031.png (9.03 KB, 下载次数: 3)
下载附件 保存到相册
2013-9-14 19:11 上传
③状态空间表达式
线性定常系统的状态空间表达式包括下列两个矩阵方程:
QQ截图20130914191121.png (2.5 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:11 上传
(7-1)
QQ截图20130914191127.png (2.94 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:11 上传
(7-2)
式(7-1)由n 个一阶微分方程组成,称为状态方程;式(7-2)由l个线性代方程组称为输出方程
因此获得如下的状态方程与输出方程(令a0=1 ):
QQ截图20130914191222.png (27.38 KB, 下载次数: 2)
下载附件 保存到相册
2013-9-14 19:12 上传
离散模型假定一个系统的输入量、输出量及其内部状态量是时间的离散函数,即为一个时间序列:
捕获.JPG (9.81 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:50 上传
,其中T为离散时间间隔,其实T也就是上文中的sample time。
Note:再强调一次,这里的离散模型是指离散时间模型,与现实世界中的离散事件模型没有任何关系,在simpowersystem中所讲的离散都是指时间上的离散,与我们在信号中学的那个离散概念没有关系。
离散时间模型有差分方程、离散传递函数、权序列、离散状态空间模型等形式。
①差分方程
差分方程的一般表达式为:
QQ截图20130914191256.png (5.31 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:13 上传
同样差分方程可以转换成后面那些表达形式。
3.连续模型的离散化
正如7.1.连续系统vs离散系统中截图所示的那样,如何由一个连续模型得到它的离散模型,(RMS®discrete RMS value),以及powergui是通过什么方法将连续模型离散化的,即simulator是如何将微分方程转换成差分方程的。
假设连续系统的状态方程为
捕获.JPG (8.54 KB, 下载次数: 9)
下载附件 保存到相册
2013-9-14 17:52 上传
现在人为地在系统的输入及输出端加上采样开关,同时为了使输入信号复员 为原来的信号,在输入端还要加一个保持器,如图所示。现假定它为零阶保持器,即假定输入向量的所有分量在任意两个依次相连的采样瞬时为常值,比如,对第n个采样周期u(t)=u(nt),其中 T 为采样间隔。
QQ截图20130914191337.png (21.82 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:13 上传
由采样定理可知,当采样频率ws和信号最大频率wmax满足ws>2 wmax的条件时,可由采样后的信号唯一地确定原始信号。把采样后的离散信号通过一个低通滤波器,即可实现信号 的重构。值得注意的是,图所示的采样器和保持器实际上是不存在的,而是为了将式离散化而虚构的。
下面对上式进行求解,对方程式两边进行拉普拉斯变换,得
即
QQ截图20130914175433.png (1.54 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:55 上传
通过一系列的拉斯反变换和卷积,最终得到其差分方程(具体过程不用关心)
QQ截图20130914175543.png (43.82 KB, 下载次数: 8)
下载附件 保存到相册
2013-9-14 17:56 上传
QQ截图20130914191427.png (2.97 KB, 下载次数: 3)
下载附件 保存到相册
2013-9-14 19:15 上传
统称为系统的离散系数矩阵。
在转换过程中引入了一个重要参数T,即采样间隔,也就是采样时间,不管是powergui还是其他离散模型,只要涉及到离散,都必然会涉及到sample time,如下图
QQ截图20130914191439.png (34.78 KB, 下载次数: 2)
下载附件 保存到相册
2013-9-14 19:15 上传
那么sample time 一般取多大呢,一直满足采样定理即可,即信号的采样频率大于信号本身最大频率的2倍即可。
4. simulator连续模型的仿真算法(simulatesolver,也可译成仿真解算器)和步长的概念。
QQ截图20130914191629.png (28.07 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:16 上传
连续系统的计算机仿真算法是数值积分法,即计算机用数值积分来解微分方程,从而得到其近似解。具体方法如下
①欧拉法和改进的欧拉法:
现有微分方程如下:
QQ截图20130914191456.png (7.06 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:15 上传
上式右端的积分,计算机是无法求出的,其几何意义为曲线f(t,y)在区间(ti ,ti+1)上的面积。当(ti ,ti+1)充分小时,可用矩形面积来近似代替:
QQ截图20130914191712.png (3.1 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:17 上传
其中h即为积分步长。
Note:在simulator仿真计算时,h实际为仿真时间间隔。
因此可得下式:
QQ截图20130914191718.png (2.86 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:17 上传
因此只要知道当前状态和步长,便可得到下一状态。其几何意义如下:
QQ截图20130914175806.png (2.41 KB, 下载次数: 9)
下载附件 保存到相册
2013-9-14 17:58 上传
分析其误差特性:
由泰勒展式可得:
QQ截图20130914175830.png (1.91 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:58 上传
可知其截断误差
QQ截图20130914175906.png (1003 Bytes, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:59 上传
是和步长h2成正比的,因此计算机在计算时,若要使近似积分精度更高,就要减小步长,但会增加截断误差。
②改进的欧拉法(预测—校正法)
对积分公式(3.1.2)式利用梯形面积公式计算其右端积分,得到
QQ截图20130914175957.png (1.4 KB, 下载次数: 7)
下载附件 保存到相册
2013-9-14 18:00 上传
将上式写成递推差分格式为:
QQ截图20130914180026.png (992 Bytes, 下载次数: 8)
下载附件 保存到相册
2013-9-14 18:01 上传
从上式可以看出,在计算 y n+1中,需要知道fn+1,而fn+1=f(t n+1,f n+1) 又依赖于yn+1本身。因此要首先利用欧拉法计算每一个预估的ypn+1,以此值代入原方程式计算fpn+1,最后利用下式求修正后的ypn+1。所以改进的欧拉法可描述为
image098.jpg (5.1 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
③龙格—库塔法(rung-kuta)
欧拉法是将
image099.jpg (14.94 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
经泰勒级数展开并截去 h2以后各项得到的一阶一步法,所以精度较低。如果将展开式多取几项以后截断,就得到精度较高的高阶数值解,但直接使用泰勒级数展开式要计算函数的高阶导数较难。龙格—库塔法是采用间接利用泰勒级数展开式的思路,即用在 n个点上的函数值 f的线性组合来 代替 f的导数,然后按泰勒级数展开式确定其中的系数,以提高算法的阶数。这样既能避免计算函数的导数,同时又 保证了计算精度。由于龙格—库塔法具有许多优点,故在许多仿真程序包中,它是一个最基本的算法之 一。
④线性多步法
以上所述的数值解法均为单步法。在计算中只要知道
QQ截图20130914180638.png (3.05 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 18:07 上传
。也就是说,根据初始条件可以递推计算出相继各时刻的 y值,所以这种方法都可以自启动。 下面要介绍的是另一类算法,即多步法。
用这类算法求解时,可能需要
image101.jpg (13.92 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
各时刻的值。显然多步法计算公式不能自启动,并且在计算过程中占用的内存较大,但可以提高计算精度和速度。例如:亚当斯—贝希霍斯显式多步法
⑤刚性(stiff)系统解法
所谓刚性系统,就是用来描叙这类系统的微分方程的解,往往是由多个时间常数共同作用的,其中某些小时间常数对解的影响往往是微乎其微但的确不可或缺的。例如下式是一个简单刚性系统微分方程的解:
QQ截图20130914180727.png (629 Bytes, 下载次数: 6)
下载附件 保存到相册
2013-9-14 18:07 上传
image105.jpg (10.19 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
当时间较大时特征解-1000几乎对方程不起任何作用,但开始时有不能忽略e -1000t的影响,因此若前面介绍的计算机数值解法,为了保证解的稳定性在选取步长h时,必须保证1000h较小,也就是说步长h必须十分的小,这必然会增大计算次数,增大计算时间,而又因为在t一定大时,e -1000t 几乎不起作用,因此这种增大次数又不会对计算精度有多大改善,就是说常规解法计算刚性系统是在做无用功。
到目前为止,已提出不少解刚性方程的数值方法,基本上分为:显式公式, 隐式公式和预测校正型。
显示公式常用雷纳尔法
隐式方程都是稳定的,故都适合于解描述刚性系统的方程组,如隐式的龙格—库塔法。但这种方法每计算一步都需要进行迭代,故计算量大,在工程上使用有一定困难。因此在解刚性方程时,常采用 Rosenbrock提出的半隐式龙格—库塔法。
预测—校正型中常用的解刚性方程的方法是Gear算法
5. simulator离散模型的仿真算法和步长的概念。
离散模型的数学建模一般采用差分方程的方式,在matlab中其仿真算法是采用discrete算法,就是根据simulation step 定时对离散模块进行更新(就是定时计算差分方程的意思)
QQ截图20130914191827.png (21.05 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:18 上传
至于其步长的概念和连续模型中h的概念差不多,但是它的大小选择和sample time 有着密切关系,下面会给予说明。
6.simulink中仿真参数(simulation/configurationparameters)
有了上面知识的铺垫,可以介绍simulink仿真参数的设置
QQ截图20130914191901.png (75.84 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:19 上传
上图中solver(仿真解算器)就是上面介绍的各种算法用计算机语言编程的实现。
continuous solver就是数值积分法,discrete solver就是离散解法。
步长有variable step(变步长)和fixed step(固定步长之分)。continuous solver中的步长就是h,就是积分时间间隔,对于discrete solver的步长是和要仿真的模型中的sample time有密切关系的,是不可以随便取的。
QQ截图20130914191911.png (56.93 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:19 上传
①variable step(变步长)
QQ截图20130914192025.png (75.22 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 19:20 上传
就是说变步长会根据模型状态的变化的快慢适当调节步长,也就是相邻仿真计算的时间间隔,这样在保证了一定精度的同时又减少了仿真的次数,从而减小了仿真时间。
对于continuous solver而言,可以人为设定max step size 和min step size,然后计算机自动选择积分步长h进行数值积分。以下是它的仿真solver(ODE表示常微分方法)
image117.jpg (25.74 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
②fixed step(固定步长)
QQ截图20130914192109.png (36.38 KB, 下载次数: 2)
下载附件 保存到相册
2013-9-14 19:21 上传
就是仿真从头到尾用同一个步长。Note:对于continuous solver而言固定步长可以认为任取;而对于dicretesolver而言固定步长可以auto(即仿真帮你取),若人为取必选要遵守和sample time之间的一定关系,下面会有介绍。
Note: 关于simulink中搭建一些 DSP,fpga等外设模块,仿真通过后自动生成代码,可在实际器件上运行时,此时simulation step一定要用fixed step(固定步长)。具体说明见下图:
image121.jpg (12.75 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
③discretesolver
image123.jpg (5.62 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
image124.png (13.19 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
solver就是discrete算法,就是不断更新discrete block在各离散点的状态,步长的大小是与模型中的sampletime 有密切关系的,
由上面阐述的差分方程可知,差分方程中T采样时间是固定的,对于discrete solver而言不管是variable step 还是fixed step,simulation step(仿真步)必须要有出现在sample time所有的整数倍上,即simulation step的设置必须使simulator在1T、2T、3T要对模型进行计算仿真,以免错过主要状态的转化。
若一个离散仿真模型中具有多个sample time,那么要保证每个模型在其采用时间的1T、2T、3T都能进行仿真,那么最小步长只能取各个仿真时间的公约数,其中最大公约数又称为fundamental sample time,例子如下
假设仿真的离散模型中有两个采样时间T1=2e-6,T2=4e-6那么其公约数为1e-6和2e-6,而 fundamental sample time=2e-6
image126.png (14.72 KB, 下载次数: 8)
下载附件 保存到相册
2013-9-14 17:39 上传
若采用fixed step步长,为了不错过模型在每个采样时刻状态的变化,要求simulator的仿真时间必须要包含每一个采样时刻的整数倍,因此其固定步长必须取各个sampletime 的公约数,可以是1e-6或2e-6,若写auto则为 fundamental sample time=2e-6,若写出其他步长,则simulation会提示错误。
image129.jpg (6.48 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
上述仿真过程如下:
QQ截图20130914180941.png (10.64 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 18:10 上传
箭头表示simulation step,就是simulator在每一个箭头处都会仿真计算一次;圆圈处表示模型采样时刻(sample time)处,其实只有在这一刻离散模型的状态才有可能发生改变,即差分方程的解才有可能发生改变;由上图可见这样设置步长保证了在每个sample time处simulator都进行了仿真。
若采用variable step步长,simulator会根据模型中的各个sample time自动调整步长,以使得仿真时间时刻等于sample time。
image132.png (12.77 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
此时又有一个max step size的限制,若如上图写的是auto,那么上述仿真过程如下:
QQ截图20130914181017.png (10.21 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 18:10 上传
可见simulator只在sample time处才进行仿真计算,这样减少了仿真次数,节约了时间。
若max step size=0.7e-6,那么仿真过程又该如何?如下图:
QQ截图20130914181025.png (10.72 KB, 下载次数: 7)
下载附件 保存到相册
2013-9-14 18:10 上传
可见variable step时,即使有人为maxstep size的限制,simulator总会跟踪sampletime。一般选择auto即可。
⑥关于powergui的作用
image138.png (1.27 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
image141.jpg (11.47 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
image143.jpg (7.4 KB, 下载次数: 6)
下载附件 保存到相册
2013-9-14 17:39 上传
powergui基本上在simpowersystem的仿真中有两个作用:
ⅰ:离散化系统中的一些连续模型,以便simulator采用discrete算法计算,注意:对本来就已经存在的离散模型不起任何作用,如下图:
image144.jpg (6.86 KB, 下载次数: 7)
下载附件 保存到相册
2013-9-14 17:39 上传
powergui的离散sample time为2e-6,而系统中还有离散模块的sample time为4e-6,powergui的离散作用对它没有影响。
ⅱ:提供各种graphical userinterface tools用于分析仿真过程中的信号以及数据(尤其是FFT分析)。
image146.jpg (18.26 KB, 下载次数: 11)
下载附件 保存到相册
2013-9-14 17:39 上传
image100.jpg (14.79 KB, 下载次数: 67)
下载附件 保存到相册
2013-9-14 17:39 上传
image104.png (13.62 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image116.png (59.04 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 17:39 上传
image118.png (16.56 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image120.png (18.83 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image122.png (13.17 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image125.jpg (6.42 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image127.jpg (6.84 KB, 下载次数: 2)
下载附件 保存到相册
2013-9-14 17:39 上传
image128.png (12.7 KB, 下载次数: 3)
下载附件 保存到相册
2013-9-14 17:39 上传
image131.gif (730 Bytes, 下载次数: 3)
下载附件 保存到相册
2013-9-14 17:39 上传
image133.jpg (5.84 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image135.gif (2.37 KB, 下载次数: 5)
下载附件 保存到相册
2013-9-14 17:39 上传
image137.gif (2.38 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 17:39 上传
image139.jpg (2.68 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 17:39 上传
image140.png (23.54 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
image142.png (15.78 KB, 下载次数: 1)
下载附件 保存到相册
2013-9-14 17:39 上传
image145.png (20.75 KB, 下载次数: 0)
下载附件 保存到相册
2013-9-14 17:39 上传
matlab
数学
算法
女士的凉鞋
精选推荐
广告
matlab电力模块库simpowersystem使用指南(中文版)
860下载·42评论
2010年3月29日
连续单位步长和离散单位步长:在连续和离散时间内生成单位步长信号。-matlab开发
1下载·0评论
2021年5月30日
连续and离散系统的描述
950阅读·4评论·6点赞
2022年9月6日
CTFT DTFT DFT ZT 这些变换之间有什么联系和区别
1.1W阅读·0评论·2点赞
2014年11月19日
Simulink中步长、powergui采样时间、模块采样时间、控制周期的关系
1.0W阅读·0评论·26点赞
2021年12月25日
三相桥式电路的simulink电路仿真简介
6853阅读·0评论·15点赞
2021年1月3日
随着年龄的增长,记忆力越来越差!你知道该如何改善记忆力吗?
00:37
讲真记忆力
广告
Simulink 中连续与离散模型的区别
1.5W阅读·2评论·35点赞
2020年4月10日
MATLAB到底有多厉害?
1099阅读·0评论·3点赞
2021年8月30日
基于Matlab/SimPowerSystem的 交流调速系统的仿真
5289阅读·1评论·2点赞
2020年11月16日
matlab/simulink的仿真参数
3020阅读·3评论·4点赞
2021年8月20日
PSpice和Simulink联合仿真笔记(五)Simulink 和PSpice之间的数据交换及Simulink仿真设置
2077阅读·0评论·5点赞
2020年2月4日
Simulink中"连续系统仿真"和"离散系统仿真"的区别
1.5W阅读·0评论·12点赞
2016年12月4日
仿真软件与应用实践 实验报告
1925阅读·0评论·1点赞
2020年12月2日
MATLAB仿真中连续和离散的控制器有何区别?
969阅读·0评论·2点赞
2019年9月29日
各种方差公式
6531阅读·0评论·0点赞
2009年3月27日
matlab 设置采样时间设置,不建议设置采样时间的模块
3743阅读·0评论·0点赞
2021年4月22日
Simpowersystem中信号的转换 - 利用戴维南和诺顿定理
581阅读·0评论·0点赞
2020年11月12日
Matlab2021a中Simulink的拓展工具箱SimPowerSystems查找
7703阅读·0评论·17点赞
2021年10月23日
simpowersystem教程
28下载·0评论
2014年12月17日
去首页
看看更多热门内容
评论1
BertrandRussel
赞
写得真清楚,是我想要的!
分类: 电脑/网络 >>软件解析:
搜索引擎
搜索引擎的概念
搜索引擎是指以一定的策略搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站成为搜索引擎,但从严格意义上,它并不是搜索引擎。
搜索引擎的工作原理
可以分为三个部分
1、抓取网页
每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。
3、提供检索服务
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
搜索引擎的发展历史
1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。
Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序。
1993年Matthew Gray开发了 World Wide Web Wanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的“机器人(Robot)”程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL)。
1994年4月,斯坦福大学(Stanford University)的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于2002年12月23日收购inktomi,2003年7月14日收购包括Fast和Altavista在内的Overture,2003年11月,Yahoo全资收购3721公司。
1994年初,华盛顿大学(University of Washington )的学生Brian Pinkerton开始了他的小项目WebCrawler。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。
1994年7月,卡内基·梅隆大学(Carnegie Mellon University) 的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。
1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一样成为搜索引擎的重要代表。
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
1995年12月,DEC的正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索新闻组(Newsgroups)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。
1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier创立了Inktomi,1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。
1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。
1998年10月之前,Google只是斯坦福大学(Stanford University)的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了google的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。Google以网页级别(Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文化氛围、不作恶(Don’t be evil)的理念,为Google赢得了极高的口碑和品牌美誉。2006年4月,Google宣布其中文名称“谷歌”,这是Google第一个在非英语国家起的名字。
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收购)。
1996年8月,sohu公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉。随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。sohu于2004年8月独立域名的搜索网站“搜狗”,自称“第三代搜索引擎”。
Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域。
2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布Baidu搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。后推出贴吧、知道、地图、国学、百科等一系列产品,深受网民欢迎。2005年8月5日在纳斯达克上市,发行价为USD 27.00,代号为BIDU。开盘价USD 66.00,以USD 122.54收盘,涨幅353.85%,创下了5年以来美国股市上市新股当日涨幅最高纪录。
2003年12月23日,原慧聪搜索正式独立运做,成立了中国搜索。2004年2月,中国搜索发布桌面搜索引擎网络猪1.0,2006年3月中搜将网络猪更名为IG(Inter Gateway) 。
2005年6月,新浪正式推出自主研发的搜索引擎“爱问”。
搜索引擎的商务模式
在搜索引擎发展早期,多是作为技术提供商为其他网站提供搜索服务,网站付钱给搜索引擎。后来,随着2001年互联网泡沫的破灭,大多转向为竞价排名方式。
现在搜索引擎的主流商务模式(百度的竞价排名、Google的AdWords)都是在搜索结果页面放置广告,通过用户的点击向广告主收费。这种模式最早是比尔·格罗斯(Bill Gross)提出的。他于1998年6月创立GoTo公司(后于2001年9月更名为Overture),实施这种模式,取得了很大的成功,并且申请了专利。这种模式有两个特点,一是点击付费(Pay Per Click),用户不点击则广告主不用付费。二是竞价排序,根据广告主的付费多少排列结果。 2001年10月,Google推出AdWords,也采用点击付费和竞价的方式。2002年,Overture起诉Google侵犯了其专利。2004年8月,和Yahoo!(Yahoo!于2003年7月收购Overture)达成和解,向后者支付了270万普通股(合3亿美元不到)作为和解费。
AdSense是Google于2003年推出的一种新的广告方式。AdSense使各种规模的的第三方网页发布者进入Google庞大的广告商网络。Google在这些第三方网页放置跟网页内容相关的广告,当浏览者点击这些广告时,网页发布者能获得收入。AdSense在blogger中很受欢迎。同时,Google武断地删除一些帐号,引起部分人的不满。类似的广告方式,其他搜索引擎也先后推出。雅虎的广告方式是YPN(Yahoo Publisher Neork),YPN 除了可以在网页上显示与内容相关的广告以外,还可以通过在 RSS 订阅中来显示广告。微软的广告计划叫AdCenter。百度也推出主题推广。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)