图像检索算法因何而起?
网络时代,随着各种社交网络的兴起,网络中,视频数据每天都以惊人的速度增长,逐渐形成强大的图像检索数据库。针对这些具有丰富信息的海量,如何有效地从巨大的图像数据库中检索出用户需要的,成为信息检索领域研究者感兴趣的一个研究方向。
图像检索,简单的说,便是从检索数据库中检索出满足条件的,图像检索技术的研究根据描述图像内容方式的不同可以分为两类:
一类是基于文本的图像检索技术,简称TBIR,
一类为基于内容的图像检索技术,简称CBIR。
随着图像检索技术的发展和逐渐成熟,已经形成了多个基于图像检索的研究方向和应用场景,并且投入实用,在遥感影像、安防监控、检索引擎、电子商务、医学等方方面面起着十分重要的作用。
基于文本的图像检索(TBIR)技术,其主要原理为利用文本描述,如文本描述的内容、作者等等的方式来检索;
基于图像的内容语义的图像检索技术(CBIR),利用的颜色、纹理及包含的物体、类别等信息检索,如给定检索目标,在图像检索数据库中检索出与它相似的。
基于图像的内容语义的图像检索包括相同物体图像检索和相同类别图像检索,检索任务分别为检索同一个物体地不同和检索同一个类别地。例如,行人检索中检索的是同一个人即同一个身份在不同场景不同摄像头下拍得的属于相同物体的图像检索,而在3D形状检索中则是检索属于同一类的物品,如飞机等。
图像检索技术主要包含几个步骤,分别为:输入、特征提取、度量学习、重排序。
特征提取:即将数据进行降维,提取数据的判别性信息,一般将一张降维为一个向量;
度量学习:一般利用度量函数,计算特征之间的距离,作为loss,训练特征提取网络,使得相似提取的特征相似,不同类的提取的特征差异性较大。
重排序:利用数据间的流形关系,对度量结果进行重新排序,从而得到更好的检索结果。
随着深度学习的引入,基于深度学习的图像检索技术,主要是将深度学习方法应用在图像检索中的特征提取模块,利用卷积神经网络提取特征。主要步骤即给定一张,通过卷积神经网络对进行特征提取得到表征的特征,利用度量学习方法如欧式距离对特征进行计算距离,对距离进行排序,得到初级检索结果,再根据数据的上下文信息和流形结构对图像检索结果进行重排序,从而提高图像检索准确率,得到最终的检索结果。
thispictureBox1Image
=
ImageFromStream(thisopenFileDialog1OpenFile());
//获取当前的路径
string
path
=
openFileDialog1FileNameToString();
//将制定路径的添加到FileStream类中
FileStream
fs
=
new
FileStream(path,
FileModeOpen,
FileAccessRead);
//通过FileStream对象实例化BinaryReader对象
BinaryReader
br
=
new
BinaryReader(fs);
//通过BinaryReader类对象的ReadBytes()方法将FileStream类对象转化为二进制数组
byte[]
imgBytesIn
=
brReadBytes(ConvertToInt32(fsLength));第二步:
//将添加到数据库中
string
sql="insert
into
pic
values(@pic)";
SqlParameter[]
param
=
new
SqlParameter[]
{
new
SqlParameter("@pic",
imgBytesIn)
};
DBHelperGetExecuteQuery(sql,
param);第三步:
//将从数据库中取出
string
sql="select
from
pic
where
id=0";
SqlDataReader
reader
=
DBHelperGetExecuteReader(sql,
null);
MemoryStream
mss
=
null;
一、从学科领域角度可以将数据与事实型数据库划分为:
1、事实数值型科学数据库,如中科院“科学数据库”。
2、社会科学或综合参考类数据库,如百科全书、年鉴。
3、商情数据库,如中国资讯行、国研网、中经专网等。
二、数据与事实型数据库的特点:
1、事实型数据库最新发展的学科是法律,之后是商业金融、物理、化学、新闻等方面。由于商业金融界对事实数据库的大量需求以及商业数据库生产的盈利驱动致使商业、金融事实数据库仍是发展的主流。
2、相对于文献数据库,事实型数据库具有更强的实用性,涉及面非常广;它直接面向问题,总是以特定的事实或数字回答用户的查询;前者检索结果可能是很多条记录,而事实型数据库检索途径多,查准率高,其检索结果往往只是单一的记录。
3、尽管在功能上事实型数据库与传统的参考工具书类似,但比较而言,参考工具书编写和出版周期较长,许多最新的事实和数据不可能快速被工具书收录。
4、由于事实型数据库在数据的构成、数据描述的方式、编排体例等方面的差异以及数据库中各类数据本身的特点,使得各种事实型数据库中的检索字段/入口有较大的不同,检索方法也因此不尽相同而表现出各自的特点与特色。
扩展资料:
国内外事实型数据库举例:
1、万方事实型数据库:
万方数据资源系统是由中国科技信息研究所万方数据(集团)公司联合科技文献出版社、四川省科技情报研究所等机构组成的,是国内最早从事数据库建设的企业。
万方数据资源系统汇集了国内近120个数据库,并将这些信息资源整合为三大部分,即:商务信息子系统、科技信息子系统和数字化期刊子系统。
2、中国资讯行数据库:
中国资讯行于1995年在香港成立,是一家专门收集、处理及传播中国商业信息的高科技企业,资料来源于1000多种中国报章、杂志、贸易刊物、政府出版物及合作伙伴提供的权威数据。
内容包括实时财经新闻、权威机构经贸报告、各类统计数据、法律法规、商业数据及证券消息等动态信息。
3、国务院发展研究中心信息网:
国务院发展研究中心信息网(简称“国研网”)是中国唯一挂牌“国务院”字头的专业经济信息服务机构,它以国务院发展研究中心丰富的信息资源和强大的专家阵容为依托,并与海内外众多知名机构和经济资讯机构紧密合作。
全面汇集、整合国内外经济金融领域的研究成果和经济信息,以“专业性、权威性、前瞻性、指导性、包容性”为原则,向海内外提供了及时、全面、系统、权威、高质量的经济信息。
参考资料来源:百度百科-事实型数据库
基于色彩特征的索引技术
色彩是物体表面的一种视觉特性,每种物体都有其特有的色彩特征,譬如人们说到绿色往往是和树木或草原相关,谈到蓝色往往是和大海或蓝天相关,同一类物体往拍几有着相似的色彩特征,因此我们可以根据色彩特征来区分物体用色彩特特征进行图像分类一可以追溯到Swain和Ballard提出的色彩直方图的方法由于色彩直方图具有简单且随图像的大小、旋转变化不敏感等特点,得到了研究人员的厂泛关注,目前几乎所有基于内容分类的图像数据库系统都把色彩分类方法作为分类的一个重要手段,并提出了许多改进方法,归纳起主要可以分为两类:全局色彩特征索引和局部色彩特征索引。
基于纹理的图像分类技术
纹理特征也是图像的重要特征之一,其本质是刻画象素的邻域灰度空间分布规律由于它在模式识别和计算机视觉等领域已经取得了丰富的研究成果,因此可以借用到图像分类中。
在70年代早期,Haralick等人提出纹理特征的灰度共生矩阵表示法(eo一oeeurrenee matrix representation),这个方法提取的是纹理的灰度级空间相关性(gray level Spatial dependenee),它首先基于象素之间的距离和方向建立灰度共生矩阵,再由这个矩阵提取有意义的统计量作为纹理特征向量。基于一项人眼对纹理的视觉感知的心理研究,Tamuar等人提出可以模拟纹理视觉模型的6个纹理属性,分别是粒度,对比度,方向性,线型,均匀性和粗糙度。QBIC系统和MARS系统就采用的是这种纹理表示方法。
在90年代初期,当小波变换的理论结构建一认起来之后,许多研究者开始研究
如何用小波变换表示纹理特征。smiht和chang利用从小波子带中提取的统计量(平均值和方差)作为纹理特征。这个算法在112幅Brodatz纹理图像中达到了90%的准确率。为了利用中间带的特征,Chang和Kuo开发出一种树型结构的小波变化来进一步提高分类的准确性。还有一些研究者将小波变换和其他的变换结合起来以得到更好的性能,如Thygaarajna等人结合小波变换和共生矩阵,以兼顾基于统计的和基于变换的纹理分析算法的优点。
基于形状的图像分类技术
形状是图像的重要可视化内容之一在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述目前的基于形状分类方法大多围绕着从形状的轮廓特征和形状的区域特征建立图像索引。关于对形状轮廓特征的描述主要有:直线段描述、样条拟合曲线、傅立叶描述子以及高斯参数曲线等等。
实际上更常用的办法是采用区域特征和边界特征相结合来进行形状的相似分类如Eakins等人提出了一组重画规则并对形状轮廓用线段和圆弧进行简化表达,然后定义形状的邻接族和形族两种分族函数对形状进行分类邻接分族主要采用了形状的边界信息,而形状形族主要采用了形状区域信息在形状进行匹配时,除了每个族中形状差异外,还比较每个族中质心和周长的差异,以及整个形状的位置特征矢量的差异,查询判别距离是这些差异的加权和。
基于空间关系的图像分类技术
在图像信息系统中,依据图像中对象及对象间的空间位置关系来区别图像库中的不同图像是一个非常重要的方法。因此,如何存贮图像对象及其中对象位置关系以方便图像的分类,是图像数据库系统设计的一个重要问题。而且利用图像中对象间的空间关系来区别图像,符合人们识别图像的习惯,所以许多研究人员从图像中对象空间位置关系出发,着手对基于对象空间位置关系的分类方法进行了研究。早在1976年,Tanimoto提出了用像元方法来表示图像中的实体,并提出了用像元来作为图像对象索引。随后被美国匹兹堡大学chang采纳并提出用二维符号串(2D一String)的表示方法来进行图像空间关系的分类,由于该方法简单,并且对于部分图像来说可以从ZD一String重构它们的符号图,因此被许多人采用和改进,该方法的缺点是仅用对象的质心表示空间位置;其次是对于一些图像来
说我们不能根据其ZD一string完个重构其符号图;再则是上述的空间关系太简单,实际中的空间关系要复杂得多。,针对这些问题许多人提出了改进力一法。Jungert根据图像对象的最小包围盒分别在:x轴方向和y轴上的投影区间之间的交叠关系来表示对象之间的空间关系,随后Cllallg和Jungert等人又提出了广义ZD一string(ZDG一String)的方法,将图像对象进一步切分为更小的子对象来表示对象的空间关系,但是该方法不足之处是当图像对象数日比较多且空间关系比较复杂时,需要切分的子对象的数目很多,存储的开销太大,针对此Lee和Hsu等人提出了ZDC一string的方一法,它们采用Anell提出的13种时态间隔关系并应用到空间投影区问上来表达空间关系。在x轴方向和y轴方向的组合关系共有169种,他提出了5种基本关系转换法则,在此基础上又提出了新的对象切分方法。采用
ZDC一string的方法比ZDG一string切分子对象的数目明显减少。为了在空间关系中保留两个对象的相对空间距离和对象的大小,Huang等人提出了ZDC书string的方法提高符号图的重构精度,并使得对包含对象相对大小、距离的符号图的推理成为可能。上述方法都涉及到将图像对象进行划分为子对象,且在用符号串重构对象时处理时间的开销都比较大,为解决这些方法的不足,Lee等人又提出了ZDB一String的方法,它不要求对象进一步划分,用对象的名称来表示对象的起点和终点边界。为了解决符号图的重构问题,Chin一ChenCllang等人提出了面向相对坐标解决符号图的重构问题,Chin一ChenChang等人提出了面向相对坐标符号串表示(RCOS串),它们用对象最小外接包围盒的左下角坐标和右上角坐标来表示对象之间的空间关系
对于对象之间的空间关系采用Allen提出的13种区间表示方法。实际上上述所有方法都不是和对象的方位无关,为此Huang等人又提出了RSString表示方法。虽然上述各种方法在对图像对象空间信息的分类起到过一定作用,由于它们都是采用对象的最小外接矩形来表示一个对象空间位置,这对于矩形对象来说是比较合适的,但是当两个对象是不规则形状,且它们在空间关系上是分离时,它们的外接矩形却存在着某种包含和交叠,结果出现对这些对象空间关系的错误表示。用上述空间关系进行图像分类都是定性的分类方一法,将图像的空间关系转换为图像相似性的定量度量是一个较为困难的事情。Nabil综合ZD一String方法和二维平面中对象之间的点集拓扑关系。提出了ZD一PIR分类方法,两个对象之间的相似与否就转换为两个图像的ZD一PIR图之间是否同构。ZD一PIR中只有图像对象之间的空间拓扑关系具有旋转不变性,在进行图像分类的时候没有考虑对象之间的相对距离。
计 算 机 检 索 系 统 的 构 成
计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。
一、计算机硬件
计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。
二、软件
软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。
三、数据库
根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
按国际上通用的分类方法,数据库可以划分为以下类型:
1 参考数据库
参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。
书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。
指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。
2 源数据库
源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:
(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。
(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。
(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。
(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。
(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、或照片等资料类型的计算机存储与检索。
除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。
四、通讯网络
由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。
主要内容有:图像增强、图像编码、图像复原、图像分割、图像分类、图像重建、图像信息的输出和显示。
图像增强用于改善图像视觉质量;图像复原是尽可能地恢复图像本来面目;图像编码是在保证图像质量的前提下压缩数据,使图像便于存储和传输;图像分割就是把图像按其灰度或集合特性分割成区域的过程。
图像分类是在将图像经过某些预处理(压缩、增强和复原)后,再将图像中有用物体的特征进行分割,特征提取,进而进行分类;图像重建是指从数据到图像的。处理,即输入的是某种数据,而经过处理后得到的结果是图像。
扩展资料
发展概况
数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。
早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。
他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。
随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。
在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。
参考资料来源:百度百科-数字图像处理
图4-1 数据库建库流程图
(一)建库流程
分等数据库的建立包括图形数据库的建立和属性数据库的建立以及空间数据与属性数据的联接(图4-1)。其具体内容包括原始数据的收集整理与入库要素的选择、图纸的扫描矢量化、图形坐标系变换与数据编辑、属性数据整理编码和输入、图形数据与属性数据的联接等过程。
(二)图形数据库的建立
1图形预处理
图形资料的预处理包括检查、修改、清绘、坐标格网调整、制图综合等。图形预处理是为简化图形数字化工作而进行的图层要素整理与删选过程。采用扫描数字化时,对每个专题要素都必须加工数字化原稿,并且确保原稿的质量,要求线划均匀、墨色深浅一致、交接关系清楚、相邻线段间距清晰、图面干净无污点。
2图件的扫描与纠正
对农用地分等基础图件进行扫描,对于扫描后发生旋转和扭曲变形的地方,使用专业软件进行纠正。
3坐标配准
在矢量化之前对分等基础图件进行坐标配准。使用GIS软件多元图像分析系统,完成土壤图向土地利用现状电子图件坐标系的配准。土地利用现状图为参照文件,土壤图为校正文件,校正文件以参照文件为标准进行处理。校正文件仅包括MSI图像文件,因此必须把TIF格式的土壤图图像文件转换为MSI文件。
校正文件中的控制点信息是系统处理的主要对象,因此需要在校正文件和参照文件中分别选择一定数量的控制点。在MSI图像中加入了几何控制点后,MSI图像具有了地理坐标的概念,就能完成各种 *** 作,包括图像之间的配准。
4屏幕矢量化
地图的矢量化是把配准后的栅格图像转换为矢量文件的过程。在GIS软件图形编辑子系统下使用交互式矢量化,完成县级农用地分等基础图件的矢量化工作。
5图形编辑、修改与拓扑关系建立
对于矢量化好的线文件(wl),在GIS软件图形编辑子系统下进行拓扑处理。其步骤为:数据准备——自动剪短线——清除微短线——清除重叠坐标与自相交——检查重叠线——节点平差——线拓扑错误检查——线转弧段——拓扑重建。完成拓扑重建后的文件为区文件(wp)。
(三)属性数据库的建立
属性数据的输入可以在GIS软件平台下逐单元手工输入,但 *** 作较慢,而且会造成重复性输入,比如同样土种的土壤属性就要输入多次。属性数据的录入是一项繁琐易错的工作,可选择简单易用的Excel平台进行属性数据的录入,录入后进行1~2次的检查。
GIS软件图形数据的属性字段中有个标识码字段(ID),可以用来作为图形数据与属性数据的公用字段,通过GIS软件属性库管理子系统,可完成图形数据和属性数据的联接。
属性数据主要来源有两方面:第二次土壤普查成果资料,包括土壤类型、土壤表层质地、土体剖面构型、土壤有机质、土壤pH值等原始属性资料;野外实地调查资料,包括投入产出数据、地下水位、灌溉保证率、排水条件等。
(四)图形数据库与属性数据库的联接
在GIS软件属性库管理子系统中完成图形数据与属性数据的联接。GIS软件能够联接的数据库文件有DBASE、FoxPro、VisualFoxPro、Text、Access、Excel等数据库软件生成的文件。通过选择联接文件和被联接文件以及关键字段,使空间数据和属性数据两种数据模型联为一体,由此实现空间数据和属性数据之间的相互查询与检索。
(五)DTM分析与空间分析
在GIS软件数字地面模型(DTM)子系统中,以通过矢量化等高线生成的数字高程模型DEM为分析数据,通过“高程点坡度、坡向”分析,把坡度值写入到已经过图斑统一编码的县级土地利用现状图属性库中。
在空间分析子系统中,把土地利用现状图、土壤图、土壤养分分布图等进行空间合并分析。要求不打破土地利用现状图图斑。空间合并后的单元就具有了土地利用现状图、土壤图、土壤养分分布图上的属性,从而形成了县级分等单元的空间与属性数据库。
(六)分等公式的编辑与计算
在MapGIS属性数据库管理子系统中,把雷州市农用地分等单元的属性数据导出为Excel文件。根据《农用地分等规程》、《广东省农用地分等定级与估价技术方案》中的计算方法,在导出的Excel表格中编辑公式,计算各分等单元的自然质量等指数、农用地利用等指数和农用地经济等指数。以200分为间距划分等级,然后把划分好的等级写入到相应属性字段的属性中。
以上就是关于计算机视觉应用之图像检索任务简单介绍全部的内容,包括:计算机视觉应用之图像检索任务简单介绍、C#怎么将图片保存到SQL数据库、数据与事实型数据库主要有哪些类型各有什么特点等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)