遥感图像处理是指对遥感探测所获取的图像或资料进行的各种技术处理。处理的目的是使遥感图像或资料更加适用于实际应用。图像处理中,输入的是质量较低的图像,输出的是改善质量后的图像。主要是对原始图像复原的恢复处理和为使图像更加清晰,目标地物更为突出明显,便于信息提取和识别的图像增强处理以及进行自动识别和信息提取的分类处理。从处理方法上,主要有光学处理和计算机数字图像处理。原始图像复原的恢复处理一般由卫星地面站完成,而在现有的条件下自动识别往往并不十分理想,所以这里的遥感图像处理主要是指图像增强处理和信息提取处理。
遥感图像处理的首要任务是对遥感数据的选择及其时相选择,因为遥感数据及其时相往往对影像的判别产生直接的影响;其次是根据任务和目标进行波段组合的优化选择;最后是确定遥感图像处理和信息提取方法,方法选择得当,就可以少走弯路或不走弯路,方法选择不当,信息提取就如同大海捞针一样难。
本次遥感图像处理的软件主要运用了加拿大PCI公司开发的用于图像处理、几何制图、GIS、雷达数据分析以及资源管理和环境监测的多功能软件系统PCI和自主开发的TM找矿弱信息提取系统等软件。
本节主要针对项目工作区范围的遥感影像的计算机数字图像增强处理的基本原理和方法作简要介绍,不对遥感图像预处理(系统误差校正、大气校正、几何图像校正)进行说明。
711 TM遥感图像的选取
由于陆地资源卫星TM信息源在资源综合调查中,具有明显的技术与经济优势。表现在进行各种处理(数字、光学)潜力大,波段组合能力强,成图几何精度和分类几何精度高,地学综合信息丰富,价格适中,所以就性能价格比而言,以TM遥感信息源为优。同时也对部分区域的SPOT(10 m、5 m)图像进行了处理分析。
本地区的气候是属于暖温带大陆性季风型,一年中四季变化比较明显,夏季植被覆盖率较高,不利于对矿产地质综合信息的研究,同时植被覆盖率高也不利于对遥感图像的计算机处理和信息提取。因此,对本研究工作来说,首先要避开夏季,其次要考虑地面裸露程度及与遥感图像时相的一致性,一般应选择在4月或10月,因为这时植被刚刚出露或者已经枯萎,4月份山区作物种类较单调,甚至还没有作物萌芽,而10月份秋季作物已经收割,植被多已枯萎,地面覆盖相对较低,为此我们选择了1998年4月和2000年10月的影像资料作为本次图像处理的重点。
712 遥感(RS)图像处理的过程分析
遥感数字图像处理的过程就是几何、辐射校正、信息定量化、信息复合、图像增强、信息特征提取、图像分类等一系列图像处理和分析技术研究,为各类型区的遥感综合调查提供优质图像的过程。
数字遥感图像处理的一般过程为:
创新思维与找矿实践
遥感图像预处理包括了遥感图像辐射校正和几何校正两大部分。鉴于预处理是遥感图像处理的公共部分,基于篇幅所限不再赘述。
713 遥感图像增强处理方法研究和选择
图像增强是改善图像视觉效果的处理。当分析遥感图像时,为了使分析者能容易确切地识别图像内容,必须按照分析目的对图像数据进行加工,目的是提高图像的可判读性。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。
遥感图像增强的实质就是把图像灰度的微小差异,人为地予以扩大(或者赋予不同的色彩),目的在于提高人们对图像的分析判断能力。由于对其增强效果缺乏一个统一的评价标准,因此,须结合具体增强要求,选择图像增强的方法,并通过反复试验、调整和观察,达到满意的增强效果。
虽然遥感图像处理方法多种多样,我们在工作中也试验了多种方法,经过筛选和分析研究,结合本次工作实际情况,主要应用了以下几种方法:
7131 比值处理
比值处理采用高质量比值功能,使比值图像得到拉伸,有效地消除了地形影响,使阴影区的结构得到显示。处理出来的图像色彩丰富,既保留了原有地貌特征,又突出了线环构造,为隐伏岩体和半隐伏岩体的研究提供了更为直观可靠的资料,立体感得到增强,阴影区结构清楚。
同一地区不同波段(两个波段或几个波段组合)对应像元亮度值相除,用所得新值构成一幅比值增强图像。目的是扩大相邻两个像元的差别,框图如下:
创新思维与找矿实践
在一张比值图像上,灰阶中最黑和最白的色调代表两个多光谱波段间光谱反射率的最大差异值。最黑的色调代表比值的分母大于分子。反之,最白的色调代表分子大于分母。
基本比值:两个波段的数值相比
公式中:a、b为调节参数;
设a=1,b=0
则每一条斜线的斜率就是一个亮度值。一个点的比值相当于该点和原点的连线与水平轴夹角的正切(比值法的涵义如图7-1)。
图7-1 比值法涵义
作用:① 扩大不同地物亮度值的微小差别;② 消除地形影响(比如阴坡和阳坡的影响);③ 识别和区分蚀变矿物。
下面是本次工作中主要运用的比值和目的:
TM3/1识别褐铁矿化,在图像上呈亮色调;赤铁矿化,在图像上呈暗色调。
TM5/4区分植被与无植被覆盖的土壤和岩石,植被发育区呈暗色调。
区分不同种类的特征矿物:
TM5/4≥10云母和黄铁矿;
TM5/4≤10明矾石和石膏;
TM5/4≈10方解石和粘土矿;
TM7/4≥10云母;
TM7/4≤10明矾石和石膏;
TM4/3,识别植被和褐铁矿化岩石,植被发育区呈亮色调,褐铁矿化岩石呈暗色调;
TM5/7,识别含羟基矿物、硫酸盐和碳酸盐岩的含水化合物,由于这些矿物在22(TM7)处的吸收谷,其TM5/7值很大,在图像上呈亮色调。但植被的TM5/7值也很大,需要用其他方法加以区分。
比值可分为大于1和小于1两大部分,反映波谱特征差别的强弱是不一致的,即在大于1的部分反差较大,在小于1的部分反差很小,实际上是被压缩了。在比值处理过程中,通过自主研发的TM弱信息提取系统的处理,在该系统中增加了一个拟合放大的功能,可以根据需要进行不同比例的放大。基本上解决了比值结果有可能被压缩这一问题。
7132 主成分分析处理
主成分分析(或称为主组分变换,数学上称之为K-L变换)是遥感图像增强和信息提取中用得最多的线性变换,它是在统计基础上的多维正交线性变换,是对原波段图像进行波谱信息的线性投影变换。在尽可能不减少信息量的前提下,将原图像的高维多光谱空间的像元亮度值投影到新的低维空间,减少特征空间维数,达到数据压缩、提高信噪比、提取相关信息、降维处理和提取原图像特征信息的目的,并能有效地提取影像信息。它可使原来多波段图像经变换后提供出一组不相关的图像变量,最前面的主分量具有较大的方差,包含了原始影像的主要信息,所以要集中表达信息,突出图像的某些细部特征,可采用主分量变换来完成。
对工作区的遥感图像的6个波段TM1、TM2、TM3、TM4、TM5、TM7进行了主成分分析,以主成分分析后的第一分量为基础解译图像,参考其他分量图像进行遥感解译。
7133 反差扩展(主要是线性拉伸)
反差扩展是一种通过拉伸或扩展图像的亮度数据分布,使之占满整个动态范围(0~255),以达到扩大地物之间亮度差异,分出更多亮度等级的一种处理技术。
例如:原始的一幅TM图像,亮度范围集中在10~100范围内,我们可以将其扩展到0~255,扩大了相邻亮度值之间的差别,提高了分辨能力(但不能增加亮度等级)(图7-2)。
图7-2 线性增强前后对比
反差扩展的原理是:在反差扩展中,输出的像元值y,是输入的像元值x的函数:y=f(x)0<y<255
这个函数可以是线性的,也可是非线性的。本次主要应用的是普通线性扩展。如果用直线方程来扩展图像,就是y=f(x)
斜率=45°,即y=x,无变化;
斜率<45°,如 y=1/2x,压缩;
斜率>45°,如 y=2x,扩展。
创新思维与找矿实践
dmin,dmax分别代表输入的最小和最大值。
①原来图像的最小和最大值。
②人为规定最小和最大值。
此时,
这就是说把区间〔a,b〕以外的像元值分别压缩为0及255。
③给定要舍掉的像元数百分比,小于此百分数的值均舍去,由程序来确定dmax和dmin。
反差处理贯穿于整个图像处理过程。根据实际情况对不同的处理结果均进行了反差处理(主要是普通线性拉伸处理)。
7134 反色(又称为反相)处理
反色就是形成底片效果。反色有时是很有用的。反色的实际含义是将R、G、B值反转。若颜色的量化级别是256,则新图中的R、G、B值为255减去原图的R、G、B值。这里针对的是所有图,包括真彩图、带调色板的彩色图(又称为伪彩色图)和灰度图。
本次反色处理主要是针对主成分分析的几个分量进行的。主成分分析结果仍然是灰度图,而灰度图又是一种特殊的伪彩色图,只不过调色板中的R、G、B值都是一样的。由于位图中的数据只是对应调色板中的一个索引值,所以只需要将调色板中的颜色反转,形成新调色板,而位图数据不用动,就能够实现反转。由于主成分分析结果的6个分量中,每个分量图像如果不进行反差处理(主要是线性拉伸),图像均较暗,根据处理后的结果显示,水体为黑色,其灰度值大约在0~20,而山体的灰度值多在50~100之间,尽管对其进行了拉伸处理,仍不理想。为了比较准确地区分图像,提高判读解译的准确性,降低解译时间消耗,所以对反差处理后的结果又进行了反色处理。
714 信息提取处理
信息提取主要是针对影像的光谱特征、空间(几何)特征和纹理特征的提取,它是图像增强处理后的对图像的继续处理。
(1)光谱特征:可提取颜色或灰度或波段间的亮度比等目标物的光谱特征,例如Landsat7有7个波段,根据某类地物的光谱特征,采用特定的比值可将其突出出来。
(2)空间(几何)特征:把目标物的形状、大小、或者边缘,线性构造等几何性特征提取出来,例如把区域断层明显突出出来。
(3)纹理特征:是指周期性图案及区域均匀性等有关纹理的特征。根据构成图案的要素形状、分布密度、方向性等纹理进行图像特征提取的处理叫做纹理分析。
本次工作区的遥感影像信息特征提取主要是在PCI软件、TM弱信息提取系统(自主开发)等软件中进行初步工作,最后通过目视解译和计算机自动解译相结合来完成的。
查看PDF格式的文件
可以用扫描识别软件
ocr是英文optical character recognition的缩写,翻译成中文就是通过光学技术对文字进行识别的意思, 是自动识别技术研究和应用领域中的一个重要方面。它是一种能够将文字自动识别录入到电脑中的软件技术,是与扫描仪配套的主要软件,属于非键盘输入范畴,需要图像输入设备主要是扫描仪相配合。现在ocr主要是指文字识别软件,在1996年清华紫光开始搭配中文识别软件之前,市场上的扫描仪和ocr软件一直是分开销售的,专业的ocr软件在早些时候卖得比扫描仪还要贵。随着扫描仪分辨率的提升,ocr软件也在不断升级,扫描仪厂商现在已把专业的ocr软件搭配自己生产的扫描仪出售。ocr技术的迅速发展与扫描仪的广泛使用是密不可分的,近两年随着扫描仪逐渐普及和ocr技术的日臻完善,ocr己成为绝大多数扫描仪用户的得力助手。
一、ocr技术的发展历程
自20世纪60年代初期出现第一代ocr产品开始,经过30多年的不断发展改进,包括手写体的各种ocr技术的研究取得了令人瞩目的成果,人们对ocr产品的功能要求也从原来的单纯注重识别率,发展到对整个ocr系统的识别速度、用户界面的友好性、 *** 作的简便性、产品的稳定性、适应性、可靠性和易升级性、售前售后服务质量等各方面提出更高的要求。
ibm公司最早开发了ocr产品,1965年在纽约世界博览会上展出了ibm公司的ocr产品——ibml287。当时的这款产品只能识别印刷体的数字、英文字母及部分符号,并且必须是指定的字体。20世纪60年代末,日立公司和富士通公司也分别研制出各自的ocr产品。全世界第一个实现手写体邮政编码识别的信函自动分拣系统是由日本东芝公司研制的,两年后nec公司也推出了同样的系统。到了1974年,信函的自动分拣率达到92%左右,并且广泛地应用在邮政系统中,发挥着较好的作用。1983年日本东芝公司发布了其识别印刷体日文汉字的ocr系统ocrv595,其识别速度为每秒70~100个汉字,识别率为99.5%。其后东芝公司又开始了手写体日文汉字识别的研究工作。
中国在ocr技术方面的研究工作相对起步较晚,在20世纪70年代才开始对数字、英文字母及符号的识别技术进行研究,20世纪70年代末开始进行汉字识别的研究。1986年,国家863计划信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家单位联合进行中文ocr软件的开发工作。至1989年,清华大学率先推出了国内第一套中文ocr软件清华文通th-ocr10版,至此中文ocr正式从实验室走向了市场。清华ocr印刷体汉字识别软件其后又推出了th-ocr 92高性能实用简/繁体、多字体、多功能印刷汉字识别系统,使印刷体汉字识别技术又取得重大进展。到1994年推出的th-ocr 94高性能汉英混排印刷文本识别系统,则被专家鉴定为“是国内外首次推出的汉英混排印刷文本识别系统,总体上居国际领先水平”。上个世纪90年代中后期,清华大学电子工程系提出并进行了汉字识别综合研究,使汉字识别技术在印刷体文本、联机手写汉字识别、脱机手写汉字识别和脱机手写数字符号识别等领域全面地取得了重要成果。具有代表性的成果是th-ocr 97综合集成汉字识别系统,它可以完成多文种(汉、英、日)印刷文本、联机手写汉字、脱机手写汉字和手写数字的识别输入。几年来,除清华文通th-ocr外,其它如尚书sh-ocr等各具风格的ocr软件也相继问世,中文ocr市场稳步扩大,用户遍布世界各地。
可以说目前印刷体ocr的识别技术已经达到较高水平。ocr产品已由早期的只能识别指定的印刷体数字、英文字母和部分符号,发展成为可以自动进行版面分析、表格识别,实现混合文字、多字体、多字号、横竖混排识别的强大的计算机信息快速录入工具。对印刷体汉字的识别率达到98%以上,即使对印刷质量较差的文字其识别率也达到95%以上。可识别宋体、黑体、楷体、仿宋体等多种字体的简、繁体,并且可以对多种字体、不同字号混合排版进行识别,对手写体汉字的识别率达到70%以上。特别是我国的汉字ocr技术经过十几年的努力,克服了起步晚、汉字字符集异常庞大等困难,单字的识别速度(指在单位时间内所完成的从特征提取到识别结果输出的字数)可以达到70字/秒以上。由于印刷体ocr汉字识别技术已经比较成熟,所以ocr产品被广泛地应用在新闻、印刷、出版、图书馆、办公自动化等各个行业。
专业型ocr产品多是面向特定的行业,即适用于每天需处理大量表格信息录入的部门,如邮政、税务、海关、统计等等。这种面向特定行业的专业型ocr系统,格式较为固定,识别的字符集相对较小,经常与专用的输入设备结合使用,因此具有速度快、效率高等特点,比如邮件自动分拣系统等。
手写文稿的识别直到1996、1997年才开始有产品问世,而且是作为印刷文稿识别产品的一项附加功能提供的。由于人写字的习惯千差万别,实现自由手写体识别相当困难,所以手写体ocr技术的使用领域是联机手写体识别,即人一边写,计算机一边识别,是一种实时识别方式。
二、OCR的基本原理
简单地说,OCR的基本原理就是通过扫描仪将一份文稿的图像输入给计算机,然后由计算机取出每个文字的图像,并将其转换成汉字的编码。其具体工作过程是,扫描仪将汉字文稿通过电荷耦合器件CCD将文稿的光信号转换为电信号,经过模拟/数字转换器转化为数字信号传输给计算机。计算机接受的是文稿的数字图像,其图像上的汉字可能是印刷汉字,也可能是手写汉字,然后对这些图像中的汉字进行识别。对于印刷体字符,首先采用光学的方式将文档资料转换成原始黑白点阵的图像文件,再通过识别软件将图像中的文字转换成文本格式,以便文字处理软件的进一步加工。其中文字识别是OCR的重要技术。
1.OCR识别的两种方式
与其它信息数据一样,在计算机中所有扫描仪捕捉到的图文信息都是用0、1这两个数字来记录和进行识别的,所有信息都只是以0、1保存的一串串点或样本点。OCR识别程序识别页面上的字符信息,主要通过单元模式匹配法和特征提取法两种方式进行字符识别。
单元模式匹配识别法(Pattern Matching)是将每一个字符与保存有标准字体和字号位图的文件进行不严格的比较。如果应用程序中有一个已保存字符的大数据库,则应用程序会选取合适的字符进行正确的匹配。软件必须使用一些处理技术,找出最相似的匹配,通常是不断试验同一个字符的不同版本来比较。有些软件可以扫描一页文本,并鉴别出定义新字体的每一个字符。有些软件则使用自己的识别技术,尽其所能鉴别页面上的字符,然后将不可识别的字符进行人工选择或直接录入。
特征提取识别法(Feature Extraction)是将每个字符分解为很多个不同的字符特征,包括斜线、水平线和曲线等。然后,又将这些特征与理解(识别)的字符进行匹配。举个简单的例子,应用程序识别到两条水平横线,它就会“认为”该字符可能是“二”。特征提取法的优点是可以识别多种字体,例如中文书法体就是采用特征提取法实现字符识别的。
多数OCR应用软件都加入了语法智能检查功能,这种功能进一步提高了识别率。它主要通过上下文检查法实现拼写和语法的纠正,在文字识别时,OCR应用程序会做多次的上下文衔接性检查,根据程序中已经存在的词组、固定的用词顺序,对应的检查字符串的用词字。比较高级的应用软件会自动用它“认为”正确的词语替换错误词语,纠正语句意思。
2.文字识别的几个步骤
文字识别包括以下几个步骤:图文输入、预处理、单字识别和后处理等。
(1)图文输入
是指通过输入设备将文档输入到计算机中,也就是实现原稿的数字化。现在用得比较普遍的设备是扫描仪。文档图像的扫描质量是OCR软件正确识别的前提条件。恰当地选择扫描分辨率及相关参数,是保证文字清楚、特征不丢失的关键。此外,文档尽可能地放置端正,以保证预处理检测的倾斜角小,在进行倾斜校正后,文字图像的变形就小。这些简单的 *** 作,会使系统的识别正确率有所提高。反之,由于扫描设置不当,文字的断笔过多可能会分检出半个文字的图像。文字断笔和笔画粘连会造成有些特征丢失,在将其特征与特征库比较时,会使其特征距离加大,识别错误率上升。
(2)预处理
扫描一幅简单的印刷文档的图像,将每一个文字图像分检出来交给识别模块识别,这一过程称为图像预处理。预处理是指在进行文字识别之前的一些准备工作,包括图像净化处理,去掉原始图像中的显见噪声(干扰)。主要任务是测量文档放置的倾斜角,对文档进行版面分析,对选出的文字域进行排版确认,对横、竖排版的文字行进行切分,每一行的文字图像的分离,标点符号的判别等。这一阶段的工作非常重要,处理的效果直接影响到文字识别的准确率。
版面分析是对文本图像的总体分析,是将文档中的所有文字块分检出来,区分出文本段落及排版顺序,以及图像、表格的区域。将各文字块的域界(域在图像中的始点、终点坐标),域内的属性(横、竖排版方式)以及各文字块的连接关系作为一种数据结构,提供给识别模块自动识别。对于文本区域直接进行识别处理,对于表格区域进行专用的表格分析及识别处理,对于图像区域进行压缩或简单存储。行字切分是将大幅的图像先切割为行,再从图像行中分离出单个字符的过程。
(3)单字识别
单字识别是体现OCR文字识别的核心技术。从扫描文本中分检出的文字图像,由计算机将其图形、图像转变成文字的标准代码,是让计算机“认字”的关键,也就是所谓的识别技术。就像人脑认识文字是因为在人脑中已经保存了文字的各种特征,如文字的结构、文字的笔画等。要想让计算机来识别文字,也需要先将文字的特征等信息储存到计算机里,但要储存什么样的信息及怎样来获取这些信息是一个很复杂的过程,而且要达到非常高的识别率才能符合要求。通常采用的做法是根据文字的笔画、特征点、投影信息、点的区域分布等进行分析。
中国汉字常用的就有几千,识别技术就是特征比较技术,通过和识别特征库的比较,找到特征最相似的字,提取该文字的标准代码,即为识别结果。比较是人们认识事物的一种基本方法,汉字识别也是通过比较找出汉字之间的相同、相似、相异,把握其量和质的关系,以及时间与空间的关系等。对于大字符集的汉字一般采用多级分类,多特征、全方位动态匹配求相似集,以保证分类率高、适应性强、稳定性好;细分类重点在于对相似集求异匹配、加权处理、结构判别,定量、定性分析,以及前后联接词的关系,最后进行判别。汉字识别实质上是比较科学或认知科学在人工智能方面的应用,其关键技术是识别特征库。计算机有了这样的一个特征库,才能完成认字的功能。
在图像文档的版面中,除了有文字、,有时还会有表格存在,为了使识别后的表格数字化,需要在版面分析过程中,对表格域进行特殊的处理,它包括对表格线的结构信息的提取,对表格内文字域的分检,完成对表格线和对文字域的识别,并根据表格线的数字化生成不同的文件格式。由于文档中的表格随意性大,格式多样,有封闭式的,也有开放式的,特别是表格中的斜线,给表格分析造成一定的困难。
(4)后处理
后处理是指对识别出的文字或多个识别结果采用词组方式进行上下匹配,即将单字识别的结果进行分词,与词库中的词组进行比较,以提高系统的识别率,减少误识率。
汉字字符识别是文字识别领域最为困难的问题,它涉及模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机、中文信息处理等学科,是一门综合性技术。近几年来,印刷汉字识别系统的单字识别正确率已经超过95%,为了进一步提高系统的总体识别率,扫描图像、图像的预处理以及识别后处理等方面的技术也都得到了深入的研究,并取得了长足的进展,有效地提高了印刷汉字识别系统的总体性能。清华大学在此方面的研究成果突出,已经成为世界上的最具权威的机构之一。目前,清华紫光的全系列扫描仪中都配装了清华OCR千禧版软件,它在识别率、表格识别甚至规范手写体的识别方面,均达到了较高水平。
三、ocr文字识别技巧
在最近几年中,ocr识别技术随着扫描仪的普及得到了飞速的发展,扫描、识别软件的性能不断强大并向智能化不断升级发展。但是要想快速地获取正确的扫描结果,得到高效率的文字录入,必须认真学习有关知识,结合实践经验,摸索出自己的全套解决方案。有时我们在作文字识别工作时识别率非常低,根本达不到软件所说的95%以上,请先不要责怪硬件或软件,其实这是没有掌握好扫描及ocr识别技巧的原因。
下面是文字识别 *** 作中经常用到了一些方法和技巧。
1.分辨率的设置是文字识别的重要前提。一般来讲,扫描仪提供较多的图像信息,识别软件比较容易得出识别结果。但也不是扫描分辨率设得越高识别正确率就越高。选择300dpi或400dpi分辨率,适合大部分文档扫描。注意文字原稿的扫描识别,设置扫描分辨率时千万不要超过扫描仪的光学分辨率,不然会得不偿失。下面是部分典型设置,仅供参考。
(1)1、2、3号字的文章段,推荐使用200dpi。
(2)4、小4、5号字的文章段,推荐使用300dpl
(3)小5、6号字的文章段,推荐使用400dpl
(4)7、8号字的文章段,推荐使用600dpi。
2 扫描时适当地调整好亮度和对比度值,使扫描文件黑白分明。这对识别率的影响最为关键,扫描亮度和对比度值的设定以观察扫描后的图像中汉字的笔画较细但又不断开为原则。进行识别前,先看看扫描得到的图像中文字质量如何,如果图像存在黑点或黑斑时或文字线条很粗很黑,分不清笔画时,说明亮度值太小了,应该增加亮度值在试试;如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大了,应减小亮度后再试试。
3.选好扫描软件。选一款好的适合自己的ocr软件是作好文字识别工作的基础,一般不要使用扫描仪自带的oem软件,oem的ocr软件的功能少、效果差,有的甚至没有中文识别,经过比较,我认为清华紫光ocr2003专业版和尚书ocr60文本自动识别输入系统的识别能力与使用功能更突出一些。再选一个图像软件,ocr软件不是有扫描接口吗?为什么还找图像软件?第一,ocr软件不能识别所有的扫描仪;第二,也是最关键的,利用图像软件的扫描接口扫描出来的图像便于处理;一般选用photoshop。
4.如果要进行的文本是带有格式的,如粗体、斜体、首行缩进等,部分ocr软件识别不出来,会丢失格式或出现乱码。如果必须扫描带有格式的文本,事先要确保使用的识别软件是否支持文字格式的扫描。也可以关闭样式识别系统,使软件集中注意力查找正确的字符,不再顾及字体和字体格式。
5.在扫描识别报纸或其他半透明文稿时,背面的文字透过纸张混淆文字字形,对识别会造成很大的障碍。遇到该类扫描,只要在扫描原稿的背面附。盖一张黑纸,扫描时,增加扫描对比度,即可减少背面模糊字体的影响,提高识别正确率,
6.一般文本扫描原稿都为黑、白两色原稿,但是在扫描设置时却常将扫描模式设为灰度模式。特别是在原稿质量较差时,使用灰度模式扫描,并在扫描软件处理完后再继续识别,这样会得到较好的识别正确率。值得注意的是ocr识别软件可以自己确定阀值,几个百分点的阀值差异,可能就会影响识别的正常进行。当然,得到的图像文件的大小会比黑白文件大很多。在进行大批量文稿扫描时,必须对原稿进行测试,找到最佳的阀值百分比。
7.遇到图文混排的扫描原稿,首先明确使用的识别软件是否支持自动分析图文这一功能。如果支持的话,在进行这类扫描识别时,ocr软件会自动计算出文本的内容、位置和先后顺序。文字部分可以按照标示顺序正常识别。
8.手动选取扫描区域会有更好识别效果。设置好参数后,先预览一下,然后开始选取扫描区域。不要将要用的文章一股脑儿选在一个区域内,因为现在的文章排版为了追求更好的视觉效果,使用图文混排的较多,扫成一幅图像会影响ocr识别。因此,要根据实际情况将版面分成n个区域,怎么划分区域呢?每一区域内的文字字体、字号最好一致,没有图形、图像,每一行的宽度一致,遇到长短不一,再细分,一般一次最多可扫描10个选区。根据不同情况,合理地设置识别区域的顺序。不要嫌这个过程太烦,那可是提高识别率的有效手段。注意各识别区域不能有交叉,做到一切觉得完好以后再进行识别。这样一般的识别率会在95%以上,对于识别不正确的文字进行校对后,就可以进入相应的文字处理软件进行所需的处理了。
9.在放置扫描原稿时,把扫描的文字材料一定要摆放在扫描起始线正中,以最大限度地减小由于光学透镜导致的失真。同时应保护扫描仪玻璃的干净和不受损害。 文字有一定角度的倾斜,或者是原稿文字部分为不正规排版,必须在扫描后使用旋转工具,进行纠正;否则ocr识别软件会将水平笔划当做斜笔划处理,识别正确率会下降很多。建议用户尽量将扫描原稿放正,用工具旋转纠正会降低图像质量,使字符识别更加困难。
10.先"预览"整体版面,选定要扫描的区域,再用"放大预览"工具,选择一小块进行放大显示到全屏幕,观察其文字的对比度,文字的深浅浓度,据情况调整"阀值"的大小,最终要求文字清晰,不浓(文字成团),不淡(文字断笔伐),一般在"阀值"80左右为宜,最后再扫描。
11.用工具擦掉图像污点,包括原来版面中的不需要识别的插图、分隔线等,使文字图像中除了文字没有一点多余的东西;这可以大提高识别率并减少识别后的修改工作。
12.如果要扫描印刷质量稍微差一些的文章,比如说报纸,扫描的结果将不会黑白分明,会出现大量的黑点,而且在字体的笔画上也会出现粘连现象,这两项可是汉字识别的大忌,将严重影响汉字识别的正确率。为获得较好的识别结果,必须仔细进行色调调节,反复扫描多次才能获得比较理想的结果。另外由于报纸很薄且大部分纸质不高,导致扫描仪上盖板不能完全压住报纸(有缝隙),所以一般情况下报纸的扫描识别效果没有杂志的效果好。解决办法是在报纸上压一至两本16k的杂志,效果还是不错的。
四、ocr常见问题的解决
1.文字校正
文字校正应该是ocr识别中最麻烦和繁琐的工作了,要想减少工作量的话,大家可以使用readbook作为文字校正的辅助工具。我们用到的主要功能是: 自动平滑滚屏;可以对文件进行局部编辑;具有“智能分段”功能,可以将每行都是硬回车换行的文章,去掉回车重新排列,并且不破坏原有的段落;启动时可自动装入上次正在阅读的文章。
2.表格识别和编辑
清华紫光ocr和尚书ocr都提供了表格识别功能,尚书ocr做得比较好,能够对表格进行自动识别,但在识别时要与其它文字版块区分划开,才会得到整个页面的识别。我们在用紫光ocr识别表格时,往往只能识别出表头而无表格。这是因为紫光ocr不能对表格自动进行划分,我们需要进行手动版面分析,单独定义出表格属性。紫光ocr的识别属性分为"横排正文"、"竖排正文"及"表格",只要将表头单独框起来定义为"横排正文",再单独将表格框起来定义为"表格"就可以正确识别了。
如果我们用word等编辑软件将识别后的表格文件直接打开时,表格可能会一团糟,这是因为表格线是被作为字符处理的。解决这个问题最简单的方法是使用wps 2000,它可以将字符型的表格线直接转换成可编辑的表格。如果我们需要在word里进行编辑,只需在wps 2000里将文件另存为rtf格式就可以了。注意:请不要使用复制粘贴,因为word是将wps 2000的表格作为来处理。
3.段落重排
一些朋友在识别后文本的再处理时,大多将其复制粘贴到word中,利用word强大的查找替换功能来去掉多余的硬回车。其实我们完全不需要这样麻烦,尚书ocr、汉王ocr和紫光ocr都提供了段内去硬回车的功能。尚书、汉王使用比较简单,只要在识别后的文本存盘时,选回车设置为软回车就行了。对于紫光ocr则需要在识别完成后,选择文件菜单下的导出命令,将存为类型选为txt,段内回车字符选为无。注意:一定不要直接存盘,否则不能自动去掉文章的硬回车。
4.软件的兼容性
在购买扫描仪的时候,一般都会随机获赠一款ocr识别软件。我们也可以另选一些适合自己的ocr识别软件,下面就介绍一下两款主流ocr软件的兼容性问题。
(1)清华紫光ocr
清华紫光ocr 专业版是紫光系列扫描仪随机附赠的ocr软件,它具有支持的图像格式多,识别率高,支持表格识别等特点,是一款不错的ocr软件。但它只支持紫光系列的扫描仪,如果在其它品牌的扫描仪上使用,它会显示出错信息,并拒绝工作。
(2)尚书ocr
尚书50这款ocr识别软件,具有识别率高,界面简单友好的特点,特别适合于初学者。它适用于microtek,n-tek,scanpaq,scanport系列扫描仪,该软件只识别自己扫描的图像,很不方便。
解决方法:其实解决此类问题也很简单,我们可以使用其它图像处理软件来进行扫描,只要扫描得到的图像格式能够被ocr软件所支持、识别就可以了。这里介绍一款专为ocr软件设计的图像增强软件扫描小精灵,它能有效地提高输入图像质量,它提供的全自动扫描方式、自动存盘功能,特别适合于需要大量处理文稿的用户。根据实验,扫描小精灵的tif图像输出格式全面兼容紫光ocr v75 32位专业版、汉王ocr 50、尚书50、北信ocr(wps2000手写系统中携带的)等。此软件大家可以到>
用matlab图像处理确定激光光斑的中心的详细过程和算法
个不难的:
- 图像预处理,自动阀值方法二值化,然后滤掉噪声点,得到比较干净的圆形光斑离散点集;
- 用以下这个程序拟合出离散点的圆,并找出圆心。
其中第一步的自动阀值可以用otsu函数(otsu method,大津法),其余都很基础;第二步的程序如果看不懂,可以进一步看看参考资料连接。
function [xc,yc,R,a] = circfit(x,y)
%
% [xc yx R] = circfit(x,y)
%
% fits a circle in x,y plane in a more accurate
% (less prone to ill condition )
% procedure than circfit2 but using more memory
% x,y are column vector where (x(i),y(i)) is a measured point
%
% result is center point (yc,xc) and radius R
% an optional output is the vector of coeficient a
% describing the circle's equation
%
% x^2+y^2+a(1)x+a(2)y+a(3)=0
%
% By: Izhak bucher 25/oct /1991,
x=x(:); y=y(:);
a=[x y ones(size(x))]\[-(x^2+y^2)];
xc = -5a(1);
yc = -5a(2);
R = sqrt((a(1)^2+a(2)^2)/4-a(3));
参考资料:
图像处理技术有:点处理、组处理、几何处理和帧处理四种方法。
图像处理技术是用计算机对图像信息进行处理的技术。主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等,几何图形由点、线、面、颜色等组成,由绘图程序产生,是一系列绘图指令的集合,一般用各种绘图软件制作。
点阵图像由各像素点和颜色组合而成,使用摄像机、扫描仪、数码相机等设备获得,也可以使用绘图软件生成。图像表示的画面细腻,层次和色彩丰富,图像的各像素点逐点存储在计算机中,占用的存储空间大。
研究内容:
图像增强,图像增强的目的是改善图像的视觉效果,它是各种技术的汇集,还没有形成一套通用的理论,常用的图像增强技术有对比度处理、直方图修正、噪音处理、边缘增强、变换处理和伪彩色等,在多媒体应用中,对各类图像主要进行图像增强处理,各类图像处理软件一般都支持图像增强技术。
图像恢复,图像恢复的目的是力求图像保持本来面目,用来纠正图像在形成、传输、存储、记录和显示过程中产生的变质和失真。图像恢复必须首先建立图像变质模型,然后按照其褪化的逆过程恢复图像。
图像识别,图像识别也称模式识别,就是对图像进行特征抽取,然后根据图形的几何及纹理特征对图像进行分类,并对整个图像作结构上的分析。通常在识别之前,要对图像进行预处理,包括滤除噪声和干扰、提高对比度、增强边缘、几何校正等,图像识别的应用范围极其广泛,如工业自动控制系统、指纹识别系统以及医学上的癌细胞识别等。
以上就是关于遥感图像处理全部的内容,包括:遥感图像处理、FPD是什么软件、用matlab图像处理确定激光光斑的中心的详细过程和算法等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)