Android中使用orc实现文字识别实例

Android中使用orc实现文字识别实例,第1张

概述一、什么是orc?引用百度百科的介绍,指利用光学字符识别(ORC全称:OpticalCharacterRecognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持JPG、PNG、GIF、BMP、DOC等图片格式。简单一句话

一、什么是orc?

引用百度百科的介绍,指利用光学字符识别(ORC全称:Optical Character Recognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持JPG、PNG、GIF、BMP、DOC等图片格式。简单一句话,就是可以把图片上的文字识别出来。应用的场景有很多,比如说:身份z号码识别,yhk号识别等等。

二、效果展示

这里笔者实现的仅仅是一个效果,实际使用可能需要对它进行训练以提高识别率,第一次做gif图片,效果不是很好




三、开始集成

Github上面已经提供了androID端的工具API,Github地址:https://github.com/rmtheis/tess-two

集成流2

1.下载中文简体语言包

2.导入依赖

3.API的使用,获取TessBaseAPI mBaseAPI = new TessBaseAPI();实例

4.API的使用,初始化TessBaseAPI设置,设置识别的语言和语言包所在文件路径 mBaseAPI.init(path + file.separator,"chi_sim");

5.API的使用,设置Bitmap,mBaseAPI.setimage(bitmap);

6.API的使用,从Bitmap获取文字信息,mBaseAPI.getUTF8Text();

1.下载中文简体语言包

语言包下载地址

找到tessdata――>chi_sim.traineddata

下载好了之后,需要放到sd卡中,目录不限,但是必须要放在tessdata目录里面,如果没有tessdata目录需要手动创建,例如我是Demo中是放在sd卡根目录中,就直接在sd卡根目录创建tessdata目录,然后把下载好的chi_sim.traineddata语言包丢进去,实际项目中,在识别时候最好坐下语言包是否复制到位的检查,以免出现异常。Demo中仅仅是检查了是否创建tessdata目录,这里实际上仍然存在风险的。

2.导入依赖

Gradle方式添加:https://github.com/rmtheis/tess-two

3.MainActivity代码

public class MainActivity extends AppCompatActivity implements VIEw.OnClickListener {private TextVIEw mTvInfo;private TessBaseAPI mBaseAPI;private Progressbar mProbar;private String path;private RadioGroup mRadioGroup;private Radiobutton mRbtnIDCard;private Radiobutton mRbtnBankNumber;private Radiobutton mRbtnTxt;@OverrIDeprotected voID onCreate(Bundle savedInstanceState) {  super.onCreate(savedInstanceState);  setContentVIEw(R.layout.activity_main);  findVIEwByID(R.ID.btn_start).setonClickListener(this);  mProbar = (Progressbar) findVIEwByID(R.ID.pb);  mTvInfo = (TextVIEw) findVIEwByID(R.ID.tv_info);  mRadioGroup = (RadioGroup) findVIEwByID(R.ID.rg);  mRbtnIDCard = (Radiobutton) findVIEwByID(R.ID.rb_IDCard);  mRbtnBankNumber = (Radiobutton) findVIEwByID(R.ID.rb_bankNumber);  mRbtnTxt = (Radiobutton) findVIEwByID(R.ID.rb_txt);  mRadioGroup.check(0);  path = Environment.getExternalStorageDirectory().getabsolutefile().getabsolutePath();}@OverrIDepublic voID onClick(VIEw v) {  mTvInfo.setText("");  switch (v.getID()) {    case R.ID.btn_start:      if (Build.VERSION.SDK_INT >= 23) {        if (ActivityCompat.checkSelfPermission(this,Manifest.permission.WRITE_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED) {          // 没有权限          if(ActivityCompat.shouldShowRequestPermissionRationale(this,Manifest.permission.CALL_PHONE)){            //如果没勾选“不再询问”,向用户发起权限请求            ActivityCompat.requestPermissions(this,new String[]{Manifest.permission.CALL_PHONE},0);          }else{            Toast.makeText(this,"请前往设置――>存储卡权限――>允许",Toast.LENGTH_SHORT).show();          }        } else {          // 有权限,接着你要干的活          startReadText();        }      }else{        startReadText();      }      break;  }}private Handler mHandler = new Handler() {  @OverrIDe  public voID handleMessage(Message msg) {    switch (msg.what) {      case 0:        String s = (String) msg.obj;        if (!TextUtils.isEmpty(s)) {          mProbar.setVisibility(VIEw.GONE);          mTvInfo.setText(s);          //释放bitmap          mBaseAPI.clear();        } else {          mProbar.setVisibility(VIEw.GONE);          Toast.makeText(MainActivity.this,"识别图片内容失败",Toast.LENGTH_SHORT).show();        }        break;      case 1:        Toast.makeText(MainActivity.this,"读取图片失败",Toast.LENGTH_SHORT).show();        break;    }  }};private Bitmap getBitmap(int ID) {  Bitmap bitmap = null;  try {    bitmap = BitmapFactory.decodeResource(getResources(),ID);  } catch (Exception e) {    return null;  }  return bitmap;}/** * 开始识别文字 */private voID startReadText() {  file f = new file(path+"/tessdata") ;  if(!f.exists()){    Toast.makeText(this,"请先下载好语言包置于sd/tessdata目录",Toast.LENGTH_SHORT).show();    return;  }  final int btnID = mRadioGroup.getCheckedRadiobuttonID();  final int resID ;  if(R.ID.rb_IDCard==btnID){    resID = R.drawable.IDcard;  }else if(R.ID.rb_bankNumber==btnID){    resID = R.drawable.bank_number;  }else{    resID = R.drawable.tet_info;  }  mProbar.setVisibility(VIEw.VISIBLE);  new Thread() {    @OverrIDe    public voID run() {      mBaseAPI = new TessBaseAPI();//初始化需要耗时,可以启动时程序时,预初始化      mBaseAPI.init(path + file.separator,"chi_sim");      Bitmap bitmap = getBitmap(resID);      if (bitmap == null) {        mHandler.sendEmptyMessage(1);      } else {        mBaseAPI.setimage(bitmap);        //根据Init的语言,获得ocr后的字符串        String t = mBaseAPI.getUTF8Text();//耗时 *** 作        Message obtain = Message.obtain();        obtain.what = 0;        obtain.obj = t;        mHandler.sendMessage(obtain);      }    }  }.start();}}

4.activity_main.xml代码

<linearLayoutxmlns:androID="http://schemas.androID.com/apk/res/androID"xmlns:tools="http://schemas.androID.com/tools"androID:ID="@+ID/activity_main"androID:layout_wIDth="match_parent"androID:layout_height="match_parent"androID:orIEntation="vertical"androID:paddingBottom="@dimen/activity_vertical_margin"androID:paddingleft="@dimen/activity_horizontal_margin"androID:paddingRight="@dimen/activity_horizontal_margin"androID:paddingtop="@dimen/activity_vertical_margin"tools:context="com.demo.orc.MainActivity"><RadioGroup  androID:ID="@+ID/rg"  androID:orIEntation="horizontal"  androID:layout_wIDth="match_parent"  androID:layout_height="wrap_content">  <Radiobutton    androID:checked="true"    androID:ID="@+ID/rb_IDCard"    androID:text="身份z"    androID:layout_wIDth="wrap_content"    androID:layout_height="wrap_content" />  <Radiobutton    androID:ID="@+ID/rb_bankNumber"    androID:text="yhk"    androID:layout_wIDth="wrap_content"    androID:layout_height="wrap_content" />  <Radiobutton    androID:ID="@+ID/rb_txt"    androID:text="文字"    androID:layout_wIDth="wrap_content"    androID:layout_height="wrap_content" /></RadioGroup><button  androID:ID="@+ID/btn_start"  androID:layout_wIDth="wrap_content"  androID:layout_height="wrap_content"  androID:text="开始识别"/><TextVIEw  androID:text="识别结果展示区:"  androID:layout_wIDth="match_parent"  androID:layout_height="wrap_content" /><FrameLayout  androID:layout_wIDth="match_parent"  androID:layout_height="match_parent">  <Progressbar    androID:ID="@+ID/pb"    androID:layout_wIDth="wrap_content"    androID:layout_height="wrap_content"    androID:layout_gravity="center"    androID:visibility="gone"/>  <TextVIEw    androID:ID="@+ID/tv_info"    androID:layout_wIDth="match_parent"    androID:layout_height="match_parent"    androID:text=""/></FrameLayout></linearLayout>

四、提高识别率

Demo识别率其实不是很理想,比如把数字0识别成了字母O等,这是因为我们的根本没有进行样本训练。关于样本的训练,我目前还没实际 *** 作过,因为公司的识别需求更为复杂,这个框架难以达到效果,公司买了第三方的一个识别框架。不过仅仅是实现身份z号,yhk号,和一些简单的文字信息,用这个框架足以实现。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持编程小技巧。

总结

以上是内存溢出为你收集整理的Android中使用orc实现文字识别实例全部内容,希望文章能够帮你解决Android中使用orc实现文字识别实例所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1146172.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-31
下一篇 2022-05-31

发表评论

登录后才能评论

评论列表(0条)

保存