ruby-on-rails – 使用Ruby和Ubuntu进行光学字符识别

ruby-on-rails – 使用Ruby和Ubuntu进行光学字符识别,第1张

概述我是一名大学生,是时候再次购买教科书了.本季度我需要20多本课程.通常这不会是一个大问题,因为我只是将ISBN复制并粘贴到亚马逊.但是,ISBN会在我学校的图书网站上转换为图像.我想要做的就是将ISBN转换为字符串,这样我就不必手动输入每个字符串了.我已经使用GOCR将图像转换为文本,但我想将它与 Ruby脚本一起使用,这样我就可以自动完成这个过程并为我的同学做同样的事情. 我可以导航到该网站.如 我是一名大学生,是时候再次购买教科书了.本季度我需要20多本课程.通常这不会是一个大问题,因为我只是将ISBN复制并粘贴到亚马逊.但是,ISBN会在我学校的图书网站上转换为图像.我想要做的就是将ISBN转换为字符串,这样我就不必手动输入每个字符串了.我已经使用GOCR将图像转换为文本,但我想将它与 Ruby脚本一起使用,这样我就可以自动完成这个过程并为我的同学做同样的事情.

我可以导航到该网站.如何将图像保存到我的计算机上的文件(运行UBUNTU),使用GOCR转换图像,最后将其保存到文件中,然后我可以使用我的Ruby脚本再次访问它们?

解决方法 GOCR起初似乎是一个不错的选择,但从我自己的“研究”中可以看出,质量对于日常使用来说还不够.根据图像输入的不同,这可能会导致问题.如果它不适合您,请尝试使用Google文档的“新”功能,该功能允许您上传OCR图像.然后你可以使用一些Google Api检索结果(那里有很多,我使用的是 gdata-ruby-util,但需要一些黑客攻击.

你也可以使用tesseract-ocr作为OCR部分,它也是开源和积极开发的.

对于检索部分,我还要坚持使用hpricot,超级强大且灵活.

总结

以上是内存溢出为你收集整理的ruby-on-rails – 使用Ruby和Ubuntu进行光学字符识别全部内容,希望文章能够帮你解决ruby-on-rails – 使用Ruby和Ubuntu进行光学字符识别所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/1292516.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-10
下一篇 2022-06-10

发表评论

登录后才能评论

评论列表(0条)

保存