(wb1Document as IHtmlDocument2)bodyinnerHTML 获得html源码
然后对这个源码(也就是字符串)中的<img src="地址">提取出来就可以了,你可以用正则表达式 也可以直接用Pos函数这些,方法很多
或者用如下代码:
var
I:Integer;
begin
for I:=0 to Wb1OleObjectdocumentimageslength-1 do
lst1ItemsAdd(wb1OleObjectdocumentimagesitem(i)href);
end;
问题一:如何提取中的文字 在工作中,我常常在想,要是能把纸上有用的文字快速输入到电脑中,不用打字录入便可以大大提高工作效率该有多好呀!随着科技的发展, 这个问题在不断的解决,例如,现在市场上的扫描仪就带有OCR软件,可以把扫描的文字转换到电脑中进行编辑。但是,对于我们平常人来说,大多数人都是即不想多花钱购买不常用的设备,又不想费力气打字录入,那我就给大家提供一个我刚刚发现的方法吧!现在数码相机很普遍,也很常用,我们就从这里下手吧。
工具准备:
硬件: 电脑一台 数码相机
软件: word2003(其它的版本我没有实验)
doPDF (百度可以搜索下载,是一款免费的PDF制作软件)
AJViewer软件(在百度可以搜索下载,是一款免费的阅读器)
步骤:
1、在电脑中安装 doPDF和AJViewer
2、用数码相机把需要的文字拍下来(相机和照像水平就不多谈了。照片效果越好,可以大大缩小转换文字的误差率)
例如:
3、在word中插入你用数码相机照的书上的文字(打开word――插入菜单――――来自文件――选择照片――插入)
4、在word中选择文件菜单――打印――在打印机选项中选择doPDF――确定――点击“浏览”选项――选择文件保存的位置和填写文件名称――保存――确定
5、按照上面的步骤,电脑会自动打开AJViewer软件,若没有自动打开该软件,可以自己打开AJViewer软件,然后在AJViewer中打开刚刚转换的PDF文件。6、选择AJViewer中的,然后在需要的文字部分拖动鼠标画出虚线。
7、点击发送到word按钮,就可以转换成word文件了。可以编辑了。
第6、7步骤如下:
要点提示:
1、照片一定要平整,最好对比强烈。(最最关键的部分)
2、用doPDF生成PDF文件不只一种用法,你也可以选择其它更好、更便捷的方法,这里只提供我本此的实验软件。
3、如果熟练的使用我的方法,用不了一分钟就可以转出若干的文字,大大提高了工作效率。
4、切记:输出的文字一定要校对呀!
问题二:如何用PS提取字,把字变成单独的 你把做好的字输出成透明GIF格式就行了
问题三:Word2013怎么将上的文字提取出来 第一步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行(如图1所示)。
第二步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。
第三步 打开Microsoft Office Word 2003 ,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。如图所示,在“打印机”下拉列表框中选择“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个 MDI格式的文档了。
打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在d出的快捷 菜单中选择“将文本发送到Word”,即可将内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。
问题四:怎么把扫描的中的文字提取出来,变成文档。 已经扫描成的文件,要单独取出文字,一般是没有办法了。一般情况是这样弗你在扫描时就用文本扫描仪扫描,那么就会变成文字的文档。但前提是,你的扫描仪必须有这功能,如文本王等
问题五:我想把上的文字提取出来,就是仅仅是文字,然后放在另外一张上,请问怎么弄,用什么工具 如果要清晰最好是找好字体重新打字。如果要原图上的字就抠出来。魔棒选择白色,然后描边。
问题六:如何把文字(JPEG格式)里面文字提取出来 读取JPG照片里文字的方法:
1将有文储的照片复制到word文档中,另存为PDF文档(不知2003版的有无此功能)。
2打开CAJ软件,点击其中的文字识别按钮,即可读取照片中的文字了。(如果没有安装CAJ软件,可以马上下载,反正平时都在阅读PDF等文件。PS:或许你已经安装了adobe reader,试试它有无文字识别)
问题七:怎样将JPG中的文字提取出来? 读取JPG照片里文字的方法:
1将有文字的照片复制到word文档中,另存为PDF文档(不知2003版的有无此功能)。
2打开CAJ软件,点击其中的文字识别按钮,即可读取照片中的文字了。(如果没有安装CAJ软件,可以马上下载,反正平时都在阅读PDF等文件。PS:或许你已经安装了adobe reader,试试它有无文字识别)
问题八:有什么软件可以把照片上的文字提取出来成为文档吗 最简单的方法是自己照着照片重新打一遍哈哈,开玩笑的
我建议你在网上搜索一下OCR软件这类软件就是把上的字符识别成文本的一般图书馆都用这类软件把图书数字化的个人认为比较好的有尚书系列OCR软件,汉王系列等我以前用的是尚书软件很好用的
问题九:怎么将中的字提取到文档中? 什么上面的!普通,文档里的,还是哪的!可以用PS 抠图试试!再不行,Office程序中有三个插件:Microsoft Office Document Imaging、Microsoft Office Document Scanning和Microsoft Office Document Image Writer。使用这三个插件可以轻松提取出文档中的文字并使用文字编辑软件(如Wps、Word等)进行编辑。PDF中的话,有一个PDFedit啥的可以用一下试试!总之,具体问题具体分析吧!还不行,建议去百度网页搜搜看吧!祝你好运!
问题十:怎么把QQ截图上的文字提取出来 转文字,要么用OCR识别,要么手打,没有其他窍门。
要实现这个功能,要使用canvas来做,Canvas里面提供了一个toDataURL的接口,可以用这个接口获得的base64
所以思路是:
获得canvas对象
加载到canvas对象里面
从canvas对象中获取base64数据
<!DOCTYPE html><html>
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
function getBase64Image(img) {
var canvas = documentcreateElement("canvas");
canvaswidth = imgwidth;
canvasheight = imgheight;
var ctx = canvasgetContext("2d");
ctxdrawImage(img, 0, 0, imgwidth, imgheight);
var dataURL = canvastoDataURL("image/png");
return dataURL
// return dataURLreplace("data:image/png;base64,", "");
}
function main() {
var img = documentcreateElement('img');
imgsrc = '/images/yeomanpng';
imgonload =function() {
var data = getBase64Image(img);
consolelog(data);
}
documentbodyappendChild(img);
}
main()
</script>
</body>
</html>
然后可以在控制台看到base64的数据
希望可以帮到你
浏览器安全性已经大大提高,要实现上传预览不是那么简单了
不过有很多变通或先进的方法来实现
例如ie7/ie8的滤镜预览法,firefox 3的getAsDataURL方法
具体可以参考这个上传预览效果
var ifarme = documentgetElementsByClassName('hold_iframe')[0]childgetElementsByTagName("ifarme")[0];
var ifarme_val = ifarmeinnerHTML;
// 点击事件 在哪个范围就把下面的 document 替换
documentgetElementsByTagName('images')[0]onclick=function(){
// 事件执行的内容
}
试试这个代码,需要添加spiredoc jar依赖
import comspiredocDocument;import comspiredocFileFormat;
import comspiredocSection;
import comspiredocdocuments;
import comspiredocfieldsDocPicture;
public class InsertImage {
public static void main(String[] args) {
//实例化Document对象
Document doc = new Document();
//加载文档
docloadFromFile("C:\\Users\\Administrator\\Desktop\\testdocx");
//获取第一个section
Section section = docgetSections()get(0);
//添加一个段落
Paragraph para = sectionaddParagraph();
//添加到段落
DocPicture picture = paraappendPicture("C:\\Users\\Administrator\\Desktop\\Cartoonpng");
//设置文字环绕方式(居于文字上方)
picturesetTextWrappingStyle(TextWrappingStyleIn_Front_Of_Text);
//指定的相对位置
picturesetHorizontalOrigin(HorizontalOriginPage);
picturesetHorizontalPosition(250f);
picturesetVerticalOrigin(VerticalOriginTop_Margin_Area);
picturesetVerticalPosition(150f);
//设置大小
picturesetWidth(80f);
picturesetHeight(80f);
//保存到文档
docsaveToFile("output/InsertImagedocx", FileFormatDocx);
}
}
生成的Word:
给你个简单的例子,很多张的话判断是否是新的只能通过文件名了:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 40 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
<script>
function yulan()
{
var fileext=documentform1UpFilevaluesubstring(documentform1UpFilevaluelastIndexOf(""),documentform1UpFilevaluelength);
fileext=fileexttoLowerCase();
if ((fileext!='jpg')&&(fileext!='gif')&&(fileext!='jpeg')&&(fileext!='png')&&(fileext!='bmp'))
{
alert("对不起,系统仅支持标准格式的照片,请您调整格式后重新上传,谢谢 !");
documentform1UpFilefocus();
}
else
{
//alert(''+documentform1UpFilevalue);
documentgetElementById("preview")innerHTML="预览区<img src='"+documentform1UpFilevalue+"' style='border:6px double #ccc';padding:5px;>"
}
}
</script>
<style>
#preview{
border: 1px dashed #F00;
width:200px;
height:200px
}
</style>
</HEAD>
<BODY>
上传前御览
<form name="form1" method="POST" enctype="multipart/form-data">
<input type="file" name="UpFile" size="46" onchange="yulan()">
<div id="preview">预览区</div>
</form>
</BODY>
</HTML>
以上就是关于delphi webbrowser获取图片地址全部的内容,包括:delphi webbrowser获取图片地址、怎么提取图片上的文字、如何获取html里<object>标签视频图片的base64值等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)