用jacobjar吧, 读取word还是挺方便的,也可以把word直接转换成HTML或者jsp。
而HTML也可以直接用BufferedReader()的方法来读取里面的数据再添加删除你需要的数据再转换成jsp。
你留个邮箱或者QQ的话 我可以给你发一些java用jacob类库 *** 作word的方法。
POI和jxtl也可以 *** 作
Java 有相应的API库能够处理这个,代码我就不给你具体写了,API库的名字是 Apache POI,是专门处理Microsoft Office相关文件的,给个参考链接吧:
>
FileInputStream in = new FileInputStream("D://22doc ");
WordExtractor extractor = new WordExtractor();
String str = extractorextractText(in);
int start = strindexOf("AA");
int end = strindexOf("BB");
Systemoutprintln(strsubstring(start, end));
记得导入tm-extractors-04jar 包
word有微软的专用格式,如果要读取其内容,可以使用jar包,如下:
1。用jacob
其实jacob是一个bridage,连接java和com或者win32函数的一个中间件,jacob并不能直接抽取word,excel等文件,需要自己写dll哦,不过已经有为你写好的了,就是jacob的作者一并提供了。
jacob下载: >
以上就是关于java读取带格式word内容全部的内容,包括:java读取带格式word内容、怎么用Java读取word文档里的内容格式信息,比如标题字体,颜色和段间距什么的、java中使用jacob怎么读取word里的部分内容,以字符串形式返回等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)