SQL数据库中的一个表保存了富文本格式的字段。比如——见补充内容。 请教如何把其中的文字提取出来

SQL数据库中的一个表保存了富文本格式的字段。比如——见补充内容。 请教如何把其中的文字提取出来,第1张

从系统表中可以获得。

pg中可以这样查找出字段所在的表的名称:

select

relname

from

pg_class

where

oid

=

(select

attrelid

from

pg_attribute

where

attname

=

'字段名称')

把数据保存到list中,然后通过程序连接oracle,将list中的数据遍历插入到数据库中就ok了,具体java连接oracle并插入数据可以参考这个例子

http://zhidao.baidu.com/question/305951758.html?oldq=1

其实这个问题不需要这么多分的

Word 转 html 想要保证格式完全不变的话基本没可能,多少都要变些的,特别是图片的处理。

公式显示我认为不是什么问题,你可以测试看看文档另存为,另存为htm文件后公式已经变成图片了(通过word插入的公式)。

我认为你的问题的核心是怎么去匹配各个元素(题干、选项之类的),先将Word文件另存为htm文件,然后分析各个元素,正则提取元素内容吧,格式能不要就尽量不要了,以后放到页面浏览时统一制定格式还好处理些,实在不行就在取题目元素时将转换后的htm样式定义保存下来统一处理。

总之,问题铁定是可以解决的,看你怎么处理了,另外,office2007的文档信息可以通过 xml 处理,那样应该要好办很多,结合 htm 看看吧。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6698920.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存