读取HTML并取其中一部分内容如何实现

读取HTML并取其中一部分内容如何实现,第1张

将文章的html代码存入到数据库中,读取时不能简单地截取一定字符,必须根据html的结构适当截取内容,否则将显示错误,下面是使用SystemWindowsForms中的WebBrowser进行Html解析的代码

public string GetAbstract(string content, int maxLength)

{

  string text = "";

  SystemWindowsFormsHtmlDocument html;

  if (contentLength < maxLength)

  {

   text = content;

  }

  else

  {

   SystemWindowsFormsWebBrowser browser = new SystemWindowsFormsWebBrowser();

   browserNavigate("about:blank");

   html = browserDocumentOpenNew(true);

   browserDispose();

   htmlWrite(content);

   foreach (SystemWindowsFormsHtmlElement ele in htmlBodyChildren)

   {

    if (textLength + eleOuterHtmlLength < maxLength)

    { text += eleOuterHtml; }

    else { break; }

   }

  }

  return text;

}

}

可以再ie的临时文件夹中找后缀名是html等文件,当然文件名也可以自己定义,然后直接按文本处理就行了,因为title和p都是闭合的标签,先找<title>,后面的放进用io流什么的写进txt,找到</title>就停。

iframe取得html内容的方法是利用jquery解析dom树实现的。

例如有如下iframe:

<iframe id="ifrmReportViewer" name="ifrmReportViewer" frameborder="0" width="980"

<div id="EndLetterSequenceNoToShow" runat="server"> 11441551 </div> Or

<form id="form1" runat="server">

<div style="clear: both; width: 998px; margin: 0 auto;" id="divInnerForm">

从这里获取所需要的内容

</div>

</form>

</iframe>

获取div内容的方法:

var iContentBody = $("#ifrmReportViewer")contents()find("body");

var endLetterSequenceNo = iContentBodyfind("#EndLetterSequenceNoToShow")text();

或者是

var divInnerFormText = iContentBodyfind("#EndLetterSequenceNoToShow")text();

documentgetElementById('iframe')contentWindowdocumentbodyinnerHTML

ajax是jquery框架中的一个方法,主要用于异步传输数据

ajax可以通过success回调函数得到返回结果

具体步骤请参考以下代码块

$ajax({ url: "testhtml", context: documentbody, success: function(e){

       alert(e);

     }});

我写的都是使用JQuery的哦

1)<h1 id="hn">你好</h1> 取值的方法: $("#hn")text();

2)<h1 class="hn">你好</h1> 取值的方法: $("hn")text();

3)<h1>你好</h1> 如果只有一个<h1>标签,你也要取第一个<h1>标签的内容,取值的方法: $("h1")[0]text();

1、新建一个html文件,命名为testhtml。

2、在testhtml文件内,创建一个div模块,并设置其id属性为mydiv,用于下面使用js获得标签对象。

3、在testhtml文件内,在div标签内,填写一段文字,并加入一个span标签。

4、在testhtml文件内,创建一个button按钮,按钮名称为“获取html”。

5、给button绑定onclick点击事件,当按钮被点击时,执行myfun()函数。

6、在testhtml文件内,在js标签内,创建myfun()函数,在函数内,使用getElementById()方法获得div对象,通过innerHMTL属性获得div内的html内容,最后,使用alert方法将获得的html内容以d窗形式显示

7、在浏览器打开testhtml文件,点击按钮,查看获得的html标签内容。

用正则表达式的方法

<SCRIPT LANGUAGE="vbScript">

dim str

str="怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码。"

alert RegExpTest("[\u4e00-\u9fa5]",str)

Function RegExpTest(patrn, strng)

Dim regEx, Match, Matches ' 建立变量。

Set regEx = New RegExp ' 建立正则表达式。

regExPattern = patrn ' 设置模式。

regExIgnoreCase = True ' 设置是否区分大小写。

regExGlobal = True ' 设置全局替换。

Set Matches = regExExecute(strng) ' 执行搜索。

For Each Match in Matches ' 遍历 Matches 集合。

RetStr = RetStr & MatchValue

Next

RegExpTest = RetStr

End Function

</SCRIPT>

jquery获取input值的几种方法

jquery和javascript获取input输入框中的值多种实现方法

你好,获取input输入框的值可以用多种方法来实现,具体的要看你实际的情况。

例:

先准备一段HTML

<input type="text" id="CSDN_NAME" name="CSDN_NAME" class="CSDN_NAME">

一、jquery方法

通过 name 实现

var name = $('input[name="CSDN_NAME"]')val();

二、javascript方法

通过 id 实现

var name = documentgetElementById("CSDN_NAME")value

还有更多jquery和javascript来获取input输入框的值的方法可以参照:

jquery获取input值的几种方法

以上就是关于读取HTML并取其中一部分内容如何实现全部的内容,包括:读取HTML并取其中一部分内容如何实现、如何提取HTML中的特定内容、iframe 怎么取得html内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9733418.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存