将文章的html代码存入到数据库中,读取时不能简单地截取一定字符,必须根据html的结构适当截取内容,否则将显示错误,下面是使用SystemWindowsForms中的WebBrowser进行Html解析的代码
public string GetAbstract(string content, int maxLength){
string text = "";
SystemWindowsFormsHtmlDocument html;
if (contentLength < maxLength)
{
text = content;
}
else
{
SystemWindowsFormsWebBrowser browser = new SystemWindowsFormsWebBrowser();
browserNavigate("about:blank");
html = browserDocumentOpenNew(true);
browserDispose();
htmlWrite(content);
foreach (SystemWindowsFormsHtmlElement ele in htmlBodyChildren)
{
if (textLength + eleOuterHtmlLength < maxLength)
{ text += eleOuterHtml; }
else { break; }
}
}
return text;
}
}
可以再ie的临时文件夹中找后缀名是html等文件,当然文件名也可以自己定义,然后直接按文本处理就行了,因为title和p都是闭合的标签,先找<title>,后面的放进用io流什么的写进txt,找到</title>就停。
iframe取得html内容的方法是利用jquery解析dom树实现的。
例如有如下iframe:
<iframe id="ifrmReportViewer" name="ifrmReportViewer" frameborder="0" width="980"
<div id="EndLetterSequenceNoToShow" runat="server"> 11441551 </div> Or
<form id="form1" runat="server">
<div style="clear: both; width: 998px; margin: 0 auto;" id="divInnerForm">
从这里获取所需要的内容
</div>
</form>
</iframe>
获取div内容的方法:
var iContentBody = $("#ifrmReportViewer")contents()find("body");
var endLetterSequenceNo = iContentBodyfind("#EndLetterSequenceNoToShow")text();
或者是
var divInnerFormText = iContentBodyfind("#EndLetterSequenceNoToShow")text();
documentgetElementById('iframe')contentWindowdocumentbodyinnerHTML
ajax是jquery框架中的一个方法,主要用于异步传输数据
ajax可以通过success回调函数得到返回结果
具体步骤请参考以下代码块
$ajax({ url: "testhtml", context: documentbody, success: function(e){alert(e);
}});
我写的都是使用JQuery的哦
1)<h1 id="hn">你好</h1> 取值的方法: $("#hn")text();
2)<h1 class="hn">你好</h1> 取值的方法: $("hn")text();
3)<h1>你好</h1> 如果只有一个<h1>标签,你也要取第一个<h1>标签的内容,取值的方法: $("h1")[0]text();
1、新建一个html文件,命名为testhtml。
2、在testhtml文件内,创建一个div模块,并设置其id属性为mydiv,用于下面使用js获得标签对象。
3、在testhtml文件内,在div标签内,填写一段文字,并加入一个span标签。
4、在testhtml文件内,创建一个button按钮,按钮名称为“获取html”。
5、给button绑定onclick点击事件,当按钮被点击时,执行myfun()函数。
6、在testhtml文件内,在js标签内,创建myfun()函数,在函数内,使用getElementById()方法获得div对象,通过innerHMTL属性获得div内的html内容,最后,使用alert方法将获得的html内容以d窗形式显示
7、在浏览器打开testhtml文件,点击按钮,查看获得的html标签内容。
用正则表达式的方法
<SCRIPT LANGUAGE="vbScript">
dim str
str="怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码。"
alert RegExpTest("[\u4e00-\u9fa5]",str)
Function RegExpTest(patrn, strng)
Dim regEx, Match, Matches ' 建立变量。
Set regEx = New RegExp ' 建立正则表达式。
regExPattern = patrn ' 设置模式。
regExIgnoreCase = True ' 设置是否区分大小写。
regExGlobal = True ' 设置全局替换。
Set Matches = regExExecute(strng) ' 执行搜索。
For Each Match in Matches ' 遍历 Matches 集合。
RetStr = RetStr & MatchValue
Next
RegExpTest = RetStr
End Function
</SCRIPT>
jquery获取input值的几种方法
jquery和javascript获取input输入框中的值多种实现方法
你好,获取input输入框的值可以用多种方法来实现,具体的要看你实际的情况。
例:
先准备一段HTML
<input type="text" id="CSDN_NAME" name="CSDN_NAME" class="CSDN_NAME">一、jquery方法
通过 name 实现
var name = $('input[name="CSDN_NAME"]')val();二、javascript方法
通过 id 实现
var name = documentgetElementById("CSDN_NAME")value还有更多jquery和javascript来获取input输入框的值的方法可以参照:
jquery获取input值的几种方法
以上就是关于读取HTML并取其中一部分内容如何实现全部的内容,包括:读取HTML并取其中一部分内容如何实现、如何提取HTML中的特定内容、iframe 怎么取得html内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)