js获取网页当中所有标签里面的文本

js获取网页当中所有标签里面的文本,第1张

<!DOCTYPE HTML>

<html>

<head>

<meta charset=UTF-8>

<title>recursion</title>

<style type="text/css">

</style>

<script type="text/javascript">

    var array = [];

    onload = function ()

    {

        var tags = documentbodygetElementsByTagName ('');

        for ( var i = 0; i < tagslength; i++)

        {

            arraypush (getText (tags[i]));

        }

        consolelog (array);

    }

     

    var getText = function (dom)

    {

        var index = 0, html = dominnerHTML;

        while (domchildrenlength && index < domchildrenlength)

        {

            var chtml = domchildren[index]outerHTML;

            html = dominnerHTMLreplace(chtml, '');

            index++;

        }

        return "<font>" + html + "</font>";

    }

</script>

</head>

<body>

    <p>

        ths is p<a href="">this is a</a>wyz

    </p>

    <i>this is i</i>

    <b>this is b</b>

</body>

</html>

在jsp本页获取本页input text的值是通过js获取的。

1、jsp中的input定义如下:

<!-- 获取文本框的值 -->

<div id="test1">

<input id="input_text1" type="text" value="test1" style="width: 100px;" />

<button id="button_text1">test1</button>

</div>

2、获取值的方法:

$("#button_text1")click(function(){

var result1 = $("#input_text1")val();

alert("result1 = " + result1);

});

//得到WQM进程句柄

Plugin PID=WebBind("wqmexe")

//打开一个网页地址连接

Plugin WebGo(">

你的意思就是获取当前网页内容吧?

C#代码如下:

//必要的命名空间

using

SystemIO;

using

SystemNet;

var

url

="你的URL地址";

var

request

=

(>

import sys

from lxml import etree

reload(sys)

syssetdefaultencoding("utf8")

import requests

r = requestsget('>

程序集 窗口程序集1子程序 _按钮1_被单击局部变量 网页, 网页文档类网页初始化 (, 超文本浏览框1取窗口句柄 ())编辑框1内容 = 网页取网页属性 (#网页属性_网页文本)需要易语言网页 *** 作类模块

调用下面这个子程序就可以了实现你想要的功能了

子程序 取指定内容, 文本型, , 取出想要的内容

参数 完整内容, 文本型

参数 左边文本, 文本型

参数 右边文本, 文本型

局部变量 临时位置, 整数型

局部变量 总长度, 整数型

局部变量 临时文本, 文本型

总长度 = 取文本长度 (完整内容)

临时位置 = 寻找文本 (完整内容, 左边文本, , 假) + 取文本长度 (左边文本)

临时文本 = 取文本中间 (完整内容, 临时位置, 总长度)

总长度 = 取文本长度 (临时文本)

临时位置 = 寻找文本 (临时文本, 右边文本, , 假) - 1

临时文本 = 取文本中间 (临时文本, 1, 临时位置)

返回 (临时文本)

首先贴出一下选择框的网页元素代码<div class="select"><select id="cond_PSPT_TYPE" name="cond_PSPT_TYPE" disabled="disabled" class="e_select" desc="选择框" type="text"> <option value="">-----默认选择-----</option> <option value="0">选项0</option> <option value="1">选项0</option> </select></div> </div></div> 先通过IHTMLSelectElement接口获得所选item的value,程序中是strValue;再通过IHTMLOptionElement接口遍历判断value同strValue的下拉选项元素的文本信息。 CString GetText() { CString strValue; CString strText; HRESULT hr; IDispatch pDisp; pDisp = m_webBrowserget_Document(); // 获取webbrowser控件文档接口 IHTMLDocument2 pDoc; hr = pDisp->QueryInterface( IID_IHTMLDocument2, (void)&pDoc ); // 获取 *** 作界面的文档接口 IHTMLElementCollection pColl = NULL; hr = pDoc->get_all( &pColl ); // 获取网页元素集合 // ------------------------获取选择框的所选item的value----------------------------------------- VARIANT index; VARIANT varID; V_VT(&index) = VT_I4; V_I4(&index) = 0; CString IDSelect = "cond_PSPT_TYPE"; // IDSelect是选择框的网页元素ID varID = StringToVariant(IDSelect); hr = pColl->item(varID, index, &pDisp); // 获得选择框位置 if ( (hr == S_OK) && (pDisp != NULL) ) { IHTMLSelectElement pSelect; // 获得选择框元素接口 hr = pDisp->QueryInterface(IID_IHTMLSelectElement,(void )&pSelect ); if ( (hr == S_OK) && (pSelect != NULL) ) { BSTR bstr = SysAllocString(L""); pSelect->get_value(&bstr); // 获取选择框所选item的value strValue = bstr; pSelect->Release(); } pDisp->Release(); } // ------------------------获取选择框的所选item的文本信息-------------------------------------- long cntElement; hr = pColl->get_length(&cntElement); // 获取网页元素个数 for(int i = 0; i < cntElement; i++) { IDispatch pDisp2; V_I4(&index) = i; hr = pColl->item( index,index, &pDisp2 ); // 获取元素位置 if ( (hr == S_OK) && (pDisp2 != NULL) ) { IHTMLOptionElement pOptElem; // 获取下拉选项元素接口 hr = pDisp2->QueryInterface(IID_IHTMLOptionElement,(void )&pOptElem); if ( (hr == S_OK) && (pOptElem != NULL) ) { BSTR bstr = SysAllocString(L""); pOptElem->get_value(&bstr); // 获取下拉选项元素的value CString strTemp = ""; strTemp = bstr; if(strTemp == strValue) { pOptElem->get_text(&bstr); // 获取下拉选项元素的文本信息 strText = bstr; i = cntElement; } pOptElem->Release(); } pDisp2->Release(); } } pDoc->Release(); pColl->Release(); return strText; }

以上就是关于js获取网页当中所有标签里面的文本全部的内容,包括:js获取网页当中所有标签里面的文本、在jsp本页怎么获取本页input text的值、如何用网页精灵抓取网页文本等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/10626380.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-10
下一篇 2023-05-10

发表评论

登录后才能评论

评论列表(0条)

保存