如何使用Python加载网站所有页面

如何使用Python加载网站所有页面,第1张

python 打开浏览器,可以做简单的刷网页的小程序。仅供学习,别用非法用途。

python的webbrowser模块支持对浏览器进行一些 *** 作,主要有以下三个方法:

复制代码代码如下:

webbrowseropen(url, new=0, autoraise=True)

webbrowseropen_new(url)

webbrowseropen_new_tab(url)

我们需要了解webbrowseropen()方法:

复制代码代码如下:

webbrowseropen(url, new=0, autoraise=True)

在系统的默认浏览器中访问url地址,如果new=0,url会在同一个

浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2

新的浏览器tab会被打开。

而webbrowserget()方法可以获取到系统浏览器的 *** 作对象。

webbrowserregister()方法可以注册浏览器类型,而允许被注册的类型名称如下:

复制代码代码如下:

Type Name Class Name Notes

'mozilla' Mozilla('mozilla')

'firefox' Mozilla('mozilla')

'netscape' Mozilla('netscape')

'galeon' Galeon('galeon')

'epiphany' Galeon('epiphany')

'skipstone' BackgroundBrowser('skipstone')

'kfmclient' Konqueror() (1)

'konqueror' Konqueror() (1)

'kfm' Konqueror() (1)

'mosaic' BackgroundBrowser('mosaic')

'opera' Opera()

'grail' Grail()

'links' GenericBrowser('links')

'elinks' Elinks('elinks')

'lynx' GenericBrowser('lynx')

'w3m' GenericBrowser('w3m')

'windows-default' WindowsDefault (2)

'macosx' MacOSX('default') (3)

'safari' MacOSX('safari') (3)

'google-chrome' Chrome('google-chrome')

'chrome' Chrome('chrome')

'chromium' Chromium('chromium')

'chromium-browser' Chromium('chromium-browser')

DEMO:

复制代码代码如下:

#!/usr/bin/env python

#-- coding:UTF-8 --

import sys

import webbrowser

syspathappend("libs")

url = 'httucom'

webbrowseropen(url)

print webbrowserget()

首先安装jieba模块,pip install jieba

然后在程序里引用,import jieba

import jieba

seg_list = jiebacut("我来到北京清华大学,我来到北京清华大学", cut_all=True)

print("Full Mode: " + "/ "join(seg_list))  # 全模式

# 输出: Full Mode: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学/ / / 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学

模块是指一个可以交互使用,或者从另一Python程序访问的代码段。只要导入了一个模块,就可以引用它的任何公共的函数、类或属性。模块可以通过这种方法来使用其它模块的功能。用import语句导入模块,就在当前的名称空间(namespace)建立了一个到该模块的引用这种引用必须使用全称,也就是说,当使用在被导入模块中定义的函数时,必须包含模块的名字。所以不能只使用funcname,而应该使用modnamefuncname!

import pytmatrix,然后你就可以用pytmatrix里面的函数,pytmatrix这个包可以用pip下载或者>

步骤1:安装Python开发包

由于需要访问Python/C API,首先安装Python开发包。

在Debian,Ubuntu或Linux Mint中:

在CentOS,Fedora或RHEL中:

安装成功后,Python头文件在/usr/include/python27。根据Linux发行版的不同,确切的路径可能是不相同的。例如,CentOS 6中是/usr/include/python26。

步骤2:初始化解释器并设置路径

C中嵌入Python的第一步是初始化Python解释器,这可以用以下C函数完成。

初始化解释器后,需要设置你的C程序中要导入的Python模块的路径。例如,比如你的Python模块位于/usr/local/modules。然后使用以下C函数调用来设置路径。

步骤3:数据转换

C中嵌入Python最重要的方面之一是数据转换。从C中传递数据到Python函数,需要首先将数据从C数据类型转换到Python数据类型。Python/C API提供各种函数来实现这。例如,转换C字符串到Python字符串,使用PyString_FromString函数。

另外一个类似函数PyInt_FromLong,将C中long数据类型转换为Python int。每个Python/C API函数返回一个PyObject类型的引用。

步骤4:定义一个Python模块

当你想嵌入Python代码到另一种语言如C,该代码需要被写成Python模块,然后用另一种语言“导入”。所以让我们来看看如何在C中导入Python模块。

为了进行说明,我们实现一个简单的Python模块例子如下:

以上的Python函数有一个字符串作为参数并返回两个重复的字符串。例如,如果输入字符串是“cyberpersons”,该函数返回'cyberpersonscyberpersons'。此模块文件命名为“printDatapy”并将它放在前面声明的Python模块目录中(/usr/local/modules)。

步骤5:加载一个Python模块

现在你已经定义了Python模块,是时候在C程序中加载它了。导入模块的C代码看起来像这样:

步骤6:构建函数的参数

当加载一个模块时,可以调用模块中定义的Python函数。通常,我们需要传递一个或多个参数到一个Python函数。我们必须构建一个Python元组对象,它包括Python函数中的参数。

在我们的例子中,printData函数定义带一个参数的模块。因此,我们构建一个大小是一的Python元组对象如下。我们可以使用PyTuple_SetItem设置元组对象的每个项。

我们已经成功构建一个参数传递到函数调用,是时候从C程序调用python函数了。

步骤7:调用Python函数

一旦成功创建Python元组对象作为函数参数,我们可以调用一个带参数的Python函数。为此,通过使用PyObject_GetAttrString首先获得模块中定义的函数的引用,然后使用PyObject_CallObject调用该函数。例如:

步骤8:错误检查

避免运行时错误的常见方法是检查函数的返回值并根据返回值采取适当的行动。类似于C程序中的全局变量errno,Python/C API提供一个全局指示符,它报告最后发生的错误。当Python/C API函数失败,全局指示符设置为指示错误,并且PyErr_Print可以用于显示相应的人类可读的trackback。例如:

在你的应用程序中,你可以轻松地将各种错误检查。

这里是完整的C程序,它如本教程描述的嵌入Python代码。

步骤9:编译和执行

保存以上代码到finalCodec,并且链接Python库(-lpython27)编译该代码。根据发行版的不同,可能使用不同的版本(例如,-lpython26)。

以上就是关于如何使用Python加载网站所有页面全部的内容,包括:如何使用Python加载网站所有页面、python怎么加载jieba模块、Python 怎么解除加载后的模块等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10637692.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-10
下一篇 2023-05-10

发表评论

登录后才能评论

评论列表(0条)

保存