Python爬虫大作业(仿虎牙直播客户端)

Python爬虫大作业(仿虎牙直播客户端),第1张


一、大作业要求

结合所选专业方向(信息处理、嵌入式、人工智能、大数据处理),用所学Python技术设计并实现一个与专业方向技术相关的、功能完整的系统,并撰写总结报告。


实现要求: (1)实现涵盖以下技术:
  • 图形界面、
  • 多线程、
  • 文件 *** 作、
  • 数据库编程、
  • 网页爬虫、
  • 异常处理。


A可侧重于应用系统,结合爬虫丰富系统功能,提升用户体验。



B可考虑实现物联网。



C可侧重于爬取网站图片,并进行图形或图像识别。



D可侧重于基于爬虫进行数据采集,并进行数据的统计分析。


(2)系统具有一定复杂度。


爬取图片不少于500张。


采集数据不少于1000条,统计分析的目标不能少于3个。


其中每项均可根据需求进行增添或删减。




二、设计方案 1、设计了虎牙主页的爬虫,包括直播间封面、主播名、人气、直播间标题、主播id、主播房间号等信息。


另附虎牙直播分类页面进行对比查阅:虎牙直播分类

2、使用python3实现爬取数据,使用sqlite3模块进行数据存储,本地化存储,不需要额外安装数据库软件,但相应的不能可视化 *** 作数据库内容;使用plt模块进行数据的绘图,使用tkinter模块实现界面。


3、通过tkinter的绑定事件,实现了单击列名可使列表按字符升序(降序)排列;实现了单击某一主播会在软件主页面更新页面图片,双击时会在浏览器打开该主播的直播间;实现了快捷键绑定,如F5刷新列表,Ctrl+F聚焦搜索框;实现了主播列表里的搜索功能,可通过Ctrl+F快捷键快速搜索;实现了单击页面图片可在浏览器跳转到对应主播的直播间



三、软件支持

  • Windows 10 *** 作系统(理论上对Windows版本无要求)
  • Visual Studio 2022 Community(2017发行版及以上)
  • Python3开发环境(笔者本人版本号为3.9.5)


四、作业实现成果








[运行说明]


运行代码前需要更改图中所示的变量,确保路径有效,文件存在,否则运行会报错。


[附件]

代码及文件:代码及附件

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/568222.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-09
下一篇 2022-04-09

发表评论

登录后才能评论

评论列表(0条)

保存