为获取LEED认证项目的评分表明细,可以从USGBC的项目页面上爬取,或者从pdf格式的项目评分表中解析得到。以 重庆某LEED EM:OB v2009 Gold项目 为例,USGBC上公布的 LEED项目得分表 其格式并不统一,利用XPath爬取后需要进一步清洗处理。相对而言,LEED项目所对应的 项目评分表PDF文件 的数据更为规范完整。因此考虑尝试解析出PDF文件中的表格,以便后续分析。
Python 处理PDF文件的程序包,pdfminer、tabula、pdfplumber、camelot……查询资料表明,似乎普遍认为pdfminer的效果不怎么好,而tabula需要java支持 ,想偷懒于是只试了pdfplumber和camelot。
安装过程不赘述,直接来看运行结果。
pdfplumber无法直接解析出Scorecard.pdf文件中的表格,但实际上要解决此问题也并非难事。调整下思路,可先解析出pdf文件中的文本,让后通过分列来得到表格。
利用pdfplumber的extract_text()命令可解析出pdf文件中的文本,但由于本次需要解析的得分表pdf文件的排版的原因,左右两个表格的文本行并未完全对齐,因此如果直接解析完整页面上的文本的话,文字会出错。先用corp()命令指定识别范围,然后再extract_text(),识别得到的文本列表如下所示。
对于类似本例中Scorecard.pdf表格排版有错位的情况,也可以按照表格在页面中所处的位置,指定表格识别的范围。所用到的指令:camelot.plot()可以绘制出页面的略图,table_area参数可以指定表格识别的范围。
又及,Camelot原来是亚瑟王和圆桌骑士们的宫殿所在地,和Asgard的Valhalla一样,也是传说中的圣域。搜索camelot程序安装包时无意中学到的,涨知识了。
[1] Python:解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比
[2] 用Python提取pdf文件中的表格数据
[3] python读取pdf文件
[4] Github: pdfplumber
[5] Camelot: PDF Table Extraction for Humans
[6] ImageMagick Installation
[7] ImageMagick之PDF转换成图片(image)
[8] LEED 2009 for Existing Buildings: Operations &Maintenance
[9] Camelot - Wikipedia
[10] List o’ 10 Intriguing Mythical Places
[11] Camelot识别pdf表格时的参数设置补充
修改方一:修改好的数据库备份文件,使用RE管理器覆盖就可以用了(此方法会有本人的玩家资料就是个用户名和战绩的问题啦!不喜欢的可以采用后面详细的修改方法)
1.安装游戏后先进入游戏,创建个角色名
2.用RE覆盖目录地址:
HD高分辨率 : /data/data/com.gale.sanguokill.hd/databases/
普通低分辨率: /data/data/com.gale.sanguokill.md/databases/
3.解压附件覆盖上面目录的com.gale.sgkill.dbmanager文件(卡牌全5W)
有本人战功和称号版本数据库
战功称号均为0,玩家姓名:金城武(可自行修改)数据库修改方法二:道具卡详细修改说明(比较繁琐,怕麻烦的机油可以采用上面的方法):
1.首先ROOT
2.电脑可以运行adb命令(有的机油adb命令执行不了或者有问题的,可以使用这个)
3.用RE检查(/system/xbin)目录下sqlite3文件是否存在,如果不存在下载文件放到制定对应目录中
4.用RE文件管理器,让/system文件夹可读写
5.手机链接电脑,打开usb调试
6.开始cmd依次执行命令
[1]进入命令提示行
#adb shell
[2] 修改 sqlite3 权限
# chmod 4755 /system/xbin/sqlite3
[3]进入程序在系统中的安装目录
HD高分辨率 : cd /data/data/com.gale.sanguokill.hd/databases
普通低分辨率:cd /data/data/com.gale.sanguokill.md/databases
[4]进入数据库
#sqlite3 com.gale.sgkill.dbmanager
[5]修改数据库文件
insert into scoreCardTable(cardID,nums) values(0,50000)
insert into scoreCardTable(cardID,nums) values(1,50000)
insert into scoreCardTable(cardID,nums) values(2,50000)
insert into scoreCardTable(cardID,nums) values(3,50000)
insert into scoreCardTable(cardID,nums) values(4,50000)
insert into scoreCardTable(cardID,nums) values(5,50000)
insert into scoreCardTable(cardID,nums) values(6,50000)
insert into scoreCardTable(cardID,nums) values(7,50000)
insert into scoreCardTable(cardID,nums) values(8,50000)
insert into scoreCardTable(cardID,nums) values(9,50000)
insert into scoreCardTable(cardID,nums) values(10,50000)
insert into scoreCardTable(cardID,nums) values(11,50000)
insert into scoreCardTable(cardID,nums) values(12,50000)
insert into scoreCardTable(cardID,nums) values(13,50000)
insert into scoreCardTable(cardID,nums) values(14,50000)
insert into scoreCardTable(cardID,nums) values(15,50000)
insert into scoreCardTable(cardID,nums) values(16,50000)
insert into scoreCardTable(cardID,nums) values(17,50000)
insert into scoreCardTable(cardID,nums) values(18,50000)
insert into scoreCardTable(cardID,nums) values(19,50000)
.exit
微软还做 游戏 XBOX 还有鼠标 键盘 还有其他非系统软件 比如office 游戏软件帝国时代 (Age of Empires)(正版发布有6个分别为:帝国时代1、帝国时代之罗马复兴、帝国时代2与资料片帝国时代2之征服者、帝国时代3与资料片帝国时代3之亚洲王朝和酋长)
微软模拟飞行 (Microsoft Flight Simulator)
微软模拟火车
微软模拟货车
光晕(Halo)
光晕2(Halo2)
光晕3(Halo3)
国家的崛起(Rise of Nations)与资料片《国家的崛起:爱国战争》以及不是很成功的《国家的崛起:传奇的崛起》
苹果 做系统 MAC OS 也有些软件 Safari
QuickTime
HyperCard Final Cut Studio
Final Cut Pro
Soundtrack Pro
Motion
DVD Studio Pro
设备就是苹果电脑 服务器 IPOD IPHONE 等等
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)