邮箱有开放的API:直接编写程序,通过接口拿到邮箱内容数据,用相应字段接收即可,后面就是将内容保存到目标数据库了。
没有API开放接口:可以使用编写爬虫程序来获得,也就是用程序模仿人为登录、查看邮件内容,然后在打开的网页里提取出需要的内容,并保存到数据库,注意一点,编写爬虫时需要考虑到邮箱提供方的反爬限制,只有充分研究之后才能提出比较好的爬虫系统方案,建议用python来做,网上爬虫案例很好、很多,望君采纳。
1. 数据库中保存的HTML内容都是文本格式, 数据库字段如ORACLE选用VARCHAR2(2000)或CLOB(大对象)2. 一般的HTML编辑器,是对上传的对象(如图片、文档等)保存到服务器临时目录,并在HTML代码中保存HTML连接的方式
因此,向数据库中写HTML页面实际上就相当于把HTML的文本保存到数据库中,如果文本较大, 可以用中间变量做缓存(buffer)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)