仅供参考,下面记录了我所做的事情:
- XLRD很实用,但是我只是将Excel数据另存为CSV,因此我可以使用
LOAD DATA INFILE
- 我已经复制了标题行并开始编写导入和规范化脚本
- 脚本可以:
CREATE TABLE
将所有列都作为TEXT,主键除外 - 查询mysql:
LOAD DATA LOCAL INFILE
将所有CSV数据加载到TEXT字段中。 - 根据的输出
PROCEDURE ANALYSE
,我能够为ALTER TABLE
列提供正确的类型和长度。对于几乎没有不同值的任何列PROCEDURE ANALYSE
返回ENUM
,这不是我所需要的,但是我发现以后对规范化很有用。用200列的眼球轻而易举PROCEDURE ANALYSE
。PhpMyAdmin的输出表明表结构是垃圾。 - 我写了一些归一化方法,主要
SELECT DISTINCT
用于列和INSERT
ing结果以分离表。我在旧表中首先添加了FK列。在之后INSERT
,我得到了它的ID并UPDATE
在FK列中进行了编辑。循环完成后,我删除了旧列,仅保留FK列。与多个从属列相似。这比我预期的要快得多。 - 我运行(django)
python manage.py inspctdb
,将输出复制到models.py并添加了所有这些,ForeignkeyField
因为MyISAM中不存在FK。编写了一些python views.py,urls.py,一些模板… TADA
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)