先说说数据仓库和数据挖掘的关系,再说说数据库与数据仓库的关系
数据仓库与数据挖掘的联系
(1) 数据仓库为数据挖掘提供了更好的、更广泛的数据源。
(2) 数据仓库为数据挖掘提供了新的支持平台。
(3) 数据仓库为更好地使用数据挖掘这个工具提供了方便。
(4) 数据挖掘为数据仓库提供了更好的决策支持。
(5) 数据挖掘对数据仓库的数据组织提出了更高的要求。
(6) 数据挖掘还为数据仓库提供了广泛的技术支持。
数据仓库与数据挖掘的差别
(1) 数据仓库是一种数据存储和数据组织技术, 提供数据源。
(2) 数据挖掘是一种数据分析技术, 可针对数据仓库中的数据进行分析。
1、数据库:是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里面有很多字段。字段一字排开,对数据就一行一行的写入表中。数据库的表,在于能够用二维表现多维的关系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
2、数据仓库:是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方,只不过从数据量来说,数据仓库要比数据库更庞大德多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策;
区别主要总结为以下几点:
1.数据库只存放在当前值,数据仓库存放历史值;
2.数据库内数据是动态变化的,只要有业务发生,数据就会被更新,而数据仓库则是静态的历史数据,只能定期添加、刷新;
3.数据库中的数据结构比较复杂,有各种结构以适合业务处理系统的需要,而数据仓库中的数据结构则相对简单;
4.数据库中数据访问频率较高,但访问量较少,而数据仓库的访问频率低但访问量却很高;
5.数据库中数据的目标是面向业务处理人员的,为业务处理人员提供信息处理的支持,而数据仓库则是面向高层管理人员的,为其提供决策支持;
6.数据库在访问数据时要求响应速度快,其响应时间一般在几秒内,而数据仓库的响应时间则可长达数几小时
对于所有数据库事务处理都有这四个特性。原子性:事务对数据修改,要么全都执行,要么全都不执行。
一致性:对于一致性的解释,看英文解释会清楚很多,一致性重点是说满足各种规则和约束。
Consistency: Ensures that only valid data following all rules and constraints is written in the database. When a transaction results in invalid data, the database reverts to its previous state, which abides by all customary rules and constraints.
大致是说事务处理的结果应当符合数据库的约束和规则,如果发现事务中有非法数据,那么数据库回退到之前的状态,并且满足规则和约束。
隔离性:指各个事务之间是相互隔离的。事务查看到的数据,是另一事务修改它之前或之后的状态,事务不会查看其他事务处理时中间状态的数据。
持久性:事务完成之后,它对于系统的影响是永久性的。即使出现系统故障该事务也将能够一直保持。
步骤 1-删除所有订阅您可以运行 sp_helpsubscription 来确定有任何订阅已发布数据库中。
运行以下命令删除已发布数据库中的所有发布的所有订阅。 已发布并且已订阅的每个数据库中,必须运行此命令。 运行此命令还会删除与断开的订阅关联的该通讯组任务。
sp_dropsubscription 'all', 'all', 'all'
请注意 sp_dropsubscriptions 将只正确才能都满足以下条件:
有是分发数据库安装。
发布服务器具有所有的订阅服务器的正确的远程服务器信息。 配置复制时,将自动定义远程服务器的信息。 可以通过运行 sp _ helpserver 验证远程服务器信息。
步骤 2-删除所有文章和发布
您可以运行 sp_helppublication 来确定有任何出版物已发布数据库中。
您可以运行"Select * 从 sysarticles"来确定是否有任何文章在发布数据库中。
运行以下命令删除所有文章和已发布数据库中的订阅。 已发布并且已发布的每个数据库中,必须运行此命令。 运行此命令将同时删除与断开的发布,同步任务。
sp_droppublication 'all'步骤 3-清除事务日志的复制任何"非"
无法截断事务日志,只要有任何不分发的复制的事务。 一个"非复制的事务为已标记为已发布的数据库事务日志中复制,但已不被"分发"的日志读取器任务的交易记录。
您可以看到通过运行以下命令是否有任何"非复制的事务,已发布的数据库中:
dbcc opentran(<published_database_name>) with tableresults如果该数据库了在某个点必须复制的事务,上面的命令将返回最早的分布式的行 ID ("REPL_OLD_DIST_RID") 和最早的非分布式的行 ID ("REPL_OLD_NONDIST_RID")。 如果数据库不具有任何复制的事务,并且有没有打开的事务,上面的命令将返回 0 的行。
如果上面的命令不会返回最旧分布式和最早非-分布式行 ID,和如果这些行 ID 不相同,您有或多个 undistributed 复制该数据库中的事务。 如果行 ID 相同,您没有任何非复制的事务在数据库中。 详细信息,请参阅 Transact-SQL 参考书中的 DBCC 语句 (英文)。
如果非复制的事务请运行下面的命令,将标记为"分配"的所有复制的事务,以便可以截断日志:
sp_repldone 0, 0, null, 0, 0, 1
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)