打开ssis包后,工具箱下为什么没有组件

打开ssis包后,工具箱下为什么没有组件,第1张

这是ActiveX插件,不是.net 服务器控件。是不会出现在工具箱中的。当页面中添加了<object id="....>...</object>这段之后,第一次打开这个页面的时候,浏览器会提示下载并安装插件,安装成功之后会在浏览器加载项中找到(如图),接下来就可以正常使用了。

本系列文章分两部分,本文是第二部分(第一部分参见:你的数据有多干净?)。我们将以测试体验的方式了解微软SQL Server提供的数据分析工具。

其它一些外部分析工具具有更丰富的功能,但是SQL Server授权允许你免费就可以使用这款低调的分析工具。

接下来让我们通过分析“AdventureWorksLT ”数据库中的一些数据来了解这款工具。

在此之前,你需要先安装好SQL Server集成服务,以及与SQL Server捆绑的Visual Studio精简版。在SQL Server 2012中,叫做“SQL Server Data Tools”而在SQL Server 2008中,名称叫做“Business Intelligence Development Studio”。

如果你缺少这些组件,你可以运行SQL Server安装程序并勾选相关组件, *** 作很简单。

配置分析工具

不管你启动哪个Visual Studio工作环境,都要创建一个集成服务项目。然后,从SSIS工具箱中拖拽一个数据分析任务到设计面板上,然后双击开始配置。

配置结果信息存储在XML文件中,所以需要指定保存文件的名称和路径。

点击目标旁边的空白框,会出现一个箭头。

点击箭头,然后点击“New File connection”。

在结果框中,指定路径和文件名(包括.xml后缀)。

点击“确定”按钮,然后点击“Quick Profile”按钮。

点击“ADO.NET Connection”旁边的“新建”按钮。

在出现的对话框中,指定SQL Server和托管待分析数据的数据库(我使用的是“AdventureWorksLT2012 ”数据库),然后点击“确定”按钮。

点击表或视图下拉框,选择待分析数据(我选用的是“SalesLT.Product”)。

保留默认勾选的复选框,然后点击“确定”按钮。确定后就会回到主设计界面。

最后,按“F5”就可以开始分析了。

分析成功,在SQL Server 2008中会有一个绿色小框来显示,在SQL Server 2012中是个绿色小勾。如果你看到红色小框或者红叉,那么可以在“Progress ”标签页找到哪里出错了。

查看结果

假设你看到的是绿色(在集成服务中每个人都喜欢这个颜色),那么接下来启动“Data Profile Viewer”应用程序。在开始菜单中,它在“Microsoft SQL Server XXXX”文件夹的集成服务子文件夹下。

在查看器中,点击“打开”按钮,找到你之前配置的xml文件。你现在可以看到分析结果了。

“adventureWorks”库中的数据本来是干干净净的,所以我做了一些修改,你自己直接做的话看到的分析结果会不一样。

在查看器左侧面板中,你可以看到我们选择的表,它下面是数据分析的五个不同方面(也就是我们配置任务时默认选中的五项)。

点击“Candidate Key Profiles ”,就会在右侧面板中显示结果。

该信息展示了值的唯一性,你可以看看我的数据(修改过的),“名称”列包含的数据不是百分之百唯一的。

我可以点击“名称”列来查看更多,界面中“ Key Violations ”部分下面会显示更多信息。

错误的产品是“HL Road Frame – Black, 58”,问题是有两行有相同的名称(产品名称通常应该是唯一的)。

在“ Key Violations ”中的问题产品上点击,就会显示出需要关注的行。

在左侧面板中(+微信关注网络世界),点击“Column Length Distribution Profiles”。

功能正如其名,这个页面会分析每个列值的长度。

我这里显示的结果,“颜色”列包含列最小长度是2。

就像我们前面例子中所做的那样,我们可以向下钻取,我可以看到那些值的分布,进一步钻取我可以看到脏数据对应的实际行。

其它类型的分析 *** 作都是类似的。

“Column NULL Ratio Profiles”显示了某一列中“NULL”值的百分比。

如果你有些列实际上不允许为“NULL”,例如“Product Name”,那么这个功能就非常有用。

“Column Statistics Profiles ”显示了日期和数值的最小值、最大值、平均值以及标准偏差。对于识别“327岁的员工”与“价格为负数的产品”这类不合理数据非常有帮助。

“Column Value Distribution Profiles ”显示某一列中有多少不同的值。这对于处理像“性别”这种列是很有用的,你可能预期该列只有两个不同值,但是却找到了15个,很容易发现问题。

还有另外两个分析功能也是可用的,不过默认没有启用。

其中一个就是“Functional Dependency Profile ”,它可以找到那些依赖于其它列值得列。

这一条功能对于检查地址信息时很有用例如,我们希望相同城市的地址共用相同的邮政编码。

总结

该分析工具的局限性在于,源数据必须存储在SQL Server数据库中。例如,如果你希望分析存储在平面文件中的数据,那么你必须先把数据导入到SQL Server数据库中。

此外,该分析工具不支持创建额外的定制分析功能实现扩展。你看到的所有功能就是它能提供的所有功能。

局限性且放一旁,SQL Server附带提供的这款工具为那些希望得到并能快速运行数据分析的人提供了很好的起点。

安装SQL Integration Services(SSIS)组件

有两种创建维护计划的方式:使用维护计划向导或使用设计图面创建计划。向导是创建基本维护计划的最佳方法,而使用设计图面创建计划允许您使用增强的工作流。

若要创建或管理维护计划,您必须是 sysadmin 固定服务器角色的成员。注意,只有当用户是 sysadmin 固定服务器角色的成员时,对象资源管理器才会显示维护计划。

1.使用维护计划向导创建维护计划

在对象资源管理器中,展开一个服务器,再展开“管理”。

右键单击“维护计划”并选择“维护计划向导”。

按照向导中显示的步骤创建维护计划。

2.使用设计图面创建维护计划

在对象资源管理器中,展开一个服务器,再展开“管理”。

右键单击“维护计划”并选择“新建维护计划”。

在“新建维护计划”对话框中,键入计划的名称。

将打开工具箱,然后打开“<维护计划名称>[设计]”图面,该图面中已创建了默认的 Subplan_1。可以选择在“设计”选项卡中输入整个计划的说明。

双击 Subplan_1,然后在“子计划属性”对话框中输入子计划的名称和说明。单击“子计划的计划”图标在“作业计划属性”对话框中输入计划详细信息。

若要生成子计划,请将“工具箱”中的任务流元素拖放到计划设计图面,以便定义将要执行的任务。双击任务打开对话框来配置任务选项。

若要定义任务间的工作流,请单击首先要执行的任务,按住 Ctrl 键,然后单击接着要执行的任务。右键单击其中任意一个任务,然后单击“添加优先约束”。

若要添加包含在其他计划中运行的任务的另一个子计划,请单击工具栏上的“添加子计划”。

若要添加与其他服务器的连接,请单击“管理连接”。

若要指定报告选项,请单击“报告和记录”图标。若要保存更详细的信息,请选择“记录扩展信息”。若要将维护计划结果信息写入其他服务器,请选择“在远程服务器上进行日志记录”。若要在日志文件查看器中查看结果,请右键单击“维护计划”节点或特定维护计划,然后单击“查看历史记录”。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11711019.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存