大数据数据库有哪些_sql

问题一：大数据技术有哪些非常多的，问答不能发link，不然我给你link了。有譬如Hadoop等开源大数据项目的，编程语言的，以下就大数据底层技术说下。

简单以永洪科技的技术说下，有四方面，其实也代表了部分通用大数据底层技术：

Z-Suite具有高性能的大数据分析能力，她完全摒弃了向上升级(Scale-Up)，全面支持横向扩展(Scale-Out)。Z-Suite主要通过以下核心技术来支撑PB级的大数据：

跨粒度计算(In-Databaseputing)

Z-Suite支持各种常见的汇总，还支持几乎全部的专业统计函数。得益于跨粒度计算技术，Z-Suite数据分析引擎将找寻出最优化的计算方案，继而把所有开销较大的、昂贵的计算都移动到数据存储的地方直接计算，我们称之为库内计算(In-Database)。这一技术大大减少了数据移动，降低了通讯负担，保证了高性能数据分析。

并行计算(MPP puting)

Z-Suite是基于MPP架构的商业智能平台，她能够把计算分布到多个计算节点，再在指定节点将计算结果汇总输出。Z-Suite能够充分利用各种计算和存储资源，不管是服务器还是普通的PC，她对网络条件也没有严苛的要求。作为横向扩展的大数据平台，Z-Suite能够充分发挥各个节点的计算能力，轻松实现针对TB/PB级数据分析的秒级响应。

列存储 (Column-Based)

Z-Suite是列存储的。基于列存储的数据集市，不读取无关数据，能降低读写开销，同时提高I/O 的效率，从而大大提高查询性能。另外，列存储能够更好地压缩数据，一般压缩比在5 -10倍之间，这样一来，数据占有空间降低到传统存储的1/5到1/10 。良好的数据压缩技术，节省了存储设备和内存的开销，却大大了提升计算性能。

内存计算

得益于列存储技术和并行计算技术，Z-Suite能够大大压缩数据，并同时利用多个节点的计算能力和内存容量。一般地，内存访问速度比磁盘访问速度要快几百倍甚至上千倍。通过内存计算，CPU直接从内存而非磁盘上读取数据并对数据进行计算。内存计算是对传统数据处理方式的一种加速，是实现大数据分析的关键应用技术。

问题二：大数据使用的数据库是什么数据库 ORACLE、DB2、SQL SERVER都可以，关键不是选什么数据库，而是数据库如何优化！需要看你日常如何 *** 作，以查询为主或是以存储为主或2者，还要看你的数据结构，都要因地制宜的去优化！所以不是一句话说的清的！

问题三：什么是大数据和大数据平台大数据技术是指从各种各样类型的数据中，快速获得有价值信息的能力。适用于大数据的技术，包括大规模并行处理（MPP）数据库，数据挖掘电网，分布式文件系统，分布式数据库，云计算平台，互联网，和可扩展的存储系统。

大数据平台是为了计算，现今社会所产生的越来越大的数据量。以存储、运算、展现作为目的的平台。

问题四：常用大型数据库有哪些 FOXBASE

MYSQL

这俩可算不上大型数据库管理系统

PB 是数据库应用程序开发用的ide，根本就不是数据库管理系统

Foxbase是dos时代的产品了，进入windows时代改叫foxpro，属于桌面单机级别的小型数据库系统，mysql是个中轻量级的，但是开源，大量使用于小型网站，真正重量级的是Oracle和DB2，银行之类的关键行业用的多是这两个，微软的MS SQLServer相对DB2和Oracle规模小一些，多见于中小型企业单位使用，Sybase可以说是日薄西山，不行了

问题五：几大数据库的区别最商业的是ORACLE,做的最专业,然后是微软的SQL server,做的也很好,当然还有DB2等做得也不错,这些都是大型的数据库,,,如果掌握的全面的话,可以保证数据的安全. 然后就是些小的数据库access,mysql等,适合于中小企业的数据库100万数据一下的数据.如有帮助请采纳,谢!

问题六：全球最大的数据库是什么应该是Oracle，第一，Oracle为商业界所广泛采用。因为它规范、严谨而且服务到位，且安全性非常高。第二，如果你学习使用Oracle不是商用，也可以免费使用。这就为它的广泛传播奠定了在技术人员中的基础。第三，Linux/Unix系统常常作为服务器，服务器对Oracle的使用简直可以说极其多啊。建议楼梗多学习下这个强大的数据库

问题七：什么是大数据？大数据(big data)，或称巨量资料，指的是所涉及的资料量规模巨大到无法通过目前主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托・迈尔-舍恩伯格及肯尼斯・库克耶编写的《大数据时代》中大数据指不用随机分析法（抽样调查）这样的捷径，而采用所有数据的方法[2]）大数据的4V特点：Volume（大量）、Velocity（高速）、Variety（多样）、Value（价值）。

说起大数据，就要说到商业智能：

商业智能（Business Intelligence，简称：BI），又称商业智慧或商务智能，指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

商业智能作为一个工具，是用来处理企业中现有数据，并将其转换成知识、分析和结论，辅助业务或者决策者做出正确且明智的决定。是帮助企业更好地利用数据提高决策质量的技术，包含了从数据仓库到分析型系统等。

商务智能的产生发展

商业智能的概念经由Howard Dresner(1989年)的通俗化而被人们广泛了解。当时将商业智能定义为一类由数据仓库（或数据集市）、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。

商务智能是20世纪90年代末首先在国外企业界出现的一个术语，其代表为提高企业运营性能而采用的一系列方法、技术和软件。它把先进的信息技术应用到整个企业，不仅为企业提供信息获取能力，而且通过对信息的开发，将其转变为企业的竞争优势，也有人称之为混沌世界中的智能。因此，越来越多的企业提出他们对BI的需求，把BI作为一种帮助企业达到经营目标的一种有效手段。

目前，商业智能通常被理解为将企业中现有的数据转化为知识，帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商资料及来自企业所处行业和竞争对手的数据，以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策既可以是作业层的，也可以是管理层和策略层的决策。

为了将数据转化为知识，需要利用数据仓库、线上分析处理（OLAP）工具和数据挖掘等技术。因此，从技术层面上讲，商业智能不是什么新技术，它只是ETL、数据仓库、OLAP、数据挖掘、数据展现等技术的综合运用。

把商业智能看成是一种解决方案应该比较恰当。商业智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理，以保证数据的正确性，然后经过抽取（Extraction）、转换（Transformation）和装载（Load），即ETL过程，合并到一个企业级的数据仓库里，从而得到企业数据的一个全局视图，在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理（这时信息变为辅助决策的知识），最后将知识呈现给管理者，为管理者的决策过程提供支持。

企业导入BI的优点

1.随机查询动态报表

2.掌握指标管理

3.随时线上分析处理

4.视觉化之企业仪表版

5.协助预测规划

导入BI的目的

1.促进企业决策流程(Facilitate the Business Decision-Making Process)：BIS增进企业的资讯整合与资讯分析的能力，汇总公司内、外部的资料，整合成有效的决策资讯，让企业经理人大幅增进决策效率与改善决策品质。

......>>

问题八：数据库有哪几种？常用的数据库：oracle、sqlserver、mysql、access、sybase 2、特点。 -oracle： 1.数据库安全性很高，很适合做大型数据库。支持多种系统平台（HPUX、SUNOS、OSF/1、VMS、 WINDOWS、WINDOWS/NT、OS/2）。 2.支持客户机/服务器体系结构及混合的体系结构（集中式、分布式、客户机/服务器）。 -sqlserver: 1.真正的客户机/服务器体系结构。 2.图形化用户界面，使系统管理和数据库管理更加直观、简单。 3.具有很好的伸缩性，可跨越从运行Windows 95/98的膝上型电脑到运行Windows 2000的大型多处理器等多种平台使用。 -mysql: MySQL是一个开放源码的小型关系型数据库管理系统，开发者为瑞典MySQL AB公司，92HeZu网免费赠送MySQL。目前MySQL被广泛地应用在Internet上的中小型网站中。提供由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。 -access Access是一种桌面数据库，只适合数据量少的应用，在处理少量数据和单机访问的数据库时是很好的，效率也很高。但是它的同时访问客户端不能多于4个。 -

问题九：什么是大数据大数据是一个体量特别大，数据类别特别大的数据集，并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。大数据首先是指数据体量(volumes)?大，指代大型数据集，一般在10TB?规模左右，但在实际应用中，很多企业用户把多个数据集放在一起，已经形成了PB级的数据量；其次是指数据类别(variety)大，数据来自多种数据源，数据种类和格式日渐丰富，已冲破了以前所限定的结构化数据范畴，囊括了半结构化和非结构化数据。接着是数据处理速度（Velocity）快，在数据量非常庞大的情况下，也能够做到数据的实时处理。最后一个特点是指数据真实性（Veracity）高，随着社交数据、企业内容、交易与应用数据等新数据源的兴趣，传统数据源的局限被打破，企业愈发需要有效的信息之力以确保其真实性及安全性。

数据采集：ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成，最后加载到数据仓库或数据集市中，成为联机分析处理、数据挖掘的基础。

数据存取：关系数据库、NOSQL、SQL等。

基础架构：云存储、分布式文件存储等。

数据处理：自然语言处理(NLP，NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机理解自然语言，所以自然语言处理又叫做自然语言理解(NLU，NaturalLanguage Understanding)，也称为计算语言学(putational Linguistics。一方面它是语言信息处理的一个分支，另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。

统计分析：假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析（最优尺度分析）、bootstrap技术等等。

数据挖掘：分类（Classification）、估计（Estimation）、预测（Prediction）、相关性分组或关联规则（Affinity grouping or association rules）、聚类（Clustering）、描述和可视化、Description and Visualization）、复杂数据类型挖掘(Text, Web ,图形图像，视频，音频等)

模型预测：预测模型、机器学习、建模仿真。

结果呈现：云计算、标签云、关系图等。

要理解大数据这一概念，首先要从大入手，大是指数据规模，大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别，其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity)，即体量大、多样性、价值密度低、速度快。

第一，数据体量巨大。从TB级别，跃升到PB级别。

第二，数据类型繁多，如前文提到的网络日志、视频、图片、地理位置信息，等等。

第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。

第四，处理速度快。1秒定律。最后这一点也是和传统的......>>

问题十：国内真正的大数据分析产品有哪些国内的大数据公司还是做前端可视化展现的偏多，BAT算是真正做了大数据的，行业有硬性需求，别的行业跟不上也没办法，需求决定市场。

说说更通用的数据分析吧。

大数据分析也属于数据分析的一块，在实际应用中可以把数据分析工具分成两个维度：

第一维度：数据存储层――数据报表层――数据分析层――数据展现层

第二维度：用户级――部门级――企业级――BI级

1、数据存储层

数据存储设计到数据库的概念和数据库语言，这方面不一定要深钻研，但至少要理解数据的存储方式，数据的基本结构和数据类型。SQL查询语言必不可少，精通最好。可从常用的selece查询，update修改，delete删除，insert插入的基本结构和读取入手。

Access2003、Access07等，这是最基本的个人数据库，经常用于个人或部分基本的数据存储；MySQL数据库，这个对于部门级或者互联网的数据库应用是必要的，这个时候关键掌握数据库的库结构和SQL语言的数据查询能力。

SQL Server2005或更高版本，对中小企业，一些大型企业也可以采用SQL Server数据库，其实这个时候本身除了数据存储，也包括了数据报表和数据分析了，甚至数据挖掘工具都在其中了。

DB2，Oracle数据库都是大型数据库了，主要是企业级，特别是大型企业或者对数据海量存储需求的就是必须的了，一般大型数据库公司都提供非常好的数据整合应用平台。

BI级别，实际上这个不是数据库，而是建立在前面数据库基础上的，企业级应用的数据仓库。Data Warehouse，建立在DW机上的数据存储基本上都是商业智能平台，整合了各种数据分析，报表、分析和展现！BI级别的数据仓库结合BI产品也是近几年的大趋势。

2、报表层

企业存储了数据需要读取，需要展现，报表工具是最普遍应用的工具，尤其是在国内。传统报表解决的是展现问题，目前国内的帆软报表FineReport已经算在业内做到顶尖，是带着数据分析思想的报表，因其优异的接口开放功能、填报、表单功能，能够做到打通数据的进出，涵盖了早期商业智能的功能。

Tableau、FineBI之类，可分在报表层也可分为数据展现层。FineBI和Tableau同属于近年来非常棒的软件，可作为可视化数据分析软件，我常用FineBI从数据库中取数进行报表和可视化分析。相对而言，可视化Tableau更优，但FineBI又有另一种身份――商业智能，所以在大数据处理方面的能力更胜一筹。

3、数据分析层

这个层其实有很多分析工具，当然我们最常用的就是Excel，我经常用的就是统计分析和数据挖掘工具；

Excel软件，首先版本越高越好用这是肯定的；当然对excel来讲很多人只是掌握了5%Excel功能，Excel功能非常强大，甚至可以完成所有的统计分析工作！但是我也常说，有能力把Excel玩成统计工具不如专门学会统计软件；

SPSS软件：当前版本是18，名字也改成了PASW Statistics；我从3.0开始Dos环境下编程分析，到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化，从重视医学、化学等开始越来越重视商业分析，现在已经成为了预测分析软件；

SAS软件：SAS相对SPSS其实功能更强大，SAS是平台化的，EM挖掘模块平台整合，相对来讲，SAS比较难学些，但如果掌握了SAS会更有价值，比如离散选择模型，抽样问题，正交实验设计等还是SAS比较好用，另外，SAS的学习材料比较多，也公开，会有收获的！

JMP分析：SAS的一个分析分支

XLstat：Excel的插件，可以完......>>

域名注册管理相关的三个机构：ICAAN、interNIC、C IC

在涉及到域名注册及管理等问题时，经常会遇到ICAAN、interNIC、C IC这些机构的名称缩写，他们所代表的意义及其职能如下：

（1）ICA

ICA 是“国际互联网名称和地址分配组织”（The

Internet Corporation for A igned Names and Numbers）的缩写。ICA 成立于1998年10月，是一个集合了全球互联网商业、非商业、技术及学术领域的专家经营管理的非盈利性公司，主要负责全球互联网的根域名服务器和域名体系、IP地址及互联网其它码号资源的分配管理和政策制订。ICA 也负责域名注册商的授权工作，但是并不负责互联网上的金融交易、内容控制、垃圾邮件、网络赌博、数据保护以及个人隐私政策等。ICA 的最高管理机构——理事会是由来自世界各国的18名代表组成，负责决定一些重大事项。

ICA 的成立背景：

Internet起源于美国，在90年代之前一直是一个为军事、科研服务的网络。在90年代初，由美国国家科学基金会为Internet提供资金并代表美国政府与 I公司（Network

Solutio ）签定了协议，将Internet顶级域名系统的注册、协调与维护的职责都交给了 I。而Internet的地址资源分配则交由IANA（Internet

A igned Numbers Authorty，网址是http://www.iana.org ，目前管理后缀为2位数的地理顶级域名）来分配，由IANA将地址分配到ARIN（北美地区）、RIPE（欧洲地区）和A IC（亚太地区），然后在由这些地区性组织将地址分配给各个I 。但是，随着近年来Internet的全球性发展，越来越多的国家对由美国独自对Internet进行管理的方式表示不满，强烈呼吁对Internet的管理进行改革。

美国商业部在1998年初发布了Internet域名和地址管理的绿皮书，认为美国政府有对Internet的直接管理权，因此在它发布后遭到了除美国外几乎所有国家及结构的反对。美国政府在征求了大量意见后，于1998年6月5日发布了"绿皮书"的修改?quot白皮书"。白皮书提议在保证稳定性、竞争性、民间协调性和充分代表性的原则下，在1998年10月成立一个民间性的非赢利公司，即ICA ，开始参与管理Internet域名及地址资源。

关于ICA 的更多信息请登录网站：http://www.ica .org

（2）interNIC

为了保证国际互联网络的正常运行和向全体互联网络用户提供服务，国际上设立了国际互联网络信息中心（InterNIC）。网址：http://www.internic.net，为所有互联网络用户服务。

interNIC网站目前由ICA 负责维护，提供互联网域名登记服务的公开信息。

资料来源：http://www.ica .org/faq/

（3）C IC

C IC是“中国互联网络信息中心”（China

Internet Network Information Center）的简称，是经国务院主管部门批准授权，于1997年6月3日组建的非营利性的管理和服务机构，行使国家互联网络信息中心的职责。C IC在业务上接受信息产业部领导，在行政上接受中国科学院领导。中国科学院计算机网络信息中心承担C IC的运行和管理工作。由国内知名专家、各大互联网络单位代表组成的C IC工作委员会，对C IC的建设、运行和管理进行监督和评定。

C IC承担的主要职责：

1．互联网地址资源注册管理

根据信息产业部授权，C IC是我国域名体系注册管理机构和域名根服务器运行机构。C IC负责运行和管理国家顶级域名CN、中文域名系统及通用网址系统。C IC是亚太互联网络信息中心（A IC）的国家级互联网络注册机构成员（NIR）。以C IC为召集单位的IP地址分配联盟，负责为我国的网络服务商（I ）和网络用户提供IP地址和AS号码的分配管理服务。

2．互联网调查与相关信息服务

C IC负责开展中国互联网络发展状况等多项公益性互联网络统计调查工作。C IC的统计调查，权威性和客观性已被国内外广泛认可，部分指标已经纳入国家信息化指标体系。

3．目录数据库服务

C IC负责建立并维护全国最高层次的网络目录数据库，提供对联网用户、网络地址、域名、自治系统号等方面信息的查询服务。

4．互联网寻址技术研发

C IC基于自身网络服务的管理和研发经验，积极跟踪国际互联网技术的最新发展，承担相关研发工作和国家有关科研项目。

5．国际交流与政策调研

作为国家级的互联网络信息中心，C IC与相关国际组织，以及其他国家和地区的互联网络信息中心进行业务协调与合作。

承担中国互联网协会政策与资源工作委员会秘书处的工作

资料来源：C ICN网站，http://www.c ic.net.cn/index/0I/index.htm

，2004年12月20日

说明：上文所列出的资料介绍由网上营销新观察

分别于各相关机构网站整理，这些内容可能会被更新，网上营销新观察

将尽可能跟踪提供最新的内容。

一.三大检索工具及相关数据库介绍

1.三大检索工具简

科技部下属的“中国科学技术信息研究所”从 1987 年起,每年以国外四大检索工具 SCI 、ISTP 、Ei、ISR 为数据源进行学术排行。由于 ISR(《科学评论索引》) 收录的论文与 SCI 有较多重复，且收录我国的论文偏少因此，1993年起不再把 ISR 作为论文的统计源。而其中的 SCI 、ISTP 、 Ei 数据库就是图书情报界常说的国外三大检索工具。

SCI ，即《科学引文索引》，是自然科学领域基础理论学科方面的重要期刊文摘索引数据库。它创建于1961 年，创始人为美国科学情报研究所所长 Eugene Garfield(1925.9.15).利用它，可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自 1945 年以来重要的学术成果信息；SCI 还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。

ISTP ，即《科学技术会议录索引》，创刊于 1978 年，由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。从 1990-2003 年间， ISTP 和 ISSHP( 后文将要讲到 ISSHP) 共收录了 60 ， 000 个会议的近 300 万篇论文的信息。

Ei，即《工程索引》,创刊于 1884 年,由 Elsevier Engineering Information Inc. 编辑出版。主要收录工程技术领域的论文（主要为科技期刊和会议录论文 ) ,数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。

2.与三大检索工具相关的其它数据库介绍

SSCI，即《社会科学引文索引》,创刊于 1969 年，收录数据从 1956 年至今；是社会科学领域重要的期刊文摘索引数据库。数据覆盖了历史学、政治学、法学、语言学、哲学、心理学、图书情报学、公共卫生等社会科学领域。

A&HCI，即《艺术与人文科学引文索引》，创刊于 1976 年，收录数据从 1975 年至今；是艺术与人文科学领域重要的期刊文摘索引数据库。数据覆盖了考古学、建筑学、艺术、文学、哲学、宗教、历史等社会科学领域。

ISSHP ，即《社会科学和人文会议录索引》，创刊于 1979 年，数据涵盖了社会科学、艺术与人文科学领域的会议文献。这些学科包括：哲学、心理学、社会学、经济学、管理学、艺术、文学、历史学、公共卫生等领域。

xiaoxinsue 2006-06-03 10:35

二．如何利用三大检索工具等数据库检索相关主题文献

1．利用SCI、SSCI、A&HCI数据库检索相关主题文献

(1) 通过往TOPIC检索入口输入检索主题词获得相关主题文献

(2) 通过往TOPIC检索入口输入检索主题词，然后对检索结果进一步分析获得相关主题文献

(3) 通过往TOPIC和SOURCE TITLE检索入口同时输入检索主题词获得相关主题文献

例子：往TOPIC中输入"nano*"，同时往SOURCE TITLE 中输入"ARTIFICIAL CELLS BLOOD SUBSTITUTES AND IMMOBILIZATION BIOTECHNOLOGY or BIO-MEDICAL MATERIALS AND ENGINEERING or BIOMATERIALS or CELLULAR POLYMERS or DENTAL MATERIALS or JOURNAL OF BIOACTIVE AND COMPATIBLE POLYMERS or JOURNAL OF BIOMATERIALS SCIENCE-POLYMER EDITION or JOURNAL OF BIOMATERIALS APPLICATIONS or JOURNAL OF BIOMEDICAL MATERIALS RESEARCH or JOURNAL OF MATERIALS SCIENCE-MATERIALS IN MEDICINE or MACROMOLECULAR BIOSCIENCE"，利用上面的检索式，可以检索出SCI网络版2002年数据库收录"MATERIALS SCIENCE, BIOMATERIALS"类的文章102篇。

2．利用ISTP数据库检索相关主题文献

可以通过TOPIC、SOURCE TITLE、CONFERENCE相结合的方式来检索

3．利用Ei数据库检索相关主题文献

例子：检索医学领域中含有 "pipe" 的文献

如果仅仅用 "pipe" 检索在所有字段中检索，会命中 4 万多条记录；即使同时限制在 TITLE 中检索，结果也有 1 万多条，数据冗余太大。这时，可以考虑从学科的角度进行限制检索：

先检索到从 Ei Thesaurus 中检索医学类目：

Medicine ： 461.6 ， Medical care ： 461.7 ， Medical imaging ： 461.1 ， Medical problems ，

Medical supplies ： 462.1 ， Medical computing ： 723.5 ， Medical diagnosis ， Medical education ，

Medical equipment ， Medical monitoring ： 462.2

利用 "Expert Search" ： (461.1 wn CL OR 461.6 wn CL OR 461.7 wn CL OR 462.1 wn CL OR 723.5 wn CL) AND (pipe wn TI) 命中 500 多条记录，因 723.5 类与计算机应用有关，命中记录中有许多看不出是与医学有关的，可以考虑将该类去掉检索。结果就比较令人满意。

4.利用 SCOPUS 数据库检索相关主题文献

该数据库提供了学科限制，因而相对容易。

三.如何利用三大检索工具等数据库检索论文收录情况

1.利用三大检索工具等数据库检索单位 / 集体论文收录情况

以清华大学为例

(1)利用 SCI 数据库检索单位 / 集体论文收录情况

(tsinghua univ or tsing hua univ or qinghua univ or qing hua univ or 100084) same (peoples r china or beijing or bei jing)

(2)利用 ISTP 数据库检索单位 / 集体论文收录情况

(tsinghua univ or tsing hua univ or qinghua univ or qing hua univ or 100084) same (peoples r china or beijing or bei jing)

(3)利用 Ei 数据库检索单位 / 集体论文收录情况

利用作者索引或用复杂检索，但效果均不好。

(4)利用 SCOPUS 数据库检索单位 / 集体论文收录情况

AFFIL(100084 AND tsinghua)

(5)利用 CSSCI 、《中国期刊网》、《中文科技期刊数据库》检索单位 / 集体论文收录情况

三个数据库均提供机构检索入口，可以查找单位 / 集体论文收录情况。

2.利用三大检索工具等数据库检索个人论文收录情况

以周远翔老师的论文为例子 ( 见附录 ) ：

(1)利用 SCI 数据库检索个人论文收录情况

作者的文献 ( 文章或报告 ) 共有 104 篇，在这些文章中，他的合作者包括以下八人： N. Yoshimura, 关志成， H. Katoh, 严萍，梁曦东，李光范， M. Nifuku, Atsushi Satake

构建检索式： (zhou yx or yunxiang z) and (Yoshimura n or guan zc or zhicheng g or Katoh h or yan p or ping y or liang xd or xidong l or li gf or guangfan l or Nifuku m or Satake a or Atsushi S)

在 AUTHOR 字段中输入上述检索式，命中 9 条记录。与作者提供的论文核对后发现：这 9 条记录全是作者本人的论文。

还有几篇文献是作者单独完成的，对于这些文献，需要单独处理。

(2)利用 ISTP 数据库检索个人论文收录情况

与检索 SCI 数据库类似，用同样的检索式和同样的方法即可。

在 AUTHOR 字段中输入上述检索式，命中 14 条记录。与作者提供的论文核对后发现：这 14 条记录全是作者本人的论文。比作者事先查好的 12 篇还多 2 篇。

(3)利用 Ei 数据库检索个人论文收录情况

在高级检索中输入 (Ei 数据库作者标引与 SCI 有很大不同： Ei 一般要将姓和名写全，而 SCI 是要求姓写全，名用第一个字母 ) ：

(zhou, y.x. wn AU OR zhou, yuanxiang wn AU OR yuanxiang, z. OR yuanxiang, zhou OR zhou, y.-x. wn AU OR zhou, yx wn AU) AND (Yoshimura wn AU OR guan, z.c. wn AU OR guan, z.-c. wn AU OR zhicheng, g wn AU OR guan, zhicheng wn AU OR guan, zc wn AU OR Katoh wn AU OR yan, p wn AU OR yan, ping wn AU OR ping, y. wn AU OR ping, yan wn AU OR liang, x.-d. wn AU OR liang, x.d. wn AU OR liang, xd wn AU OR xidong, liang wn AU OR liang, xidong wn AU OR xidong, l. wn AU OR li, gf wn AU OR li, g.f. wn AU OR li, g.-f. wn AU OR guangfan, l. wn AU OR guangfan, li wn AU OR li, guangfan wn AU OR Nifuku wn AU OR Satake wn AU OR Atsushi wn AU)

命中 19 条记录，这与读者自己检索的 27 条记录相差 8 条。

后经检查，发现漏检的 8 条记录中，有 7 条作者是 "zhou, y" ，有一条是 "zhou, yuanxing" 。所以，用上述检索式会漏掉一部分记录；因而我们应再修改一下检索式：

把上述检索式修改为： (zhou, y* wn AU OR yuanxiang, z. OR yuanxiang, zhou) AND (Yoshimura wn AU OR guan, z.c. wn AU OR guan, z.-c. wn AU OR zhicheng, g wn AU OR guan, zhicheng wn AU OR guan, zc wn AU OR Katoh wn AU OR yan, p wn AU OR yan, ping wn AU OR ping, y. wn AU OR ping, yan wn AU OR liang, x.-d. wn AU OR liang, x.d. wn AU OR liang, xd wn AU OR xidong, liang wn AU OR liang, xidong wn AU OR xidong, l. wn AU OR li, gf wn AU OR li, g.f. wn AU OR li, g.-f. wn AU OR guangfan, l. wn AU OR guangfan, li wn AU OR li, guangfan wn AU OR Nifuku wn AU OR Satake wn AU OR Atsushi wn AU) 命中 34 条记录，从中找出了作者有 27 篇文献被 Ei 数据库收录。

需要说明的是：利用第一个检索式基本上可以比较准确地检索到作者的文献。只所以利用第二个检索式，是考虑到 Ei 数据库在数据标引过程中可能出现的小的差错，可以基本上没有遗漏地检索出作者所有被 Ei 数据库收录的文献。

(4)利用 SCOPUS 数据库检索个人论文收录情况

(5) 利用 CSSCI 、《中国期刊网》、《中文科技期刊数据库》检索个人论文收录情况

xiaoxinsue 2006-06-03 10:35

四.如何检索论文被引用情况

1.检索单位 / 集体论文被引用情况

(1)利用 SCI 、 SSCI 、 A&HCI 检索论文被引用情况

从收录的角度检索，例子：

(tsinghua univ or tsing hua univ or qinghua univ or qing hua univ or 100084) same (peoples r china or beijing or bei jing)

(2)利用 SCOPUS 检索论文被引用情况

(3)利用《中国期刊网》检索论文被引用情况

备注： CSSCI 、《中国科技论文引文统计分析数据库》均没有提供按单位 / 集体检索论文被引用情况的入口。

2.检索个人论文被引用情况

(1) 利用SCI、SSCI、A&HCI检索论文被引用情况从收录的角度检索，例子：

(2) 利用SCOPUS检索论文被引用情况

(3) 利用CSSCI、《中国科技论文引文统计分析数据库》、《中国期刊网》检索论文被引用情况

五.核心期刊投稿导引

1.期刊评价及评价工具

关于期刊评价，目前国内学术界有两种观点：一是核心期刊评价法，二是期刊综合评价梯度法。前者简称“ 0/1 法则”，后者简称“综合法则”。两种法则都是以传统的情报学文献离散定律、引文分析定律等为理论依据的。只是“综合法则”涵盖了“ 0/1 法则”，更加强调梯度的概念。期刊评价的工具，国外以 JCR(Journal Citation Reports) 为代表，国内以《中文核心期刊要目总览》、《中国科技期刊引证报告》和《中国学术期刊综合引证报告》为代表。《中文核心期刊要目总览》和《中国科技期刊引证报告》是“0/1 法则”评价的结果，《中国学术期刊综合引证报告》是“综合法则”评价的结果。

2. 核心期刊的内涵及国内、国际核心期刊外延的界定

核心期刊的概念可以用一句话来概括：某一学科中高水平、高影响力的期刊。不难看出，核心期刊有两个主要特性：一是学科性，二是学术性。

一般情况下，核心期刊都是在某一个学科范围内来界定的某一个学科的核心期刊，到另一个学科就不一定是核心期刊 ( 当然，综合性学科的核心期刊，如 NATURE 、 SCIENCE 等例外 ) 。

核心期刊的学术性主要要是以期刊影响因子来测定的。关于影响因子，有两种统计方法：一种是三年统计法，一种是中期统计法。按三年统计法得出的结果就是目前我们常说的影响因子 (IF: Impact Factor ：某一种期刊在第三年得到的引文数与该刊前两年的总论文数之比。 ) ，按中期统计法得出的结果叫 “ 中期影响因子”(MIF: Median Impact Factor 某一种期刊的引文累计达到 1/2 时，引文数与此时的总论文数之比 ) 。

3.如何向国内、国际核心期刊投稿

投国际刊物，请参考 JCR( 包括科技版和社科版 ) ，选择自己想要找的学科类目，按照影响因子排序,挑选适合的刊物。然后在《乌利希国际期刊指南》网站查找刊物的地址或网站信息，登陆刊物的网站，查找在线投稿信息。

投国内刊物,请参考《中文核心期刊要目总览》和《中国科技期刊引证报告》，从中选择自己想要找的学科类别,然后按照影响力,挑选适合的刊物。投稿地址信息可以参考工具书《中文核心期刊要目总览》,也可以登录“中国期刊网”，查找刊物的投稿信息。

在向核心期刊投稿的过程中，需要注意的事项：

(1)尽量不要投增刊。

(2) 单位署名要规范。写清华大学要同时写上 Beijing, Peoples Republic of China. 这在 SCI 中尤其要注意。

六.SCI 收录期刊

SCI收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种。美国科学情报研究所通过它严格的选刊标准和评估程序挑选刊源，而且每年略有增减，从而做到SCI收录的文献能全面覆盖全世界最重要和最有影响力的研究成果。

ISI所谓最有影响力的研究成果，指的是报道这些成果的文献大量地被其它文献引用。为此，作为一部检索工具，SCI一反其它检索工具通过主题或分类途径检索文献的常规做法，而设置了独特的"引文索引"（Citation Index）。即通过先期的文献被当前文献的引用，来说明文献之间的相关性及先前文献对当前文献的影响力。

SCI 以上做法上的特点，使得 SCI 不仅作为一部文献检索工具使用，而且成为科研评价和的一种依据。科研机构被 SCI 收录的论文总量，反映整个机构的科研、尤其是基础研究的水平；个人的论文被 SCI 收录的数量及被引用次数，反映他的研究能力与学术水平。

SCI 的出版形式包括印刷版期刊和光盘版及联机数据库，现在还发行了互联网上 Web 版数据库。个人通过网络就可以对 sci 期刊目录进行搜索和查找，相关链接如下：

SCI 收录期刊 ( 按字母 ) ：

http://www.isinet.com/cgi-bin/jrnlst/jlresults.cgi?PC=K

SCI 收录期刊 ( 按分类 ) ：

http://www.isinet.com/cgi-bin/jrnlst/jlsubcatg.cgi?PC=K

七.EI 投稿指南

为了适应我国科学技术的快速发展，为我国科技工作者向 EI 收录期刊投稿提供方便，本指南收集了 EI 收录的科技期刊中近 1900 余种刊物的最新投稿信息，其中包括通信地址、电话号码、电子邮件地址和网站的网址等。

使用说明

(1) 本目录按中国科学院图书分类法排列。

(2)各来源期刊款目的著录格式如下：

375C0005 ① ISSN 0306-4573 ②

Information Processing&Management. ③

1963. 6/yr ④ Editor-in-chief:Tefko Saracevic,School of Communication Information and Library Studies Rutgers University 4

Huntington Street New Brunswick,NJ 08903 USA. ⑤

E-mail:j.rigg@elsvier.co.uk

http://www.elsevier.nl/inca/publications/store/2/4/4/ ⑥

《信息处理与管理》刊载信息处理、传播、储存、利用、检索和管理，包括：计算机和自动化技术在图书馆信息工作中的应用以及信息政策等方面的研究论文、评论和简讯。 ⑦

注： ① 中图公司报刊刊号 ② 国际标准刊号 ③ 刊名 ④ 创刊年及出版周期（或全年期数） ⑤ 编委或编辑部或出版机构名称、地址、电话、传真 ⑥ 电子邮件地址和网址 ⑦ 译名和内容简介（中文或英文）

(3)指南中部分缩写解释

ISSN:International Standard Serial Number 国际标准刊号 Pub:Publisher 出版者

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6820860.html

大数据数据库有哪些

发表评论

评论列表（0条）