图形数据库适合用于社交网络,推荐系统等专注于构建关系图谱的系统。
图数据库的代表有Neo4J、FlockDB、InfoGrid、AllegroGraph、GraphDB等。
Neo4j是单机系统,主要做图数据库。GraphScope是由阿里巴巴达摩院智能计算实验室研发的图计算平台,是全球首个一站式超大规模分布式图计算平台,并且还入选了中 国科学技术协会“科创中 国”平台。Graphscope的代码在github.com/alibaba/graphscope上开源。SSSP算法上,GraphScope单机模式下平均要比Neo4j快176.38倍,最快在datagen-9.2_zf数据集上快了292.2倍。Neo4j就是一个数据库(可以理解成一个类似HBASE的东西,不过Neo4j是几乎是单机数据库,于HBASE不同,HBASE的数据时存储在HDFS上,由HDFS进行维护,HDFS将数据存储在exfat等单机文件系统上。Neo4j直接将数据格式化到单机文件系统)
每一个服务器保存完整的图数据。
GraphX是一个计算引擎(类似于mapreduce的东西),它的数据是从SHARK中使用SQL读取数据,或者RDD运算符从文件中读取,然后直接进行计算
另外数据库和计算引擎都可以进行计算任务,不过数据库的接口比较弱,只支持简单的查询
计算引擎提供了强大的计算接口,方便了编程,可以很容易的实现pagerank等图算法
GraphX做数据挖掘应该更方便,有通用的编程几口
Neo4j就需要自己写代码了 编程比较麻烦,不过性能上或许有优势
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)