为什么选择图形数据库,为什么选择Neo4j

为什么选择图形数据库,为什么选择Neo4j,第1张

图形数据每个对象是一个节点,之间的关系是一条边。相对于关系数据库来说,图形数据库善于处理大量复杂、互连接、低结构化的数据,这些数据变化迅速,需要频繁的查询——在关系数据库中,由于这些查询会导致大量的表连接,从而导致性能问题,而且在设计使用上也不方便。

图形数据库适合用于社交网络,推荐系统等专注于构建关系图谱的系统。

图数据库的代表有Neo4J、FlockDB、InfoGrid、AllegroGraph、GraphDB等。

Neo4j是单机系统,主要做图数据库。GraphScope是由阿里巴巴达摩院智能计算实验室研发的图计算平台,是全球首个一站式超大规模分布式图计算平台,并且还入选了中 国科学技术协会“科创中 国”平台。Graphscope的代码在github.com/alibaba/graphscope上开源。SSSP算法上,GraphScope单机模式下平均要比Neo4j快176.38倍,最快在datagen-9.2_zf数据集上快了292.2倍。

Neo4j就是一个数据库(可以理解成一个类似HBASE的东西,不过Neo4j是几乎是单机数据库,于HBASE不同,HBASE的数据时存储在

HDFS上,由HDFS进行维护,HDFS将数据存储在exfat等单机文件系统上。Neo4j直接将数据格式化到单机文件系统)

每一个服务器保存完整的图数据。

GraphX是一个计算引擎(类似于mapreduce的东西),它的数据是从SHARK中使用SQL读取数据,或者RDD运算符从文件中读取,然后直接进行计算

另外数据库和计算引擎都可以进行计算任务,不过数据库的接口比较弱,只支持简单的查询

计算引擎提供了强大的计算接口,方便了编程,可以很容易的实现pagerank等图算法

GraphX做数据挖掘应该更方便,有通用的编程几口

Neo4j就需要自己写代码了 编程比较麻烦,不过性能上或许有优势


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6474435.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-23
下一篇 2023-03-23

发表评论

登录后才能评论

评论列表(0条)

保存