使用seaweedfs搭建一个图片服务器 (上)

使用seaweedfs搭建一个图片服务器 (上),第1张

https://github.com/chrislusf/seaweedfs/releases

经典论文翻译导读之《Finding a needle in Haystack: Facebook’s photo storage》

http://www.importnew.com/3292.html

下面一张图总结下相互关系:

weed master 创建的是一个master服务器。

参数:

-defaultReplication string 备份策略(详细见 https://github.com/chrislusf/seaweedfs/wiki/Replication )

-ip string

-mdir string选项用于配置保存生搭碰成的序列文件id的文件夹

-port int (default 9333)

-volumeSizeLimitMB uint 自定义不能大于30000(default 30000)

-whiteList string 白名单,ip地址用逗号隔开

master服务器可以创建多个来实现故障转移主服务器,详细见 https://github.com/chrislusf/seaweedfs/wiki/Failover-Master-Server

参数:

-dir string 数据保存的路径,如果master的mdir没有指定会使用这个,如果filer的dir没有指定会新增并使用该目录下的filer目录

-ip string

-mserver string (default "localhost:9333")

-port

-dataCenter string

-rack string

-whiteList string

weed volume会创建一个 datanode ,可以指定所属的 datacenter rack和master ,会根据配置存储文件,默认一开始没有volume,当开始存储文件的时候才会创建一个volume,当这一个volume大小超过了volumeSizeLimitMB 就会新增一个volume,当volume个数超过了max则该datanode就不能新增数据了。那就需要在通过weed volume命令新增一个datanode。

weed filer

参数

-collection string 所有数敬枝唤据将存储在此集合中

-dataCenter string更倾向于在这个数据中心写入卷

-dirListLimit int limit sub dir listing size (default 100000)

-ip string

-master string

-port int(default 8888)

更详细的说明请见: https://mp.csdn.net/mdeditor/85049078#

或者访问官网wiki : https://github.com/chrislusf/seaweedfs/wiki

出现如下提示说明启动成功

执行下面的命令:

出现DataCenters是null的原因是没有执行weed volume创建DataCenter。

" 这里说一下抽象概念":

我们抽象的认为我们的图片服务器,一个master需要两个datacenter叫imgdatacenter1,imgdatacenter2;imgdatacenter1需要两个rack叫imgrack1,imgrack2;然后imgrack1需要两个亮凯datanode1,datanode2;

创建datanode时 ,统一设置每个datanode包含10个volume即可。当datanode里面的volume满了以后再创建 新的datanode即可,方便扩展,并且不同datanode可以在不同磁盘位置;

(imgdatacenter1的imgrack2和imgdatacenter2按照上面的方式创建即可,见附录 )

目前我们只是用imgdatacenter1->imgrack1->datanode1中的datanode1 :

创建datanode1的时候 master命令行会打印,提示leader新增child imgdatacenter1成功;imgdatacenter1新增child imgrack1成功;imgdatacenter1,imgrack1新增child 9991成功;volume server在9991端口。

此时再执行查看master状态的命名;

DataCenters Racks DataNodes都存在了;

但是名为localhost:9991的datanode中的volumes为0,明明我们设置了10啊;

因为没有上传文件之前不会创建volume,volume会在上传文件的时候根据实际情况创建。

这里注意下layouts,现在是null,当上传文件的时候会出现一个名为""的collection,里面的writables就是volume 的id数组,如果你自定义了collection,name你自定义的collection也会出现在这里,并且所有collection的volume个数之和小于等于我们设置的10;

collection删除后再新增,里面的volume的id会一直递增,不会使用原先删除的volume id。

此时我们可以上传文件了。

上传文件有多种方式,这里我们先说明两个

1.先向master申请文件id,然后用文件id向datanode上传文件:

修改只需要在fid上传别的文件即可

上传成功后访问,只需要拼接url即可: localhost:9991/1,015b7256d5

2.直接向master上传文件,master自己生成文件id,并向datanode上传文件,然后返回结果:

此时你再查看状态发现volume就创建了10个。

此时查看datanode的状态:

因为我1.jpg上传了两次,而且第一次在id为1的volume中,第二次在id为3的volume中,所有你会发现这两个id的volume的FileCount都为1

并发的上传文件:

一个卷服务器一次只写一个卷。如果需要增加并发性,可以预先分配大量卷。下面是例子。您还可以组合所有不同的选项。状态详情见附录

删除文件:

文件的删除不是实时的,因为weed默认有个阈值,超过这个阈值才会清理没使用的空间,如果你一时间内删除了大量文件,想立马生效,可以用这种方式清理未使用的空间:

此时文件通过url的增删改查都可以了,下面把服务映射成文件系统来 *** 作,可以方便的 *** 作本地的大量文件

filer是将文件以文件目录的方式上传到图片服务,然后你根据文件目录的方式访问

默认使用leveldb保存映射关系,打开filer.toml文件修改保存映射文件的文件夹为ftmp(自定义)

然后启动filer服务

master打印如下信息说明成功

自身的log

直接往weed filer中拷贝目录或者文件(-include是文件模式通配符前使用??)

weed filer.copy nginxdir http://localhost:8888/aaa 把nginxdir拷贝到aaa目录下

weed filer.copy -include *.go . http://localhost:8888/github/

详细请见 https://github.com/chrislusf/seaweedfs/wiki/Filer-Server-API

然而我们时长会有这样的需求,批量把照片保存成图片文件备份起来,而不是备份一个bat文件;

或者我们想以目录结构的方式通过本地访问,而不是通过web访问?

此时最简单有效的方法就是把filer服务器mount到本地,然后直接 *** 作文件系统:

weed mount 像访问本地目录一样访问文件系统,前提是开启了 master volume filer

(它使用bazil.org/FUSE,它允许在Linux和OSX上编写FUSE文件系统。在OSX上,它需要OSXFUSE)

可以指定 collection

关闭挂在需要关闭mount并且手动umont ~/mdir目录,如果一般用户失败请使用root用户

一个场景:

如果本地已经有很多文件了,如何快速的迁移到seaweedfs中呢?

1.启动master、volume、filer

2.启动mount

3.手动拷贝到mount目录中(单线程的)

4.使用weed filer.copy file_or_dir1 [file_or_dir2 file_or_dir3] http://localhost:8888/path/to/a/folder/ (多线程且绕过fuse层)

aws s3 兼容

Each bucket is stored in one collection, and mapped to folder /buckets/<bucket_name>by default

可以通过删除collection来快速删除一个bucket

异步复制

应该有两个SeawideFileSystems运行,可能跨数据中心运行。每个服务器都应该有自己的文件服务器、主服务器和卷服务器。

这是我执行了(curl " http://localhost:9333/vol/grow?collection=imgcoll&count=3 " )的结果

详细文档请见官方wiki

https://github.com/chrislusf/seaweedfs/wiki/Getting-Started

以存放文件为例来讲述目前使用方式跟官网的区别

读取文件时,跟存放文件采用相同的方式。

SeaweedFS文件管理主要分为两个部分:

对于文件实体的管理,都存放在.dat文贺烂散件中。

对于索引文件的管理,目前项目采用的方式为InMemory。

对于三个类要特别注意一下:

SeaweedFS中每个卷分为两个文件:

.dat文件图示如下:

.idx文件图示如下:

对于卷同步,从两个角度来看待这个问题:

对于第一点,SeaweedFS所采用处理方式如下:

对于第二点,SeaweedFS官网给出的处理方式如下:

复制对应的.dat和.idx文件到新机器上,从而使其卷数据一致。

最终目禅氏的:历者联合切片一起,做到从切片过程到发布过程的自动化处理。

目前面临的问题:

目前想到处理方式:

已经完成的测试工作:

整个工作流程图示如下:

参考网址:

https://github.com/chrislusf/seaweedfs/wiki/Getting-Started

https://blog.csdn.net/ichen820/article/details/122078682

http://www.wjhsh.net/quchunhui-p-14086075.html

https://blog.csdn.net/lljksven/article/details/118443443

SeaweedFS 是一种简单的、高度可扩展的分布式文件系统。有两个目标:

启动后,访问 http://172.119.9.12:9333 页面,即可看到SeaweedFS首页

启动后,即可在 http://172.119.9.12:9333 页面看到数据中心的数据卷

命令袭迹行返回:[{"fileName":"eye.png","url":"172.119.9.12:8080/4,01e265191f","fid":"4,01e265191f","size":482}]

访问文件:毁禅茄 http://172.119.9.12:8080/4,01e265191f ,即可看到上传的文件

查看配置文件模板

新建 filer.toml 文件,内容如下:

启动后,即可在 http://172.119.9.12:8888 页面看到数据

启动后,在 mount-data 下放入text.txt文件,通过 http://172.119.9.12:8888/text.txt 即纤察可访问文件


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12285792.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存