standalone是spark自身携带的资源管理框架,yarn是hadoop中的资源管理框架。都是对核心和内存进行管理和分配。
不同点底层实现方式不一样。standalone是比较简单的资源管理,给application分配核心时,分配多少就占用多少,但核心和内存分配自由度大。而yarn是以container为单位分配的,粒度较粗,当然可以自行设置container中资源的大小。yarn中有fifo调度器,容量调度器,公平调度器这三种资源分配策略,可以动态实现资源的扩缩,更灵活,更重。
另外,spark可以集成的资源管理框架还有mesos,k8s。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)