ib_write_bw声称我的最大可实现带宽大约是1500 MB / s(我没有得到3000MB / s,因为我的卡安装在PCI 2.0 8x中).
到现在为止还挺好.我使用ibverbs和rdma对我的通信通道进行了编码,但是我得到的波段远远小于我能得到的带宽,我甚至比使用套接字要少一些带宽,但至少我的应用程序不使用任何cpu功率:
ib_write_bw:1500 MB / s
套接字:700 MB / s< =在此测试期间,我的系统的一个核心是100% ibvers rdma:600 MB / s< =在此测试期间根本没有使用cpu 似乎瓶颈在这里:
ibv_sge sge;sge.addr = (uintptr_t)memory_to_transfer;sge.length = memory_to_transfer_size;sge.lkey = memory_to_transfer_mr->lkey;ibv_send_wr wr;memset(&wr,sizeof(wr));wr.wr_ID = 0;wr.opcode = IBV_WR_RDMA_WRITE;wr.sg_List = &sge;wr.num_sge = 1;wr.send_flags = IBV_SEND_SIGNALED;wr.wr.rdma.remote_addr = (uintptr_t)thePeerMemoryRegion.addr;wr.wr.rdma.rkey = thePeerMemoryRegion.rkey;ibv_send_wr *bad_wr = NulL;if (ibv_post_send(theCommunicationIDentifIEr->qp,&wr,&bad_wr) != 0) { notifyError("Unable to ibv post receive");}
此时下一个等待completation的代码是:
//Wait for completationibv_cq *cq;voID* cq_context;if (ibv_get_cq_event(theCompletionEventChannel,&cq,&cq_context) != 0) { notifyError("Unable to get a ibv cq event");}ibv_ack_cq_events(cq,1);if (ibv_req_notify_cq(cq,0) != 0) { notifyError("Unable to get a req notify");}ibv_wc wc;int myRet = ibv_poll_cq(cq,1,&wc);if (myRet > 1) { LOG(WARNING) << "Got more than a single ibv_wc,expecting one";}
从我的ibv_post_send和ibv_get_cq_event返回事件时的时间是13.3ms,当传输8 MB的块时达到大约600 MB / s.
要指定更多(以伪代码我在全球范围内执行的 *** 作):
积极的一面:
post a message receiverdma connectionwait for rdma connection event<<at this point transfer tx flow starts>>start:register memory containing bytes to transferwait remote memory region addr/key ( I wait for a ibv_wc)send data with ibv_post_sendpost a message receivewait for ibv_post_send event ( I wait for a ibv_wc) (this lasts 13.3 ms)send message "DONE"unregister memory goto start
被动方:
post a message receiverdma acceptwait for rdma connection event<<at this point transfer rx flow starts>>start:register memory that has to receive the bytessend addr/key of memory registeredwait "DONE" message unregister memorypost a message receivegoto start
有谁知道我做错了什么?或者我可以改进什么?
我没有受到“Not Invented Here”综合症的影响,所以我甚至愿意抛弃我迄今为止所做的事并采用别的东西.我只需要点对点连续转移.
这指出了您的伪代码的第二个问题:您正在等待完成,而不是在上一个工作请求完成之前发布另一个工作请求.这意味着在从工作请求完成到完成并发布另一个请求的时间内,HCA处于空闲状态.在飞行中保持多个发送/接收工作请求要好得多,这样当HCA完成一个工作请求时,它可以立即移动到下一个工作请求.
总结以上是内存溢出为你收集整理的linux – infiniband rdma差转转bw全部内容,希望文章能够帮你解决linux – infiniband rdma差转转bw所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)