近日,厦门大学信息学院舒继武教授团队的论文“boosting full-node repair in erasure-coded storage”被计算机系统结构国际顶级学术会议usenix atc'21接收。该论文研究存储系统中的纠删码单节点修复优化问题,提出了一种加速全节点修复的通用调度框架。
图1. repairboost的工作流程
纠删码是存储系统中常用的一种低存储、高可靠的容错技术,但其修复性能受到大量修复流量的严重阻碍。近年来的一些工作通过设计新型纠删码或提出单条带修复优化算法来提升修复性能,但是这些方法直接应用在单节点修复上将会受到若干限制。舒继武课题组提出了一种通用的调度框架repairboost,可以协助现有的线性纠删码和单条带修复优化算法加速全节点修复。repairboost建立在三个设计原语的基础之上:(i)修复抽象,使用特定的有向无环图来描述单个块的修复过程;(ii)修复流量平衡,平衡系统中各节点上传和下载的修复流量负载;(iii)传输调度,仔细地调度请求的数据块的传输顺序,以尽量饱和地占用各个时刻系统中节点的上传和下载带宽。实验结果表明,对于多种编码和修复算法,repairboost可以将修复速度提高35.0-97.1%。
该论文由厦门大学信息学院硕士生林诗尧、龚国文及其导师沈志荣副教授(通信作者),香港中文大学的patrick p. c. lee副教授,和厦门大学舒继武教授合作完成。
usenix annual technical conference (atc)始办于1992年,是由usenix组织的计算机系统领域的顶级会议,也是中国计算机学会推荐的a类存储系统会议,计算机系统领域中oak语言(java语言的前身)、qemu、zookeeper等一系列有影响力的研究成果都在usenix atc发表或公布。2021年投稿341篇,录用64篇,录用率为18.8%。今年的usenix atc会议将于7月14日-16日在线上举行。