最近,字节跳动开放了一项代号为omgd的压缩技术这是一个字节自研的gan压缩算法,在保持生成效果不变的前提下,至少可以将计算功耗降低到原来的1/46,相比之前业内最好的压缩效果提升了一倍多根据消息显示,关于该技术的论文已入选计算机视觉国际会议iccv 2021
根据消息显示,gan是人工智能领域重要的深度学习模型,广泛应用于图像生成,音乐生成和视频生成它还可以提高图像质量,实现图像风格化,图像着色等任务漫画特效等常用的短视频道具都是通过gan实现的
由于gan对计算资源和存储空间的巨大需求,该模型很难直接部署到手机,pads等移动设备上,业界一直在努力改进gan的压缩方法2020年,麻省理工学院,adobe和上海交通大学的研究人员提出了一种gan压缩算法,成功地将计算功耗降低到1/21字节跳动提出的omgd方法进一步提高了压缩能力
omgd表示在线多粒度蒸馏,根据字节跳动技术团队的论文,该算法可以在训练过程中对gan模型进行灵活的优化和压缩,从而达到更好的图像效果和更少的计算成本。
测试数据表明,omgd压缩算法对于pix2pix和cyclegan这两种常用的gan尊龙凯时国际的解决方案是有效的omgd压缩算法可以将其计算功耗分别降低到原算法的1/40和1/46
目前,omgd压缩算法已经在tik tok等产品中得到应用,为用户提供了更丰富的视频创作能力开源社区也发布了相关技术规范,帮助从业者提高gan的创新和应用效率截至目前,字节跳动已经开放了机器学习平台klever,联邦学习平台federal,高性能分布式训练框架byteps,lightseq推理和训练引擎等重磅项目