字节跳动应用机器学团队开源了一款名为 veGiantModel 的大模型训练框架,该训练框架主要应用于自然语言处理领域的大模型训练,最高可将大模型训练的提升 6.9 倍,大幅降低训练系统的压力。
目前,字节跳动旗下的企业级技术服务火山引擎已原生支持了 veGiantModel,并正在公测中 。
自然语言处理是人工智能研究的一个重要领域,旨在帮助计算机理解、解释和运用人类语言,可应用于机器翻译、推荐和信息提取等领域。
大规模训练模型可以包含更多数据,表示更多信息,算法表现更加出众。
然而,由于大模型参数量过于庞大,模型设计非常复杂,训练耗时长,对现有的训练系统带来了不小的挑战,主要体现为显存压力、计算压力和通信压力。
标签: 字节跳动