首页>科技动态 > 科技前沿 > 正文

微软与英伟达携手推出最强语言模型MT-NLG 涵盖有上千亿个参数

语言模型(Language Model)简单来说就是一串词序列的概率分布,主要作用是为一个长度为 m 的文本确定一个概率分布 P,表示这段文本存在的可能。

大家之前可能或多或少听说过 GPT-3,OpenAI 最新的语言模型,堪称地表最强语言模型。除此之外还有 BERT、Switch Transformer 等重量级产品,而且业内其他企业也在努力推出自家的模型。

微软和英伟达今天宣布了由 DeepSpeed 和 Megatron 驱动的 Megatron-Turing 自然语言生成模型(MT-NLG),这是迄今为止训练的最大和最强大的解码语言模型。

IT之家了解到,作为 Turing NLG 17B 和 Megatron-LM 的继任者,这个模型包括 5300 亿个参数,而且 MT-NLG 的参数数量是同类现有最大模型 GPT-3 的 3 倍。

标签: 微软 英伟达 语言模型

推荐DIY文章
性能旗舰一加 10 Pro首销战报出炉 1秒破亿
一加 10 Pro重磅发布,最强性能旗舰10至名归
千万销量千家售后 一加多触点布局国内市场
科技加持,未来已来,“头号玩家”不再是科幻
一加 10 Pro发布在即,性能屏幕影像全方位提升
一加中国区新任总裁李杰 :做好品牌与用户之间的连接器
精彩新闻

超前放送