更大并不一定更好

时间：2022-03-05 08:46:01 | 来源：行业动态

时间：2022-03-05 08:46:01 来源：行业动态

在当今以深度学习为中心的研究范式当中，人工智能的主要进步主要依赖于模型的规模化扩展：数据集更大、模型更大、计算资源更大。

GPT-3就很好地说明了这种现象。这套模型中包含多达1750亿个参数。为了帮助大家更直观地理解这个数字，其前身GPT-2模型（在去年发布时，同样创下了体量层面的纪录）只有15亿个参数。去年的GPT-2在拥有千万亿次算力的设备上训练了几十天；相比之下，GPT-3的训练时长将增长至数千天。

这种靠每况愈大模型推动AI技术进步的问题在于，这类模型的构建与部署都需要消耗大量能源，并由此产生巨量碳排放。

在2019年的一项广泛研究当中，由Emma Strubell牵头的一组研究人员估计，训练一套深度学习模型可能产生高达62万6155磅的二氧化碳排放量大约相当于五辆汽车从出厂到报废的总二氧化碳排放规模。如果这还不够直观，那么每个美国人每年平均产生3万6156磅二氧化碳排放量。

可以肯定的是，这项估算主要针对那些高度依赖于能源的模型。毕竟结合当前现实，机器学习模型的平均训练过程绝不至于产生60多万磅二氧化碳。

同样值得注意的是，在进行这项分析时，GPT-2仍然是研究领域规模最大的模型，研究人员也将其视为深度学习模型的极限。但仅仅一年之后，GPT-2就成了纤细瘦小的代名词，下代模型的体量超过其百倍。

关键词：定更

网站
营销
设计
运营
优化
效率
专注
电商
方案
推广

解决方案&服务

客户&案例

营销资讯

关于我们

解决方案&服务

客户&案例

营销资讯

关于我们

微信公众号

为了最佳展示效果，本站不支持IE9及以下版本的浏览器，建议您使用谷歌Chrome浏览器。点击下载Chrome浏览器

关闭

在线咨询

快捷入口

更大并不一定更好

IBM FlashSystem 9200R

为中国城市数字经济画像

园区智能体：场景的数字孪生，带来行业数字化转型的最佳实践

APP直播源码，直播还有自己的特别优势？

VAIO还是那个VAIO：强调传承兼顾创新

新战略缔造多领域重要领导力

Stratasys体素级3D打印解决方案

在网络营销中，信息流广告表现如何

迭代学院区块链融资商务推介会在国际会议召开

18、微隔离（Microsegmentation）

在线咨询

快捷入口

更大并不一定更好

推荐文章

IBM FlashSystem 9200R

为中国城市数字经济画像

园区智能体：场景的数字孪生，带来行业数字化转型的最佳实践

APP直播源码，直播还有自己的特别优势？

VAIO还是那个VAIO：强调传承 兼顾创新

新战略缔造多领域重要领导力

Stratasys体素级3D打印解决方案

在网络营销中，信息流广告表现如何

迭代学院区块链融资商务推介会在国际会议召开

18、微隔离（Microsegmentation）

VAIO还是那个VAIO：强调传承兼顾创新