大模型混战时代，互联网企业怎么办？

2023-12-21 22:51:05

在电脑刚刚诞生时，IBM总裁曾预测全世界只需要5台计算机。他所指的并非你我家中都有的电脑盒子，而是整个互联网，也就是云。以现在大模型的角度来看，各种云层出不穷，但全球确实在向“5朵云”靠拢，因此，整个行业都在大胆预测，也许十年后，全球就只剩下5个大模型。

训练大模型的各种超级计算机是不折不扣的“吞电兽”，耗费的电能可以达到兆瓦级，此外，它也需要投入大量的资金和人力资源，正如行业中流行一句话“人工智能每收获1块钱投资，就有6毛钱流向了大模型”，这样的类比并不夸张。所以，在能源有限的前提下，产业逐渐集中化会是必然的趋势。

大模型的风，在中国吹了将近一年。截至2023年10月，我国拥有10亿参数规模以上大模型的厂商及高校院所达到了254家，这其中既有通用大模型（AGI），也有垂直大模型。换句话说，就是每隔几天，国内就会官宣一个新的大模型。

随着“百模大战”的号角响起，大模型的混战走到后半场。在寻求更多智能与商业化的路上，行业过滤分层会更为剧烈，泥沙俱下，只有手握硬核实力和资源的企业才会活下去。最终，大模型究竟要实现何种价值，在实现价值之前，我们要突破哪些困难？

大模型的另一片蓝海

复盘最近一年，大模型的热点已经换了三次了。

起初，ChatGPT证明了大模型的能力，彼时行业人士提出，未来AI大模型的能力会像水电一样，随取随用。同时，也有人提出，大模型会成为未来互联网竞争的门槛。打个比方来说，大模型之于AI行业，犹如操作系统之于互联网产业，是不折不扣的“基础设施”，无论是短期红利还是长期前景，其全新的交互形式都会掀起一次新的生产力革命。

而后，面对“谁会为闲聊的玩具买单”这样的灵魂拷问，行业掀起了垂直大模型的热潮。彼时行业认识到，过热的大模型赛道虹吸了过多本该投放于应用层的资源，“重复造轮子”的问题拖累了应用层的木桶板。因此，大模型发展主线变成了两条，一条依然面向to C，另一条则聚焦to B，实现更多商业化落地。

最近一两个月，自从GPTs问世，更智能成为国内新风向。简单解释，就是让大模型更懂人类，不只是在提出请求时才作出反应，而是能够主动提出建议。比如，当你想要旅行，它会知道你喜欢什么样的目的地，会为你推荐兴趣活动，为你预订喜爱的餐厅。就像《钢铁侠》中的贾维斯，或是《星际穿越》中的塔斯机器人，只要动动嘴说出需求，它们就能理解你的意图，从而自动操作。这些功能需要更大算力支撑，此时，算力就成了竞争关键。

将近一年时间，此时此刻，对国产大模型来说，绝非能不能做出来大模型的问题，无论大模型如何变迁，任何玩家都有一个共同的课题，那就是落地，行业交出的答案就是更快地理解to B行业，使能垂直领域创新。

而这正与互联网产业所追求的类似。将近30多年发展里，中国互联网在个人领域的渗透率已经超九成，这意味着消费互联网日益接近流量天花板。随着红利空间减缓，互联网行业的航线正从to C驶向to B，即产业互联网。

最近，多家互联网公司密集发布面向行业的新品。比如，美图去年就面向工作场景推出ToB产品，今年3月又与华为云共创，上线AI模特试衣SaaS应用。汽车之家开发了基于全链路智能营销的 AIGC 模型，覆盖了文案策划、创意视频内容定制等营销环节，可以帮助车企降本增效，带来更高的销售转化率。

为了提升在生产、销售等环节的效益，越来越多的企业产生了数字化转型升级的需求，产业互联网行业迎来了较为明确的发展机遇。

在云计算、大数据、大模型技术浪潮下，互联网正加速获取产业能力。这意味着，大模型与产业互联网正在双向奔赴：对大模型来说，产业互联网将会是新蓝海、新机遇；而对互联网企业来说，大模型能够为自己拓展产业边界，拥有新浪潮带来的第二增长曲线。

诚然，互利共赢的时代已至，但在此之前，对于绝大多数的互联网企业来说，想要利用大模型实现一次成功的产业升级，必然会面临算力与能力两方面的关键资源的约束。

算力之困，大模型何解

互联网企业选择大模型合作伙伴之时，首要考虑的因素是算力。

大模型本身就是巨量参数“力大砖飞”的结晶，也就是说大模型与大算力密不可分。

发展到今天，国内的大模型在对话层面，已经与GPT-3.5接近，但在复杂指令层面与GPT-3.5或是GPT-4有着很大的差距。专家们预测，明年二季度末或三季度初，国内会涌现一批能力逼近GPT-4的大模型，届时中国不必再跟着OpenAI和谷歌的路径行走，而创造中国独特的打法。

向上升级就意味着也要有相匹配的算力，正如AI行业2012年至2023年算力需求翻了数十万倍一般，以GPU（图形处理器）为核心的AI芯片掌握着大模型企业的发展命脉。如果没有坚实的算力底座，无论是大模型发展，还是产业互联网升级，都会变为空谈。

但与之相悖的是，此时此刻，国内厂商提升算力拥有重重阻碍。即便不关注大模型的人，都对“算力缺乏”有所耳闻，你我都知道，供不应求意味着抢单和涨价。这意味着，本就有大批企业并无过多财力购买上千甚至上万张GPU，进一步用高价换取算力，最终分摊到下游客户身上的成本，一定会影响客户对于大模型产品的选择。

不止如此，受制于复杂国际环境博弈影响，英伟达GPU一卡难求，高端AI芯片进一步受限。国内厂商的 “算力焦虑”一时难解，成为横亘在产业互联网升级间的一座大山。

华为是国内最早布局大模型的云服务商之一，早在 2021年就已经发布了盘古大模型，今年7月份发布盘古大模型3.0。其核心关注点之一就是算力，算力强则底座强，只有大模型的底座站稳脚跟，才能支撑中国人工智能事业的发展。

而华为云在9月正式上线昇腾AI云服务，让企业一键接入即可获取AI算力。华为云已布局贵安、乌兰察布、芜湖3大主节点及30多分节点，让AI算力即开即用。同时，它支持超过10万卡大规模集群，支持超大规模训练，广泛兼容业界AI框架，满足用户开发偏好。

这意味着，企业无需单靠“买卡”这一条路，也不用担心算力可持续的问题，澎湃AI算力在云上即开即用。

得技术者强，得产业者胜

互联网企业选择大模型布局时，首先考虑的因素是技术能力。

互联网向产业升级，是技术的升级变革，更是更深层次的业务变革与商业变革。与烧钱就能快速做大规模的消费互联网不同，产业互联网更趋向”理性”，更强调价值，而非规模。

在转型过程中，流量为先的互联网产品思维不再适用，而是要综合技术能力、行业理解、商业模式升级、安全合规为一体，换句话说，就是既要技术能力强，又要懂行业。

反观当前中国互联网研发投入不足，缺乏具有自主知识产权的核心技术，相比国际领先企业，中国互联网企业技术创新能力和速度仍有差距，产品和服务同质化现象严重。

为助力互联网企业迈向产业智能化，华为云凝练了2大支撑、4大能力，为互联网企业提供一整套可行、可靠的解决方案。

具体而言，2大底座是昇腾AI云服务和盘古大模型，前者为互联网企业提供随取随用的AI算力，后者提供了超过100种技能，或超过100个的主流开源大模型，既可以直接拿来使用，也可以根据企业的个性化需求，快速训练出专属模型。

4大能力则聚焦互联网面向产业升级的业务侧需求，包括：第一，坚持技术创新，基于数智化能力和大模型行业能力，助力互联网持续技术创新，用AI重塑千行百业；第二，弥补能力鸿沟，华为云以丰富行业经验，赋能互联网更快理解to B行业，帮助互联网企业快速进入新行业；第三，重塑产业生态，依托华为全球产业生态资源，助力互联网深入产业链上下游，激发企业商业模式创新；第四，跨越区域边界，共建产业出海圈，让中国科技服务全球市场。

华为云的上述能力，来源于三方面的积累和建设。

首先在于生态。大模型发展需要融合产业力量，与厂商一同前行，华为云通过开源，正在打造一个开放的生态，形成公共联合体和商业闭环，加快软、硬、边、端、云等全面融合。目前，昇腾AI云服务已与行业头部客户联创20多个行业大模型，打造了专属的模型社区，与此同时，鲲鹏、昇腾生态已汇聚超过440万开发者，合作伙伴逾6000家，解决方案认证超17000个，并建设72个产教融合人才基地，持续携手业界伙伴打造坚实的算力底座

其次在于服务需求。大模型做好落地，需要从具体行业场景与业务场景找痛点，与技术相结合。目前，华为云已成立多模态人工智能产业联合体、智能遥感开源生态联合体和智能流体力学产业联合体，未来还计划在智慧育种、AI生物制药等领域牵引成立联合体，促进大模型产业聚合发展。

最后在于出海。任何技术发展都不是封锁的，要与世界有链接。华为云依托华为20多年全球化经验优势，提供全球一张网、安全合规、本地运营、流量聚合、跨境独立站等服务能力，让企业出海更稳健。截至目前，华为云已帮助4000+客户成功出海。

当前，伴随更多互联网企业深入产业，互联网企业从“比流量”、“比用户量”的“野蛮增长阶段”进入到“比实力”、“比耐力”、“比竞争力”的新时期。新时期下，华为云会是互联网产业升级的最佳伙伴，从华为云公布的数字中也可以窥见这一点，目前，中国已有90%的互联网企业选择了华为云。

走向产业不是单打独斗，大模型为互联网提供了全新的工具，而互联网向产业转型升级的过程中，安全可靠的生态构建也是必经之路。

文章来源:https://blog.csdn.net/AI_SHELL/article/details/135131838
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！