大模型时代,这家港股上市的AI公司如何构建技术壁垒?
在2023年的尾声回顾这一年,大模型毫无疑问是科技产业最值得关注的话题。在人们畅想掀起新一波AI浪潮的大模型将如何变革各个行业时,却发现大模型最先“颠覆”的是AI产业本身:大模型具备如此强大且不断进化的“泛化”能力,让“小模型”时代发展起来的众多AI公司似乎在一夜之间丧失了自己的技术壁垒。最具代表性的例子是,OpenAI在首届开发者大会OpenAI Devday上发布了GPT的一系列能力升级之后,众多AI初创公司应声倒下。
那么,大模型到底会如何改变AI的落地形态和技术竞争壁垒,大模型厂商真的能吞噬一切吗?什么样的AI公司才能在新时代持续保持竞争力?
要回答上述问题,我们需要近身观察典型AI公司的技术和业务进展。作为一家少有的规模化盈利的AI技术服务公司,成立近十年的百融云创就是一个绝佳的研究对象。
01 百融云创,一家“非典型”AI公司
百融云创成立于2014年,核心团队从2012年就开始为电商行业和金融机构提供AI技术服务。2021年3月,百融云创正式在香港联交所挂牌上市,股票代码6608.HK。
近日,百融云创发布了第三季未经审核营运摘要。2023年前9个月,公司总收入达19.83亿元,接近去年全年营收总额,同比增长33%。而根据此前的半年报,百融云创2023年上半年的净利润率为17%。其营收规模、增速和盈利表现,在一众上市AI公司中可谓亮眼。
百融云创自身定位为一家AI技术服务公司,从其核心产品和技术实力可以得到验证。依托决策式AI和生成式AI底层技术方案,百融云创为企业客户提供MaaS(Model as a Service,模型即服务)和BaaS(Business as a Service,业务即服务)两种模式的服务,场景涵盖营销、用户运营、风控等,客群覆盖银行、消金、保险、电商、汽车、物流、票务、能源和建筑等多个行业。
图1:百融云创业务概览(来源:百融云创)
在技术方面,百融云创从决策式AI起家,基于机器学习、深度学习等底层技术提供客户分层、精准推荐等模型服务。2017年底,百融云创开始研发NLP、智能语音等生成式AI技术,后续推出了第一代AI-Voicebot产品,并于2021年开始实现商业化变现。2023年,百融云创更是推出了BR-LLM产业大模型,并基于大模型能力对生成式AI技术能力进行了全面增强。
然而,如果抛开底层技术来看,百融云创却是一家“非典型”的AI公司。一方面,区别于中国市场上常见的“项目制”AI公司,百融云创独特的“MaaS+BaaS”服务模式具备标准化程度更高、商业价值更厚的特点。另一方面,从财务表现来看,百融云创多年保持70%以上的毛利率和增长的净利润,其规模化盈利能力也区别于AI公司普遍亏损的现状。
对于一家AI公司而言,技术能力是构建竞争力的核心要素之一。是怎样的技术优势支撑了百融云创良好的业务表现?其技术竞争壁垒又是如何构建的?
02 深度融合决策式AI与生成式AI,引领AI价值创造新范式
百融云创的技术优势,首先体现在决策式AI与生成式AI技术方案的深度融合上。基于同时在决策式AI与生成式AI上的技术沉淀和业务实践经验积累,百融云创得以将两者融合为可在生产环境落地的一体化解决方案,并创造“1+1>2”的业务价值。
当下,我们仍处于深度学习带来的人工智能第三次浪潮中。随着近期大模型和AIGC的突破,人工智能的价值创造范式正在从决策式AI向生成式AI演进,两者的融合代表了未来趋势。
图2:决策式AI与生成式AI对比
决策式AI,是指模拟人的分析、判断、决策能力的AI模型。从技术原理来看,决策式AI的核心是基于海量标注的训练数据集,学习数据中的条件概率分布。决策式AI的典型技术应用包括人脸识别、自动驾驶、推荐系统、风控系统等。可以发现,最近10年AI商业化落地的主要技术是计算机视觉、语音识别、个性化推荐与精准营销等,属于决策式AI。
生成式AI,则是模拟人的多模态内容(文本、图片、音频、视频等)创作生成能力的AI模型。技术原理上,生成式AI核心是学习数据中的联合概率分布。生成式AI的典型技术应用包括图片生成、文本生成、音视频生成、代码生成等。以LLM(预训练大语言模型)为代表的大模型技术突破,使得生成式AI实现了跨越式进步,具备了更成熟的商业化落地条件。
决策式AI和生成式AI在价值创造上也有显著差异。决策式AI的价值侧重于精准客户洞察与运营分析与决策,从而提升运营效率。例如,在营销场景中,AI模型可以根据客户数据识别出完整的客户画像,并进行客户分层筛选和风险识别;进一步地,可以基于客户画像进行个性化产品推荐。而生成式AI的价值侧重于智能交互及流程自动化,以提升客户服务体验,并促成销售转化。例如,同样在营销场景中,可以通过AI-Voicebot与客户进行问答交互,快速识别客户意图,自动生成相关回复和产品营销素材,并推送给客户。
从完整的业务流程来看,单一的决策式AI或生成式AI都只作用于某个节点,因此存在业务断点需要人工介入,会带来效率损失。而决策式AI与生成式AI的融合,则可以构建起业务全链路的智能化流程,实现端到端闭环,从而放大可创造的业务价值。
图3:决策式AI与生成式AI融合,实现存量客户运营
以百融云创“决策式AI+生成式AI”技术方案在存量客户运营场景的应用为例:第一步,需要用决策式AI对存量客户进行分类;第二步,以决策式AI为主,针对不同客户类型匹配不同的运营策略;第三步,根据运营策略,由生成式AI自动生成个性化文本等营销素材;第四步,通过生成式AI在不同时间、不同渠道对各类客户进行触达、交互和唤醒;第五步,通过决策式AI对唤醒效果进行持续监测和分析。
在上述整个闭环流程中,两者结合才能实现客户唤醒效果的最优化。因此,决策式AI+生成式AI的融合不是简单的技术叠加,而是要求在两个方向上都有技术积累以实现深度适配,并且能够以较低的成本进行解决方案交付。
百融云创在决策式AI和生成式AI方面都有较深的技术积累和独特优势。
图4:百融云创AI技术研发历程
决策式AI方面,百融云创基于近10年服务超7,000家客户的经验,积累了丰富的行业knowhow和面向各个行业和应用场景模型资产,每天的模型调用量过亿。这使得百融云创可以根据客户场景准确洞察业务问题,并快速形成相应的模型和解决方案。
生成式AI方面,百融云创的AI-Voicebot集成了NLP、ASR、TTS、VAD等多种技术,并基于海量语料积累持续迭代模型,具备极高的准确率和毫秒级语音交互能力。AI-Voicebot与BR-LLM的工具调用能力结合,可以实现智能业务办理等新场景应用。
在前沿的大模型技术方面,百融大模型BR-LLM瞄准产业应用,是一个MoE架构的模型簇,集成了7B、13B等不同参数量版本的大模型和传统小模型,通过最上层的模型路由根据场景需求进行模型能力调用。百融云创自主搭建了BR-LLM的底层框架,并结合NLP、智能语音等技术和独有真实业务场景数据进行预训练,在中文能力、工具调用能力、垂直行业知识等特性上做了增强。以上工作,使得BR-LLM在产业应用上表现出良好效果,同时具备较低的推理成本和较快的推理速度。
另外,百融云创使用自有和开源数据,训练了百融编码大模型BR-Coder,基于海量的高质量开源代码和企业私有代码预训练,可以与工程师协作,自动生成代码,解答技术问题,提升工程师的生产力。目前百融云创内部已有10%的代码采用Br-Coder来生成,而且这个比例还会持续提升。
为了构建完整工具链,加速大模型应用开发,百融云创开发了Cybertron平台。Cybertron是变形金刚transformer的母星,寓意Bot基地。它能快速可视化生成企业内部Bot,对接企业内部知识库和工具库,并对外提供AI copilot 和AI agent。基于Cybertron平台,百融云创内部已经孵化出AI员工、AI数字人等产品。
此外,百融云创构建了成熟的AI基础设施,以支撑模型的快速、低成本交付。百融云创打造了自动机器学习平台ORCA,对面向不同客户和应用场景的海量模型资产进行统一、高效的生产和管理,实现自动化建模、部署和推理服务;并利用BR-LLM的代码生成能力构建了ORCA-GPT,实现跨编程语言和框架的智能分析模型自动转换和部署,极大降低了模型开发部署的周期和成本。基于ORCA等能力,百融云创已经形成了强大的AI中台,提供了包含大模型在内的各类模型的训练、部署和统一的API服务接口,实现了AIOPS全流程,统一管理AI算力、AI资源和AI服务。
03 深入垂直场景的数据闭环与行业knowhow,构筑新范式下的坚实技术壁垒
回顾AI技术发展历史,数据、算法和算力三大要素共同构建起AI的技术壁垒。数据和算力的进步,推动了第三次人工智能浪潮的兴起。率先落地的计算机视觉,是因为算法的突破和数据量的增长蓬勃发展,又受制于算法在海量垂直场景下泛化能力的不足而遇到瓶颈。
传统范式下,AI落地路径主要是“小模型+行业”,需要依靠垂直场景标注数据进行小模型训练,模型基本不具备泛化和场景迁移能力,算法和数据都是重要的竞争壁垒。而在新范式下,生成式AI的落地以大模型为主导,大模型本身具备很强的泛化能力,在落地业务场景时,主要采用“基础大模型+高质量行业数据集”进行微调的路径,无需从0到1进行训练。因此,算法层面的架构走向统一,通用算法能力被拉齐,难以形成壁垒。数据层面,只有足够深入垂直场景获取的高质量行业数据集才真正具备排他性的优势。
在新范式下,百融云创依托深入垂直场景的数据闭环与行业knowhow,得以构筑起坚实的AI技术壁垒。
图5:数据闭环和行业knowhow让百融云创在数据和算法方面构建优势
百融云创在数据洞察方面的优势,不仅仅在于行业的海量数据洞察,更关键在于高价值的闭环数据反馈。AI的数据闭环,是指在应用场景中获取的模型真实反馈数据,其价值在于对模型的迭代优化。ChatGPT的能力构建就得益于人类反馈强化学习,而OpenAI大力推广ChatGPT应用的目的之一也是获得更多、更垂直场景的用户真实反馈数据。
百融云创的数据闭环,得益于其BaaS服务模式。在传统服务模式下,AI技术服务商一般只提供模型服务,模型部署在客户的生产环境中,难以获取模型上线后的完整反馈数据。而在BaaS模式下,百融云创直接为业务过程和业务结果达成负责,直接基于AI技术提供业务运营“外包”服务,因此可以获取业务全链条的真实反馈数据。
以百融云创合作的某消金机构举例,针对该机构的“长尾睡眠客群”,通过“识别潜在用户,到开展AI营销,从听“懂”客户说话,给准确解答,到最终形成转化,不断的积累样本,进一步优化策略”的闭环。这条业务流程看似简单,实现起来却没有那么容易。智能运营不只是简单的通知,更重要的是对业务结果负责,实现用户转化的链路闭环,为合作方带来实实在在的价值。通过百融云创提供的闭环化智能运营服务,该机构用户的转化效果提升300%。
深入垂直场景的行业knowhow积累,则让百融云创可以不断开拓新场景、积累新数据,并打磨垂直领域算法。行业knowhow的本质,是准确理解客户需求痛点、为客户发现可解决的业务问题。百融云创的团队在垂类行业持续深耕十余年,逐步获取客户信任、深挖客户的核心业务场景,在不断用AI技术解决具体业务问题的过程中,积累了深厚的行业knowhow。
以百融云创的金融行业云为例,其服务的客群包括银行、消金、互联网科技公司等,具体业务场景涵盖信贷、小微、财富等,围绕增量客户获取、存量用户运营形成了大量的运营策略和模型。这些融入了深入业务理解的模型资产,绝非一朝一夕可以沉淀下来。
04 以场景为基,持续探索AI Agent、多模态等技术方向
综上所述,深入垂直场景、用AI解决业务问题是百融云创这家AI公司的最底层逻辑。从解决垂直场景的业务问题出发,百融云创得以在决策式AI和生成式AI两种技术方案上同时积累技术能力,并实现两者的深入融合和价值放大。而深入垂直场景形成的数据闭环和行业knowhow,又使得百融云创在大模型时代仍具备持续保持领先的坚实技术壁垒。
在未来技术规划上,大模型依然代表了未来方向。百融云创将探索AI Agent和多模态等技术应用与现有业务场景的结合,实现大模型在更多的业务场景落地和更大的价值释放。其中,工具调用能力是所有Agent的基础,BR-LLM已经在工具调用能力上进行了重点强化。在测试中,BR-LLM对话模型与ChatGPT-3.5-turbo的工具调用正确性指标几乎相当。后续,百融云创将结合大语言模型与强化学习,实现在设定场景环境中完成自主智能。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!