龙头老大OpenAI在和谷歌等其他同行“掰头”的时候，有一家“业界清流”公司

2023-12-26 19:33:22

Mistral AI——法国初创公司，该公司由来自 Google DeepMind 和 Meta 的顶级 AI 专家创立，专注于开发生成式 AI 技术。Mistral AI 在成立仅半年时间内就完成了3.85亿欧元的 A 轮融资，估值突破20亿美元，成为备受关注的 AI 公司之一。与 OpenAI 等公司不同的是，Mistral AI 坚持推广开源软件方法，允许用户自由复制、修改和再利用其计算机代码，为外部开发者提供支持。

AIGC专区：aigc
更多消息：AI人工智能行业动态，aigc应用领域资讯
注册试用测试平台网址链接：Sign in
详细论文网址链接：https://huggingface.co/blog/mixtral#about-the-name
官方介绍网址链接：Mixtral of experts | Mistral AI | Open source models

值得一提的是，成立仅一个月，还没有公布产品、彼时只有6名员工的Mistral AI，就曾凭借7页PPT“神话”般拿下1.13亿美元种子轮融资，轰动整个欧洲AI行业。而规模这么小的Mistral AI，是如何用其高效能的强大AI模型征服十几家头部VC，又如何践行开源理念，赢得广大开发者社区潮水般的支持和肯定？这些都与公司的创始团队有分不开的联系。

Mistral AI?发布的一款名为 Mixtral 8x7B 的开源模型，该模型在性能上超越了700亿参数的 Llama 2 70B，并且拥有更高的推理速度。该模型的开源发布方式简单直接，引发了广大开发者的兴趣和关注。Mistral AI 也因此得到了开发者社区的肯定，被认为是开放模型革命的引领者。

Mistral AI的三位联合创始人中，首席执行官Arthur Mensch（中）曾任Google DeepMind的研究员，参与了包括Flamingo、Chinchilla、Gopher在内的多个DeepMind经典模型，也是Flamingo和Chinchilla的核心贡献者，对多模态、RAG、算法优化等技术有深刻理解。

首席技术官Timothée Lacroix（右）和首席科学家Guillaume Lample（左）此前都是Meta巴黎人工智能实验室的核心研究人员，两人对模型推理、预训练和模型嵌入有深入研究，是Llama和Llama2的核心技术贡献者，并发表过多篇重要学术论文。他们的前东家Meta也恰恰是鼓励开源的代表公司之一。

Mistral AI团队聚集了来自Meta、Hugging Face、Deepmind等AI巨头的科学家，团队高效配合，拥有商务和政策顾问支持。最近，他们在社交平台上以直接方式发布了引爆开源社区的MoE开源模型?Mixtral 8x7B，令人瞩目。

没有 OpenAI一贯的暧昧戏码和花式推拉、也没有Google发布Gemini时精心剪辑的“特效视频”，甚至连一句介绍语都没有。Mistral AI的官宣方式如此朴实无华，简单粗暴。秉持着“能干成一件事儿就绝不跟你多废话一个字”的作风，成为AI圈特立独行的“一股清流”。

这里简单解释一下MoE，全称为Mixture of Experts（混合专家模型），就是把复杂的分析预测任务分割成一系列更小、更容易处理的子任务，每个子任务由符合该特定领域的“专家”负责。MoE架构不仅能提高模型处理信息的效率，还降低了运行成本。

据说OpenAI从去年开始就在用这种方法来训练GPT-4， Mistral AI则正是致力于为企业提供一种“无限接近”GPT-4的开源选择。

具体到链接里的Mixtral 8x7B，总参数为46.7B，但每个令牌只使用12.9B。因此，它以与12.9B模型相同的速度和成本处理输入并生成输出。Mistral 8x7B拥有32k Tokens上下文长度，支持英语、法语、意大利语、德语和西班牙语。在代码生成方面表现出色，还支持微调为指令跟随模型，并采用 Apache 2.0许可证开源商用。

性能方面，Mixtral 8x7B在大多数基准测试上都超越了700亿参数的Llama 2 70B，推理速度提高6倍。在模拟真实世界对话场景、评估大语言连贯性和信息丰富的MT-Bench测试中，它达到了8.30的分数，其性能可与GPT3.5媲美，成为最好的开源模型。

Mistral AI称是一支行动迅速、高工作强度和透明度的团队，旨在将强大的生成式AI技术开源，并通过应用驱动实现模型对现实世界的实质帮助。他们希望成为开放式AI社区的领先支持者，将开源模型推向最先进的性能水平。与竞争对手不同，Mistral AI坚信开源是引领生成式AI革命的必然路径，认为社区支持的模型开发能够接受严格审查，抗击偏见，构建一个可信的替代方案，对抗AI寡头。CEO Arthur Mensch强调，过早进入闭源阶段对科学发展是有害的，开源模型可以精细地适应各行业垂直领域，允许开发者自定义护栏和编辑语气，避免依赖API提供者的选择和偏见。在AI行业巨头垄断的时代，Mistral AI的开源共享精神备受开发者拥戴，人们对其加速开源领域创新的期望与兴奋。

文章来源:https://blog.csdn.net/heehelcom/article/details/135228560
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！