全球AI大模型现状

2023-3-29 08:36| 发布者: 龙翔五洲| 查看: 3415| 评论: 0|原作者: 虎嗅网|来自: 虎嗅网

摘要: ChatGPT在全球掀起AI大模型的浪潮。在美国，以OpenAI、Anthropic等初创企业和以微软、Google为代表的科技巨头带领着美国在AI大模型的道路上蒙眼狂奔，最大参数已卷到5620亿。

欧洲：只有德国在认真“搞事业”

一直以来，欧洲似乎是仅次于美国的存在，但在AI 大模型方面，欧洲并不比日本更出色，甚至处于持续摆烂状态。

Future of Life Institute（FLI）曾在2022年11月发表过一篇报告提到：“欧洲没有开发通用人工智能系统，也不太可能很快开始这样做。”

FLI是美国的一家致力于减少人类面临的全球灾难性和生存风险的非营利性机构，先进人工智能带来的风险是其最重要的研究方向之一，其创始人包括DeepMind研究科学家Viktoriya Krakovna，马斯克也在该机构担任顾问，并提供资助。

FLI认为，在AI大模型方面，欧洲可能会主要扮演一个使用者的角色，即通过接入其他国家开发的大模型API来开发应用。

比如芬兰的Flowrite，一个基于AI的写作工具，可以将输入关键词生成邮件、消息等内容。比如荷兰的MessageBird，一个全渠道通信平台，这两者都是在GPT-3的基础上运行的。

欧洲在AI大模型方面确实缺少有影响力的企业，唯一一个总部位于英国的DeepMind还是由Alphabet全资拥有。整个欧洲，唯一担心因为大模型落后而被世界甩开，并为此操碎了心的只有德国。

比如谷歌3月7日最新推出的多模态大模型PaLM-E，就由谷歌和柏林工业大学共同打造，目前PaLM-E拥有5620亿参数，是全球最大的视觉语言模型。

除了合作研发之外，德国还拥有欧洲目前唯一一款AI大模型。

2022年4月，位于海德堡的德国初创公司Aleph Alpha发布了一款拥有700亿参数的预训练模型Luminous，大约是GPT-3的一半左右。Aleph Alpha在此基础上训练了聊天机器人Lumi，并计划在今年晚些时候发布最新版Luminous-World，其参数规模将达到3000亿。
作为欧洲企业，Luminous最大的特点在于更保护安全和隐私，Aleph Alpha 表示他们“不记录任何用户数据”。而包括OpenAI在内的大多数AI大模型需要用户数据进行训练（数据收集过程是透明的）。

除了建设大模型，德国也为欧洲薄弱的人工智能基础设施操碎了心。

德国人工智能协会正在开展一项大型欧洲人工智能模型（LEAM）的计划，并得到博世、SAP、大陆、拜耳、默克等德国行业巨头以及欧洲类似人工智能协会的支持。LEAM计划投资3.5亿欧元，从数据收集、人才培训、基础设施建设等方面为欧洲AI大模型的发展建立一个有竞争力的AI生态系统。

当然，你可以吐槽欧洲在技术和商业上的拉胯，但不能吐槽它在公共事业上的努力。

欧洲还有一个名叫BLOOM的大模型，发布在2020年8月。这是一个由AI初创公司Hugging Face在法国政府的资助下发起的项目，全球1000多名志愿者研究人员耗时一年多创建的AI模型，旨在消除传统大语言模型的保密性和排他性，并从一开始就嵌入伦理考量。

BLOOM有1760亿参数，它被设计得尽可能透明，并且是第一次采用了西班牙语、阿拉伯语等语言训练。BLOOM最大的特点在于可访问性，任何人都可以从Hugging Face网站免费下载它进行研究。

BLOOM的研究人员认为，开发一个任何人都可以使用，并且性能与其他高级模型相当的大语言模型将带来人工智能开发文化的长期变化。所以从欧洲的视角来看，这是一项致力于AI民主化的重要工作。

从 BLOOM的视角可以看出，欧洲在AI大模型上的关注重点与世界其他国家是不一样的，开源普惠、绿色安全这一类关于SDG的词汇一直是欧洲关注的重点。所以在AI大模型之后，欧洲大量精力其实都用在了立法上。

比如最重要的一项立法就是即将在3月底提交欧盟议会表决的《人工智能法案》。

这项法案是欧盟委员会在2021年提出的，原因是欧盟认为从跨国视角来看，各国独立的监管措施会导致监管碎片化，进而妨碍跨境人工智能市场的形成，并威胁到数字主权。同时他们也担心复杂的监管会抑制创新、威胁个人隐私、甚至AI一旦失控带来的一些潜在风险。当然，最重要的是，欧盟希望通过立法的方式参与到全球人工智能的标准制定当中。

具体而言，欧盟希望将不同的AI技术根据风险水平进行分类，具体为：最小、有限、高以及不可接受。高风险技术不会被禁止，但相关公司将被要求在运营中保持高度透明。而所谓透明，其中的规则就是迫使相应的公司阐明其人工智能模型的内部运作方式。

而这项法案一旦通过，意味着将成为欧盟成员国内直接适用的法律，之后如果企业想在欧盟销售或使用人工智能产品就必须遵守相应的法规，否则将面临高达其全球年营业额6%的罚款。

但FLI认为，欧洲对其他国家的技术依赖可能阻碍欧盟参与制定人工智能全球标准的努力。

欧洲的问题在于，缺乏一个统一的大市场。

在GDP总量上，欧盟2022年GDP16.65万亿美元与中国相当；在人口数量上，欧盟2022年人口4.46亿，甚至超过美国3.32亿。但欧盟却拥有28个国家，23种官方语言，再加上与美国的深度绑定，都导致欧盟在互联网时代没有创造出一个大型的互联网企业，进而在数据量、云计算、推理训练等AI大模型相关的基础设施上被持续拉开。

如今在AI大模型领域，欧洲已经很难组织起一场强有力的阻击，但对于中国企业来说，欧洲仍然是一个广阔的市场。

中国：最活跃的AI市场，爱打组合拳

许多人可能会认为，中国的AI大模型是从“文心一言”开始的。但“文心一言”其实只是一个类ChatGPT的产品，背后驱动它的AI大模型无论是百度、阿里、还是腾讯、华为都早有布局。

但有意思的是，中国第一个AI大模型并不来自于这些牛X哄哄的大企业，而是2021年3月由智源研究院发布的“悟道1.0”。

可能会有人好奇，智源研究院是个什么角色，那我告诉你，它是妥妥的国家队。智源研究院是科技部和北京市支持的，依托北京大学、清华大学、中国科学院、百度、小米、旷视科技等北京人工智能方面优势企业共同建立的研究机构。

智源研究院推出的悟道1.0并不是某个大模型的名称，而是一系列大模型的统称。

具体包括我国首个面向中文的预训练语言模型悟道·文源；首个公开的中文通用图文多模态预训练模型悟道·文澜，首个具有认知能力的超大规模预训练模型悟道·文汇和超大规模蛋白质序列预测预训练模型悟道·文溯。

除了发布了诸多冠名“第一”的大模型之外，智源研究院还为中国构建了大规模预训练模型技术体系，并建设开放了全球最大中文语料数据库WuDaoCorpora，为后来其他企业发展AI大模型打下了基础。

而或许是受“悟道1.0”的影响，后来几乎所有企业，在发布大模型的时候都不止发一个，而是一串。

比如百度在2019年发布了文心大模型。和悟道AI一样，文心大模型也是诸多模型的统称，包括NLP、CV（机器学习）、跨模态大模型和生命计算大模型四个类别36个大模型。

3月16日，基于文心大模型，百度发布文心一言，成为中国第一个类ChatGPT产品。

华为在2021年基于昇腾 AI 与鹏城实验室联合发布了鹏程盘古大模型。盘古大模型包括CV和NLP两类大模型。其中，盘古NLP大模型是业界首个千亿级中文NLP大模型。

阿里在2022年9月发布了“通义”大模型系列，包含NLP大模型AlicMind、视觉大模型CV，多模态大模型M6。其中M6大模型是国内首个千亿参数多模态大模型。

目前，阿里巴巴“通义”大模型系列已在超过200个场景中提供服务，实现了2%~10%的应用效果提升。典型使用场景包括电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等。

同样在2022年，腾讯发布混元AI大模型，其中包含NLP、CV和多模态等基础模型和众多行业/领域模型。到今年2月初，腾讯混元AI大模型团队再推出万亿中文NLP预训练模型HunYuan-NLP-1。目前HunYuan-NLP-1T大模型已在腾讯广告、搜索、对话等内部产品落地，并通过腾讯云服务外部客户。

到今年2月底，腾讯也开始研发类ChatGPT产品，并已成立“混元助手（HunyuanAide）”项目组。

商汤在3月14日发布多模态通用大模型“书生2.5”，拥有30亿参数，其图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供感知和理解能力支持。“书生（INTERN）”最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布。

在此之外，京东在2月10日宣布研发产业版ChatGPT——ChatJD，网易、360、字节跳动等也宣布了在AI大模型方面的布局。

可以说，目前国内有头有脸的互联网企业基本都拥有一个AI大模型，或者制定了相应的计划。

而与国外企业大多专注于一个大模型不同，中国企业在大模型方面的布局并不爱单打独斗，而是喜欢通过一个系列来打组合拳。

另一个特点在于，与国外大模型在实验室打磨成熟之外，中国大模型都是从产业端实战出来的。比如阿里、百度、腾讯的大模型都会应用到广告推送、社交平台的图片识别，内容分发等领域。

因此在中国企业发力大模型的时候，消费端的用户感知其实并不强烈，但当你体验到广告推送越来越准确，视频平台和电商平台的猜你喜欢越来越能Get到你的点，后面都有大模型的功劳。

在大厂之外，与韩国缺少创业不同，AI大模型正在中国带动AI大模型领域的创业风潮。

从前美团联合创始人王慧文在朋友圈公开组队开始，阿里VP贾扬清，创新工场CEO李开复、前搜狗CEO王小川、前京东AI掌门人周伯文、出门问问创始人李志飞等人纷纷下场创业，据自象限不完全统计，目前下场的大佬已有10位。

除了创业之外，中国投资机构也在跃跃欲试。

在王慧文确认下场AI大模型之后，一张真格基金合伙人戴雨森、刘元与王慧文、李志飞喝酒的图片在网上疯传，被认为是AI大模型时代的标志性照片。目前，王慧文的光年之外已经确认2.3亿美元的新一轮融资，其中可能包括真格资本和源码资本。

除此之外，在奇绩创坛2022年11月举办的2022年秋季路演中，陆奇选择的55个项目，其中就有16个项目与大模型相关。

可以说，AI大模型正在成为中国硬科技投资的一个新风向。

整体来看，从投资、创业到应用，中国几乎是目前世界上最活跃的市场。所以我们大可不必纠结为什么ChatGPT没有发生在中国，因为未来仍然大有可为。