元宇宙

上线-万物皆可AI 国内“百模”迈入淘汰赛丨AI应用之道②

作者:CETCIT小编 •

2024-02-07 09:19:02

21世纪经济报道记者孔海丽、实习生邓熙涵北京报道

大模型竞速，企业仍在加码。

近日，谷歌旗下人工智能大模型Gemini Pro已向欧洲用户开放，欲与ChatGPT分天下。另据谷歌母公司Alphabet首席执行官Pichai在财报电话会上透露，号称最强AI模型的“Gemini Ultra”将很快面世。

与此同时，长期缺席大模型的苹果似乎也有意入局，或将推出嵌入生成式AI的iOS 18，提升Siri在自动问答方面的完整性。

慢半拍的苹果能否再次开启“iPhone时刻”，仍未可知，但可以肯定的是，2023年刮起的“大模型热”，2024年仍将蔓延。

头号玩家加速领跑

被比尔盖茨称为“将改变我们的世界”的ChatGPT，依旧是群雄争霸的先行者，其开发者OpenAI，在过去一年占据话题C位，大模型能力和商业化实力都在进化。

2023年1月末，发布仅两个月，ChatGPT便获得1亿月活用户，使其成为历史上增长最快的消费者应用程序。随后OpenAI乘势而上推出ChatGPT Plus的订阅服务，开启了付费时代。

对于一家初创公司，GPT能否顺利承载大量用户涌入，类似的质疑与争辩不绝于耳。2023年3月15日凌晨，OpenAI发布最新大模型应用成果GPT-4，并率先开放ChatGPT Plus用户使用，宣告大模型多模态时代的到来。

GPT-4在模拟律师考试、美国高考SAT等职业和学术测试中表现不俗，语言测试准确度大幅提高。

此外，OpenAI也优化了GPT-4模型的安全性能，不允许其技术被用于生成仇恨、骚扰、暴力或成人内容。官方数据显示，相比GPT-3.5，GPT-4响应禁止内容请求的可能性降低了82%。

随后，具有视觉功能的GPT-4V、六维度突破的GPT-4Turbo相继问世。

受益于日益成熟的技术底座，OpenAI的大模型系列落地扎根。2023年11月10日，OpenAI推出GPTs功能，无需复杂的代码，任何人都可使用自然语言构建和微调定制化的模型，并将专属模型上传到GPT Store。科创者更易部署GPT盈利，零基础小白也能训练出自己的AI Agent，GPTs这步棋似乎为大模型的服务生态打开了新的象限。美国时间2024年1月11日，OpenAI官宣GPT Store（GPT商店）正式上线，OpenAI联合创始人Sam Altman将其称为“人工智能领域的苹果应用商店”。

如今，经历“逼宫”闹剧最终安然回归的Sam Altman，将带领OpenAI走向何方，也为大模型竞争格局增添了几许不确定性。

曾经向OpenAI追加100亿美元投资的微软也是本轮浪潮的发起者之一，正探路大模型商业化和自家应用的落地实践。

2023年2月，微软快速将大模型技术融入搜索引擎Bing，New Bing焕新检索路径，以聊天框取代搜索框。第三方机构data.ai数据显示，New Bing的全球下载量一夜激增10倍。同年5月，微软再度升级Bing，推出基于GPT-4的Bing Chat。但流量增加并未显著提升搜索引擎背后的广告收益。

微软的大模型布局，也在向办公软件发力。2023年3月16日，微软正式宣布推出Microsoft 365 Copilot，将Microsoft Graph和GPT-4大模型的力量与微软365软件生态进行结合。在此后召开的Ignite2023大会上，微软更是直接发布了Copilot Studio，用户可以直接在Studio中构建和发布插件，无缝搭载OpenAI的模型服务，一定程度上更新了大模型时代人机交互的方式。

谷歌虽然在AI大模型市场部署中错失先发机遇，但也在过去一年间，加速大模型技术向产品的转化。2023年3月，谷歌推出当时全球最大视觉语言模型PaLM-E，随后为基于LaMDA模型的聊天机器人Bard开启全球公测，对标ChatGPT展开竞赛。5月的I/O2023开发者大会上，全新的AI语言模型PaLM2亮相。据悉，训练该模型的文本数量几乎是训练其前身模型的五倍，经过100种语言的“锤炼”，PaLM2可以使产品和功能全面AI化。

去年12月，谷歌铺垫许久的Gemini1.0才正式走到聚光灯下，根据谷歌发布的基准测试，在32项性能测试标准中，Gemini有30项得分超过了GPT-4。但Gemini的演示视频，被普遍质疑是一个精剪合辑，有炒作营销的嫌疑。随后，Google DeepMind的研究副总裁Oriol Vinyals承认，视频中的所有人类提示和AI输出都是真实的，但为简洁起见进行了缩短。

不久的将来，谷歌或将推出Gemini UltraAI模型，相比Gemini1.0或许有明显的升级与进步。正在紧锣密鼓训练大模型的谷歌，距离其“提供世界上最先进、最安全、最负责任的AI”的目标还有多远仍是未知数，但谷歌背靠最庞大的搜索数据库，具有海量用户优势，这是其大模型发展之路上不容忽视的重要加持。

拥抱开源是社交巨头Meta布局大模型的路径，使得Meta在OpenAI、谷歌主导的AI闭源世界之外，重新开辟了一片天地。Meta在2023年5月发布了开源大模型LLaMA，投身模型之战。同年7月升级版大模型LLaMA2宣布免费可商用。同年7月，Meta发布可跨6种不同模态的模型Image Bind。2024年1月29日，Meta发布开源大模型CodeLlama70B，测试结果超越了Llama2。

Meta凭借开源的LLaMA系列模型，在业界建立了广泛的影响力，许多国际公司都部署了基于LLaMA的开源模型。

2023年四季度财报显示，Meta获得了25%的营收增长，这也是其自2021年三季度以来的最大季度增幅。Meta首席执行官马克·扎克伯格指出，Meta在推动人工智能和元宇宙愿景方面取得了很大进展。

商用价值考验国内“百模”

《2023-2024年中国人工智能计算力发展评估报告》显示，截至2023年10月，中国累计发布200余个大模型，老牌互联网大厂、科技型企业、科研机构与高校纷纷入局，一边发力提升大模型能力边界，一边夯实产品建设，呈现出井喷式的“百模竞发”。

热闹非凡的国内赛道中，百度是第一个将大模型产品对标ChatGPT的破壁者。

2023年3月16日，百度发布了大语言模型、生成式AI产品文心一言。目前文心一言4.0已实现理解、生成、逻辑和记忆能力的提升。百度也对旗下搜索、推荐、地图、如流等产品开刀，接入了大模型。截至目前，文心一言用户规模突破了1亿人。

大模型的技术洋流同样裹挟着阿里，经历了业务层面的调整，阿里在去年4月正式宣布推出大语言模型通义千问，又在年中上架了两款开源模型Qwen-7B和Qwen-7B-Chat。作为国内第二家拿出大模型的头部大厂，阿里更信仰开源，迄今共开源18亿、70亿、140亿、720亿参数的4款大语言模型，阿里云称之为“全尺寸，全模态”开源。

据报道，大模型训练人员在阿里国际商业集团的AIBusiness团队构成中超1/3，大模型可以实现智能“货找人”，研制自如对话的AI客服，进一步解决跨境电商本地化问题。去年11月，阿里智能信息事业群也发布了夸克大模型，先后推出“健康助手”“讲题助手”“元知”等基于搜索场景的AI产品，把大模型能力融入到网盘、扫描、听记等智能工具产品中。

腾讯是BAT三巨头中最为谨慎的一个，自研的混元大模型在2023年下半年才浮出水面，并于同年11月正式对外开放“文生图”功能。腾讯将混元大模型的特色表述为：拥有超千亿参数、预训练语料超2万亿tokens、降低30%-50%的幻觉率。腾讯内部消息透露，已有超过180个腾讯内部业务已接入腾讯混元，并依托腾讯云TI平台打造行业大模型精选商店，提供一站式大模型服务。2024年，腾讯还将进行规模化的复制，从实际落地场景切入，早日进入大模型商业化。

除了互联网大厂，科大讯飞、智谱·AI、商汤科技也是大模型市场的重要参与者。今年1月30日，科大讯飞发布了星火认知大模型V3.5。

数据研究和分析机构Gartner预测，到2026年超过80%的企业将使用生成式AI的API（应用程序编程接口）、模型，或在生产环境中部署支持生成式AI的应用，而在2023年初这一比例不到5%。

如果对标国际巨头，国内各式各样大模型的实际能力，网友们见仁见智。与此同时，大模型的商用也面临着一系列挑战。研发成本高昂、落地场景不明晰、部署成本高等问题，困扰着大模型的商业化进程。

如果说2023年是大模型研发的元年，2024年则是大模型应用的元年，大模型的研发企业们能不能让更多用户买单，让大模型形成良性循环，仍未见到明确答案。

可以预测的是，淘汰赛开始了。

web3.0教程

获取web3.0观点与资讯

查找第三代互联网(web3.0)相关文章

上线-万物皆可AI 国内“百模”迈入淘汰赛丨AI应用之道②

web3.0教程

什么是区块链？区块链初学者指南

web3.0初学者指南-全面了解web3

什么是元宇宙？如何准确定义元宇宙？