元宇宙

上线-万物皆可AI 国内“百模”迈入淘汰赛丨AI应用之道②

作者:CETCIT小编

2024-02-07 09:19:02

21世纪经济报道记者孔海丽、实习生邓熙涵北京报道

大模型竞速,企业仍在加码。

近日,谷歌旗下人工智能大模型Gemini Pro已向欧洲用户开放,欲与ChatGPT分天下。另据谷歌母公司Alphabet首席执行官Pichai在财报电话会上透露,号称最强AI模型的“Gemini Ultra”将很快面世。

与此同时,长期缺席大模型的苹果似乎也有意入局,或将推出嵌入生成式AI的iOS 18,提升Siri在自动问答方面的完整性。

慢半拍的苹果能否再次开启“iPhone时刻”,仍未可知,但可以肯定的是,2023年刮起的“大模型热”,2024年仍将蔓延。

头号玩家加速领跑

被比尔盖茨称为“将改变我们的世界”的ChatGPT,依旧是群雄争霸的先行者,其开发者OpenAI,在过去一年占据话题C位,大模型能力和商业化实力都在进化。

2023年1月末,发布仅两个月,ChatGPT便获得1亿月活用户,使其成为历史上增长最快的消费者应用程序。随后OpenAI乘势而上推出ChatGPT Plus的订阅服务,开启了付费时代。

对于一家初创公司,GPT能否顺利承载大量用户涌入,类似的质疑与争辩不绝于耳。2023年3月15日凌晨,OpenAI发布最新大模型应用成果GPT-4,并率先开放ChatGPT Plus用户使用,宣告大模型多模态时代的到来。

GPT-4在模拟律师考试、美国高考SAT等职业和学术测试中表现不俗,语言测试准确度大幅提高。

此外,OpenAI也优化了GPT-4模型的安全性能,不允许其技术被用于生成仇恨、骚扰、暴力或成人内容。官方数据显示,相比GPT-3.5,GPT-4响应禁止内容请求的可能性降低了82%。

随后,具有视觉功能的GPT-4V、六维度突破的GPT-4Turbo相继问世。

受益于日益成熟的技术底座,OpenAI的大模型系列落地扎根。2023年11月10日,OpenAI推出GPTs功能,无需复杂的代码,任何人都可使用自然语言构建和微调定制化的模型,并将专属模型上传到GPT Store。科创者更易部署GPT盈利,零基础小白也能训练出自己的AI Agent,GPTs这步棋似乎为大模型的服务生态打开了新的象限。美国时间2024年1月11日,OpenAI官宣GPT Store(GPT商店)正式上线,OpenAI联合创始人Sam Altman将其称为“人工智能领域的苹果应用商店”。

如今,经历“逼宫”闹剧最终安然回归的Sam Altman,将带领OpenAI走向何方,也为大模型竞争格局增添了几许不确定性。

曾经向OpenAI追加100亿美元投资的微软也是本轮浪潮的发起者之一,正探路大模型商业化和自家应用的落地实践。

2023年2月,微软快速将大模型技术融入搜索引擎Bing,New Bing焕新检索路径,以聊天框取代搜索框。第三方机构data.ai数据显示,New Bing的全球下载量一夜激增10倍。同年5月,微软再度升级Bing,推出基于GPT-4的Bing Chat。但流量增加并未显著提升搜索引擎背后的广告收益。

微软的大模型布局,也在向办公软件发力。2023年3月16日,微软正式宣布推出Microsoft 365 Copilot,将Microsoft Graph和GPT-4大模型的力量与微软365软件生态进行结合。在此后召开的Ignite2023大会上,微软更是直接发布了Copilot Studio,用户可以直接在Studio中构建和发布插件,无缝搭载OpenAI的模型服务,一定程度上更新了大模型时代人机交互的方式。

谷歌虽然在AI大模型市场部署中错失先发机遇,但也在过去一年间,加速大模型技术向产品的转化。2023年3月,谷歌推出当时全球最大视觉语言模型PaLM-E,随后为基于LaMDA模型的聊天机器人Bard开启全球公测,对标ChatGPT展开竞赛。5月的I/O2023开发者大会上,全新的AI语言模型PaLM2亮相。据悉,训练该模型的文本数量几乎是训练其前身模型的五倍,经过100种语言的“锤炼”,PaLM2可以使产品和功能全面AI化。

去年12月,谷歌铺垫许久的Gemini1.0才正式走到聚光灯下,根据谷歌发布的基准测试,在32项性能测试标准中,Gemini有30项得分超过了GPT-4。但Gemini的演示视频,被普遍质疑是一个精剪合辑,有炒作营销的嫌疑。随后,Google DeepMind的研究副总裁Oriol Vinyals承认,视频中的所有人类提示和AI输出都是真实的,但为简洁起见进行了缩短。

不久的将来,谷歌或将推出Gemini UltraAI模型,相比Gemini1.0或许有明显的升级与进步。正在紧锣密鼓训练大模型的谷歌,距离其“提供世界上最先进、最安全、最负责任的AI”的目标还有多远仍是未知数,但谷歌背靠最庞大的搜索数据库,具有海量用户优势,这是其大模型发展之路上不容忽视的重要加持。

拥抱开源是社交巨头Meta布局大模型的路径,使得Meta在OpenAI、谷歌主导的AI闭源世界之外,重新开辟了一片天地。Meta在2023年5月发布了开源大模型LLaMA,投身模型之战。同年7月升级版大模型LLaMA2宣布免费可商用。同年7月,Meta发布可跨6种不同模态的模型Image Bind。2024年1月29日,Meta发布开源大模型CodeLlama70B,测试结果超越了Llama2。

Meta凭借开源的LLaMA系列模型,在业界建立了广泛的影响力,许多国际公司都部署了基于LLaMA的开源模型。

2023年四季度财报显示,Meta获得了25%的营收增长,这也是其自2021年三季度以来的最大季度增幅。Meta首席执行官马克·扎克伯格指出,Meta在推动人工智能和元宇宙愿景方面取得了很大进展。

商用价值考验国内“百模”

《2023-2024年中国人工智能计算力发展评估报告》显示,截至2023年10月,中国累计发布200余个大模型,老牌互联网大厂、科技型企业、科研机构与高校纷纷入局,一边发力提升大模型能力边界,一边夯实产品建设,呈现出井喷式的“百模竞发”。

热闹非凡的国内赛道中,百度是第一个将大模型产品对标ChatGPT的破壁者。

2023年3月16日,百度发布了大语言模型、生成式AI产品文心一言。目前文心一言4.0已实现理解、生成、逻辑和记忆能力的提升。百度也对旗下搜索、推荐、地图、如流等产品开刀,接入了大模型。截至目前,文心一言用户规模突破了1亿人。

大模型的技术洋流同样裹挟着阿里,经历了业务层面的调整,阿里在去年4月正式宣布推出大语言模型通义千问,又在年中上架了两款开源模型Qwen-7B和Qwen-7B-Chat。作为国内第二家拿出大模型的头部大厂,阿里更信仰开源,迄今共开源18亿、70亿、140亿、720亿参数的4款大语言模型,阿里云称之为“全尺寸,全模态”开源。

据报道,大模型训练人员在阿里国际商业集团的AIBusiness团队构成中超1/3,大模型可以实现智能“货找人”,研制自如对话的AI客服,进一步解决跨境电商本地化问题。去年11月,阿里智能信息事业群也发布了夸克大模型,先后推出“健康助手”“讲题助手”“元知”等基于搜索场景的AI产品,把大模型能力融入到网盘、扫描、听记等智能工具产品中。

腾讯是BAT三巨头中最为谨慎的一个,自研的混元大模型在2023年下半年才浮出水面,并于同年11月正式对外开放“文生图”功能。腾讯将混元大模型的特色表述为:拥有超千亿参数、预训练语料超2万亿tokens、降低30%-50%的幻觉率。腾讯内部消息透露,已有超过180个腾讯内部业务已接入腾讯混元,并依托腾讯云TI平台打造行业大模型精选商店,提供一站式大模型服务。2024年,腾讯还将进行规模化的复制,从实际落地场景切入,早日进入大模型商业化。

除了互联网大厂,科大讯飞、智谱·AI、商汤科技也是大模型市场的重要参与者。今年1月30日,科大讯飞发布了星火认知大模型V3.5。

数据研究和分析机构Gartner预测,到2026年超过80%的企业将使用生成式AI的API(应用程序编程接口)、模型,或在生产环境中部署支持生成式AI的应用,而在2023年初这一比例不到5%。

如果对标国际巨头,国内各式各样大模型的实际能力,网友们见仁见智。与此同时,大模型的商用也面临着一系列挑战。研发成本高昂、落地场景不明晰、部署成本高等问题,困扰着大模型的商业化进程。

如果说2023年是大模型研发的元年,2024年则是大模型应用的元年,大模型的研发企业们能不能让更多用户买单,让大模型形成良性循环,仍未见到明确答案。

可以预测的是,淘汰赛开始了。

web3.0教程