稿件搜索

大模型不能“先入场再看路”

　　谢若琳

　　8月31日，首批11家通过《生成式人工智能服务管理暂行办法》备案的AI大模型名单亮相。这些大模型将陆续向用户开放，并不断接受反馈进行迭代，成为各行各业广泛使用的数据服务平台。

　　从规模上看，第二批备案的大模型也在加快上市步伐。9月1日，国家互联网信息办公室发布了《关于第二批深度合成服务算法备案的信息公告》，公告显示，第二批深度合成服务共计110个算法信息完成备案。

　　这是一个关键节点，也被业内看作历史性机遇。9月份以来，大模型论坛和闭门会议层出不穷。面对广阔的市场前景，相关企业和机构纷纷投入人力物力财力，试图抢占先机。

　　笔者认为，深耕大模型市场，首先要明确应用场景。新技术一旦进入商业化阶段，抓住需求扩大需求是第一位的。在激烈的大模型竞争中，部分机构选择“先入场再看路”，边做边改、边研发边挖掘客户需求，导致用超高成本的大模型解决低级问题。

　　在大模型准确度还不够高、构架还不够稳的背景下，研发上先要明确应用场景，是做通用大模型还是行业大模型？是面向B端还是面向C端？

　　当前大模型的主要商业场景集中在B端，这是基于规模化、规范化、实现难度等因素做出的抉择。现阶段，深耕B端企业客户是务实之举。当模型不断精调、算力成本大幅下降后，未来的AI明星应用必将诞生于C端。例如ChatGPT快速迭代，也是基于海量的C端用户基础，并经过一轮轮测试和完善才实现的。

　　其次要考虑算力投入的边界。毫无疑问，大模型之战的第一道坎是算力比拼。不同时期的算力标准是不一样的：去年10亿参数的模型就能称为大模型；随着入局者不断加码，目前大模型参数动辄上千亿。大模型有足够多的参数才能呈现出“智能涌现”效应，进而在各个场景下具备通用能力。甚至有观点认为，1万张顶级显卡才算是跨进了大模型的门槛。

　　公开资料显示，GPT-4的模型拥有近1.8万亿参数、13万亿训练数据，其训练一次的成本高达6300万美元。因此笔者认为，相对同质化竞争严重的通用大模型而言，成本投入相对较小的垂直大模型还有巨大的市场机遇。

　　尽管中国大模型发展如火如荼，但与以OpenAI（美国人工智能研究公司）为代表的一线机构相比，还存在不小的技术差距。中国需要抓紧时间，缩小与强者的差距。笔者建议，在政策支持层面，一是要加强对高端算力的支持，降低应用开发门槛；二是要加码人才培养，促进高校与企业通力合作，产学研协同创新。正如百度集团副总裁侯震宇接受媒体采访时所言，大模型也不是投一笔钱、做一个模型那么简单，它需要有算力、有数据、有经验丰富的AI工程师在好的研发平台上长期积累。

　　今年是大模型向上突破的一年，ChatGPT让人们看到了大模型的巨大潜力，也推动了大模型的迭代进程。可以预见，基于我国庞大和多样化的用户基础，我国大模型和其他AI技术将走向成熟，推动全社会向智能化和数字化转型。

证券日报APP

扫一扫，即可下载

官方微信

扫一扫加关注

官方微博

扫一扫加关注

喜欢文章

给文章打分

本文得分 :0

参与人数 :0

0/500

	存款再降息，银行股估值获强支撑
	北交所将迎来结构性重塑
	打造高质量的产业并购体系
	大模型不能“先入场再看路”

	第A1版：头版
	第A2版：财经要闻
	第A3版：热点聚焦
	第A4版：资本论坛
	第B1版：金融机构
	第B2版：公司纵深
	第B3版：公司新闻
	第B4版：信息披露
	第C1版：信息披露
	第C2版：信息披露
	第C3版：信息披露
	第C4版：信息披露
	第C5版：信息披露
	第C6版：信息披露
	第C7版：信息披露
	第C8版：信息披露
	第D1版：信息披露
	第D2版：信息披露
	第D3版：信息披露
	第D4版：信息披露
	第D5版：信息披露
	第D6版：信息披露
	第D7版：信息披露
	第D8版：信息披露
	第D9版：信息披露
	第D10版：信息披露
	第D11版：信息披露
	第D12版：信息披露
	第D13版：信息披露
	第D14版：信息披露
	第D15版：信息披露
	第D16版：信息披露
	第D17版：信息披露
	第D18版：信息披露
	第D19版：信息披露
	第D20版：信息披露
	第D21版：信息披露
	第D22版：信息披露
	第D23版：信息披露
	第D24版：信息披露
	第D25版：信息披露
	第D26版：信息披露
	第D27版：信息披露
	第D28版：信息披露
	第D29版：信息披露
	第D30版：信息披露
	第D31版：信息披露
	第D32版：信息披露
	第D33版：信息披露
	第D34版：信息披露
	第D35版：信息披露
	第D36版：广告