拓尔思AI主播小思播报北京冬奥会
本报记者 李乔宇
数据、算法、算力是保证AIGC产出质量的三大核心要素,构建起个性化、专业性的内容自动生成壁垒将成为人工智能厂商比肩前沿技术及保持领先地位的良方。
作为国内最早从事NLP技术研发的企业之一,拓尔思致力于在商业落地过程中将技术、产品、场景完美融合,打造类人助手全新模式的上市公司。在2023年开年ChatGPT春风到来之前,拓尔思已将NLP技术相关产品服务真正运用到商业实践中并产生效益。
通用大模型
开启通用人工智能一扇门
NLP被誉为“人工智能皇冠上的一颗明珠”,是人工智能认知能力的核心,对于人工智能发展至关重要。NLP主要做三件事:让机器听懂人话(理解)、讲人话(生成)、干人事(应用)。在深度学习算法被发明后,图像和语音识别已经能够实现超过人类的准确率。但由于语言规律是错综复杂的,不仅要有一定的知识依赖,而且语言的使用还基于环境和上下文,因此自然语言处理的难度远高于图像处理。
ChatGPT的火爆在于它具备非常强的语言理解能力和生成能力,使机器能够理解人类的意图,实现类人对话。2023年3月15日,OpenAI发布的ChatGPT4.0在识图能力、文字输入限制、回答准确等方面较前款产品有了飞跃式提升,并且其在各种专业测试和学术基准上表现优良。
拓尔思副董事长兼总经理施水才曾表示:“ChatGPT是人工智能生成内容(以下简称AIGC)技术进展的里程碑,该模型使利用人工智能进行内容创作的技术成熟度大幅提升,有望成为新的全行业生产力工具,提升内容生产效率与丰富度。”施水才评价ChatGPT是NLP技术革新的一大步,并开启了通用人工智能的一扇大门。
通用大模型
在各行业垂直应用落地
目前,ChatGPT正在引领一场深刻的变革,其技术可以用于智能客服、智能对话、智能搜索、智能推荐、机器写稿、辅助办公、虚拟员工等应用场景,在各行各业的商业落地中加速成熟。自2000年起,拓尔思就自主研发NLP技术,见证了人工智能技术发展的整个过程。大模型要落地,离不开数据、算法、算力、应用等综合能力的聚合,拓尔思在这方面拥有深厚的积累。
数据层面,拓尔思从2010年自建数据中心以来,已采集了超过10年的互联网公开数据,拥有规模及质量均位列业界前茅的另类数据资产。目前,拓尔思拥有来自境内外、各行各业的公开数据规模超1300亿条,数据类型涵盖新闻、资讯、政策、视频、图片、百科、社交等多模态,数据总量达100TB以上。
算法层面,拓尔思长年深耕政务、媒体、金融、专利等行业的信息化建设,已积累了30+专业知识库,涵盖通用语义分析、人物/机构、行业分类、专利、媒体、金融、科技情报、乡村振兴等领域;30000+标签模型,覆盖媒体、舆情、金融风控、产业投研、智能消保、开源情报、政务应用等场景;350+深度学习算法模型,包括NLP、金融监管、风控征信、公共安全、产业服务、传播分析、事件研判、舆情态势等通用模型、指数模型、领域模型等。
应用层面,拓尔思具备数据标注、模型设计、训练、优化、评估、部署等一站式AI工程化落地服务能力,同时在政务、媒体、金融、舆情、安全、专利等行业有着丰富的应用场景实践,有助于专业大模型贴合用户场景进行快速落地,产生业务价值。
NLP的春天已至,拓尔思正在积极拥抱大模型的发展,并充分挖掘多年积累的行业知识和专业模型优势,持续保持在AI领域的技术竞争力。在大有可为的好时代,拓尔思将继续坚定理想,拥抱变化,构筑新愿景,满怀新期待,力争为国家数字经济的创新发展贡献力量。
扫一扫,即可下载
扫一扫 加关注
扫一扫 加关注
喜欢文章
给文章打分
0/
版权所有证券日报网
京公网安备 11010202007567号京ICP备17054264号
证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。
证券日报社电话:010-83251700网站电话:010-83251800网站传真:010-83251801电子邮件:xmtzx@zqrb.net