证券代码:688787 证券简称:海天瑞声 公告编号:2022-017
本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、准确性和完整性依法承担法律责任。
重要内容提示:
● 拟续聘财务和内部控制审计机构:信永中和会计师事务所(特殊普通合伙)(以下简称“信永中和”)
一、拟聘任会计师事务所的基本情况
(一)机构信息
1、基本信息
机构名称:信永中和会计师事务所(特殊普通合伙)
成立日期:2012年3月2日
组织形式:特殊普通合伙企业
注册地址:北京市东城区朝阳门北大街8号富华大厦A座8层
首席合伙人:谭小青先生
截止2021年12月31日,信永中和合伙人(股东)236人,注册会计师1455人。签署过证券服务业务审计报告的注册会计师人数超过630人。
信永中和2020年度业务收入为31.74亿元,其中,审计业务收入为22.67亿元,证券业务收入为7.24亿元。2020年度,信永中和上市公司年报审计项目346家,收费总额3.83亿元,涉及的主要行业包括制造业,信息传输、软件和信息技术服务业,电力、热力、燃气及水生产和供应业,交通运输、仓储和邮政业,金融业,批发和零售业,房地产业,采矿业等。公司同行业上市公司审计客户家数为30家。
2、投资者保护能力
信永中和已购买职业保险符合相关规定并涵盖因提供审计服务而依法所应承担的民事赔偿责任,2021年度所投的职业保险,累计赔偿限额7亿元。近三年在执业中无相关民事诉讼承担民事责任的情况。
3、诚信记录
信永中和近三年(2019年至2021年)因执业行为受到刑事处罚0次、行政处罚0次、监督管理措施12次、自律监管措施0次和纪律处分0次。29名从业人员近三年因执业行为受到刑事处罚0次、行政处罚2次、监督管理措施27次和行业自律监管措施2次。
(二)项目信息
1、基本信息
拟签字项目合伙人:郭勇先生,2007年获得中国注册会计师资质,2008年开始从事上市公司审计,2019年开始在信永中和执业,近三年签署和复核的上市公司超过4家。
拟担任独立复核合伙人:刘宇先生,2008年获得中国注册会计师资质,2008年开始从事上市公司审计,2008年开始在信永中和执业,近三年签署和复核的上市公司超过10家。
拟签字注册会计师:左东强先生,2018年获得中国注册会计师资质,2016年开始从事上市公司审计,2019年开始在信永中和执业,2021年开始为本公司提供审计服务。
2、诚信记录
项目合伙人、签字注册会计师、项目质量控制复核人近三年无执业行为受到刑事处罚,受到证监会及其派出机构、行业主管部门的行政处罚、监督管理措施,无受到证券交易场所、行业协会等自律组织的自律监管措施、纪律处分等情况。
3、独立性
信永中和及项目合伙人、签字注册会计师、项目质量控制复核人等从业人员不存在违反《中国注册会计师职业道德守则》对独立性要求的情形。
4、审计收费
2021年财务报告审计费用为60万元。系按照会计师事务所提供审计服务所需的专业技能、工作性质、承担的工作量,以所需工作人、日数和每个工作人日收费标准确定。
公司董事会提请股东大会授权公司管理层根据2022年公司实际业务情况和市场情况等与审计机构协商确定审计费用,并签署相关服务协议等事项。
二、拟续聘财务和内部控审计机构履行的程序
(一) 董事会审计委员会的召开、审议和表决情况
公司于2022年4月18日召开第二届董事会审计委员会第五次会议,审议通过了《关于续聘会计师事务所的议案》,鉴于信永中和会计师事务所(特殊普通合伙)2021年度为公司提供审计服务期间能够履行职责,按照独立审计准则,客观、公正地为公司出具审计报告,为保持公司审计工作的连续性,同意公司2022年度拟继续聘请信永中和会计师事务所(特殊普通合伙)为公司财务审计与内部控制审计机构。同意将该议案报董事会审议表决并提交公司2021年年度股东大会审议。
(二) 独立董事事前认可及独立意见
独立董事事前认可意见:我们就公司拟续聘会计师事务所的事项听取了公司管理层的汇报,审核了拟聘会计师事务所的相关资质等证明材料,我们认为,信永中和会计师事务所(特殊普通合伙)具备证券、期货相关业务执业资格,具备为上市公司提供审计服务的经验与能力,能够满足公司审计工作要求。公司本次续聘审计机构,符合有关法律、行政法规和《公司章程》的规定,不存在损害公司及全体股东利益的情况。综上,我们同意将上述议案提交公司董事会审议。
独立董事意见:经核查,我们认为信永中和会计师事务所(特殊普通合伙)具备证券期货业从业资格,为公司提供的审计服务规范、专业,审计团队严谨、敬业,具备承担公司审计工作的能力。公司续聘信永中和会计师事务所(特殊普通合伙)为公司2022年度财务及内部控制审计机构符合有关法律、法规及《公司章程》的有关规定,我们同意续聘其为公司2022年度的财务及内部控制审计机构,为公司提供财务报表审计和内部控制审计服务。
(三) 董事会的召开、审议和表决情况
公司于2022年4月28日召开第二届董事会第七次会议通过了《关于续聘会计师事务所的议案》,同意公司2022年度聘请信永中和会计师事务所(特殊普通合伙)为公司财务审计与内部控制审计机构,并提交公司2021年年度股东大会审议。
表决结果:9 票同意,0 票弃权,0 票反对。
(四)生效日期
公司本次续聘财务及内部控制审计机构事项尚需提交股东大会审议,并自公司股东大会审议通过之日起生效。
特此公告。
北京海天瑞声科技股份有限公司
董事会
2022年4月29日
证券代码:688787 证券简称:海天瑞声 公告编号:2022-021
北京海天瑞声科技股份有限公司
第二届监事会第六次会议决议公告
本公司监事会及全体监事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、准确性和完整性依法承担法律责任。
一、 监事会会议召开情况
北京海天瑞声科技股份有限公司(以下简称“公司”)于2022年4月28日以现场会议与通讯相结合的方式召开了第二届监事会第六次会议。本次会议通知已于2022年4月18日以邮件方式送达公司全体监事。本次会议由监事会主席张小龙先生主持。会议应到监事3人,实际参加会议监事3人。会议的召集和召开程序符合《公司法》等相关法律法规及《公司章程》的有关规定,会议决议合法、有效。
二、 监事会会议审议情况
(一) 审议通过了《关于<2021年度监事会工作报告>的议案》;
表决结果:同意3票,反对0票,弃权0票。
本议案尚需提交公司2021年年度股东大会审议。
(二)审议通过了《关于<2021年度财务决算报告>的议案》;
表决结果:同意3票,反对0票,弃权0票。
本议案尚需提交公司2021年年度股东大会审议。
(三)审议通过了《关于<2022年度财务预算报告>的议案》;
表决结果:同意3票,反对0票,弃权0票。
本议案尚需提交公司2021年年度股东大会审议。
(四)审议通过了《关于2021年度利润分配预案的议案》;
监事会认为,公司2021年度利润分配预案充分考虑了公司盈利情况、现金流状态及资金需求等各种因素,同时考虑投资者的合理诉求。该方案的决策程序、利润分配形式和比例符合有关法律法规、公司章程的规定,不存在损害中小股东利益的情形,符合公司经营现状,有利于公司的持续、稳定、健康发展。
监事会同意2021年度利润分配预案,并同意将该议案提交公司2021年年度股东大会审议。
表决结果:同意3票,反对0票,弃权0票。
本议案尚需提交公司2021年年度股东大会审议。
具体内容详见公司同日披露于上海证券交易所网站(www.sse.com.cn)的《海天瑞声关于2021年度利润分配预案的公告》(公告编号:2022-016)。
(五)审议通过了《关于<2021年年度报告>及其摘要的议案》;
经审核,监事会认为:公司《2021年年度报告》及其摘要的编制和审核程序符合相关法律法规、《公司章程》和公司管理制度的各项规定,能够公允地反映公司报告期内的财务状况和经营成果;公司《2021年年度报告》及其摘要的内容和格式符合中国证券监督管理委员会和上海证券交易所的各项规定;在公司监事会提出本意见前,监事会全体成员未发现公司参与《2021年年度报告》及其摘要的编制和审议人员有违反保密规定的行为。
监事会及全体监事保证公司《2021年年度报告》及其摘要所披露的信息真实、准确、完整,所载资料不存在任何虚假记载、误导性陈述或重大遗漏,并对其内容的真实性、准确性和完整性依法承担法律责任。
表决结果:同意3票,反对0票,弃权0票。
本议案尚需提交公司2021年年度股东大会审议。
具体内容详见公司同日披露于上海证券交易所网站(www.sse.com.cn)的《海天瑞声2021年年度报告》、《海天瑞声2021年年度报告摘要》。
(六)审议通过了《关于<2021年度募集资金存放与使用情况的专项报告>的议案》;
经核查,监事会认为:公司2021年度募集资金的存放和使用符合中国证监会、上海证券交易所关于上市公司募集资金存放和使用的相关监管要求,准确、完整地反映了2021年公司募集资金的存放、使用与管理情况,募集资金实际使用情况与公司信息披露情况一致,符合《上市公司监管指引第2号——上市公司募集资金管理和使用的监管要求》《上海证券交易所科创板上市公司自律监管指引第1号——规范运作》,不存在募集资金存放和违规使用的情形,亦不存在变相改变募集资金用途、损害股东利益的情形。
我们同意公司编制的公司《2021年度募集资金存放与使用情况的专项报告》。
表决结果:同意3票,反对0票,弃权0票。
具体内容详见公司同日披露于上海证券交易所网站(www.sse.com.cn)的《海天瑞声关于2021年度募集资金存放与使用情况的专项报告》(公告编号:2022-018)。
(七)审议通过了《关于2022年度监事薪酬方案的议案》;
表决结果:同意3票,反对0票,弃权0票。
本议案尚需提交公司2021年年度股东大会审议。
具体内容详见公司同日披露于上海证券交易所网站(www.sse.com.cn)的《海天瑞声关于2022年度董事、监事及高级管理人员薪酬方案的公告》(公告编号:2022-019)。
(八)审议通过了《关于公司部分募投项目延期的议案》;
经核查,监事会认为,公司本次对部分募投项目延期是公司根据项目实施的实际情况做出的审慎决定。不属于募投项目的实质性变更以及变相改变募集资金用途的情形,不存在损害公司及股东利益的情形。决策和审批程序符合《上市公司监管指引第2号——上市公司募集资金管理和使用的监管要求》、《上海证券交易所科创板上市公司自律监管指引第1号——规范运作》等相关法律法规及《公司章程》、公司《募集资金管理制度》等规定。监事会同意公司本次部分募投项目延期的事项。
表决结果:同意3票,反对0票,弃权0票。
具体内容详见公司同日披露于上海证券交易所网站(www.sse.com.cn)的《海天瑞声关于公司部分募投项目延期的公告》(公告编号:2022-020)。
(九)审议通过了《关于<2022年第一季度报告>的议案》;
监事会认为公司《2022年第一季度报告》的编制和审议程序符合法律、法规和《公司章程》的各项规定;《2022年第一季度报告》的内容与格式符合中国证监会和上海证券交易所的各项规定,所包含的信息真实地反映出公司报告期内的经营情况和财务状况等事项;《2022年第一季度报告》编制过程中,未发现公司参与报告编制和审议的人员有违反保密规定的行为;监事会保证公司《2022年第一季度报告》所披露的信息真实、准确、完整,所载资料不存在任何虚假记载、误导性陈述或者重大遗漏并对其内容的真实性、准确性和完整性依法承担法律责任。
表决结果:同意3票;反对0票;弃权0票。
具体内容详见公司同日披露于上海证券交易所网站(www.sse.com.cn)《海天瑞声2022年第一季度报告》。
三、 备查文件
《北京海天瑞声科技股份有限公司第二届监事会第六次会议决议》。
特此公告。
北京海天瑞声科技股份有限公司
监事会
2022年4月29日
证券代码:688787 证券简称:海天瑞声
北京海天瑞声科技股份有限公司
2022年第一季度报告
本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、准确性和完整性依法承担法律责任。
重要内容提示
公司董事会、监事会及董事、监事、高级管理人员保证季度报告内容的真实、准确、完整,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。
公司负责人、主管会计工作负责人及会计机构负责人(会计主管人员)保证季度报告中财务报表信息的真实、准确、完整。
第一季度财务报表是否经审计
□是 √否
一、 主要财务数据
(一) 主要会计数据和财务指标
单位:元 币种:人民币
(二) 非经常性损益项目和金额
单位:元 币种:人民币
将《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益项目的情况说明
□适用 √不适用
(三) 主要会计数据、财务指标发生变动的情况、原因
√适用 □不适用
二、 股东信息
(一) 普通股股东总数和表决权恢复的优先股股东数量及前十名股东持股情况表
单位:股
三、 其他提醒事项
需提醒投资者关注的关于公司报告期经营情况的其他重要信息
□适用 √不适用
四、 季度财务报表
(一) 审计意见类型
□适用 √不适用
(二) 财务报表
合并资产负债表
2022年3月31日
编制单位:北京海天瑞声科技股份有限公司
单位:元 币种:人民币 审计类型:未经审计
公司负责人: 贺琳 主管会计工作负责人:吕思遥 会计机构负责人:杨韩
合并利润表
2022年1—3月
编制单位:北京海天瑞声科技股份有限公司
单位:元 币种:人民币 审计类型:未经审计
本期发生同一控制下企业合并的,被合并方在合并前实现的净利润为:0元,上期被合并方实现的净利润为:0 元。
公司负责人: 贺琳 主管会计工作负责人:吕思遥 会计机构负责人:杨韩
合并现金流量表
2022年1—3月
编制单位:北京海天瑞声科技股份有限公司
单位:元 币种:人民币 审计类型:未经审计
公司负责人: 贺琳 主管会计工作负责人:吕思遥 会计机构负责人:杨韩
2022年起首次执行新会计准则调整首次执行当年年初财务报表相关情况
□适用 √不适用
特此公告。
北京海天瑞声科技股份有限公司董事会
2022年4月28日
公司代码:688787 公司简称:海天瑞声
北京海天瑞声科技股份有限公司
2021年年度报告摘要
第一节 重要提示
1 本年度报告摘要来自年度报告全文,为全面了解本公司的经营成果、财务状况及未来发展规划,投资者应当到www.sse.com.cn网站仔细阅读年度报告全文。
2 重大风险提示
公司已在本报告中详细描述可能存在的风险,敬请查阅“第三节管理层讨论与分析”(之四)“风险因素”部分,请投资者注意投资风险。
3 本公司董事会、监事会及董事、监事、高级管理人员保证年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。
4 公司全体董事出席董事会会议。
5 信永中和会计师事务所(特殊普通合伙)为本公司出具了标准无保留意见的审计报告。
6 公司上市时未盈利且尚未实现盈利
□是 √否
7 董事会决议通过的本报告期利润分配预案或公积金转增股本预案
公司拟以实施权益分派股权登记日登记的总股本为基数分配利润,向全体股东每10股派发现金红利2.50元(含税)。截至2021年12月31日,公司总股本42,800,000股,以此合计拟派发现金红利10,700,000.00元(含税)。本年度现金分红总额占合并报表实现归属于上市公司股东净利润的33.85%;公司本次不进行资本公积转增股本,不送红股。
上述利润分配方案已经公司第二届董事会第七次会议审议通过,尚需提交公司2021年年度股东大会审议。
8 是否存在公司治理特殊安排等重要事项
□适用 √不适用
第二节 公司基本情况
1 公司简介
公司股票简况
√适用 □不适用
公司存托凭证简况
□适用 √不适用
联系人和联系方式
2 报告期公司主要业务简介
(一) 主要业务、主要产品或服务情况
1) 主要业务情况
公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。
算法、算力、数据是人工智能技术发展的三大要素,其中训练数据是算法发展和演进的“燃料”。在当前技术发展进程中,深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的训练支撑则是深度学习算法实现的基础。深度学习分为“训练”和“推断”两个环节:训练需要海量数据输入,训练出一个复杂的深度神经网络模型;推断指利用训练好的模型,去“推断”现实场景中的待判断数据,并得出各种结论。训练数据越多、越完整、质量越高,模型推断的结论越可靠。因此,要使算法模型实现从技术理论到应用实践的落地过程,就需要提供大量的训练数据,对算法模型加以训练。通常,从自然数据源简单收集取得的原料数据并不能直接用于深度学习算法的训练,必须经过专业化的采集、加工处理,形成相应的工程化数据集后才能供深度学习算法等算法、模型训练使用。
习近平总书记曾强调:“要构建以数据为关键要素的数字经济。”,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》对加快培育数据要素市场也作出了部署。数据是新的生产要素,是基础性资源和战略性资源。2021年3月,建设人工智能训练数据集、发展全数据产业链已被正式纳入国家十四五规划。训练数据已经成为国家重视、支持和推动的人工智能产业发展所必需的关键产品、关键材料。
自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据涵盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能家居、智能驾驶、智慧金融、智能安防等多种创新应用场景。
公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前公司客户累计数量695家,覆盖了科技互联网、社交、IoT、智能驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构。
图:公司产品服务矩阵示意
2) 主要产品及服务情况
2.1主要产品及服务按业务类型分类
公司研发、生产的训练数据覆盖了智能语音、计算机视觉及自然语言处理三大AI核心领域,广泛应用于算法模型的开发、训练、优化、应用场景拓展等环节。此外,公司还提供与训练数据相关的应用服务。
(1)智能语音
人工智能在语音领域的应用技术主要包括语音识别、语音合成等。
语音识别(Automatic Speech Recognition,ASR)是让机器能够“听懂”人类语音的技术,它能使机器自动将语音信号转换为对应的文本信息。
语音合成(Text to Speech,TTS)是让机器能够“说出”人类语音的技术,它使机器能将文字信息转化为流畅的语音“朗读”出来,相当于给机器安上了人工嘴巴。
以日常生活中的情景为例,语音输入法、即时通讯软件运用了语音识别技术将用户输入的语音实时转换为文字,实现了软件“听懂”语音并“听写”出文字的效果;而地图、导航软件则运用语音合成技术,实现了软件“发声说话”的效果,为用户提供即时语音导航。
公司通过设计(设计训练数据集结构、供发音人朗读录制的语料文本或对话场景、发音人分布、录音设备场景等)、采集(定义合适的发音人、选取录音设备及软件、组织发音人朗读录制音频)、加工(对音频文件进行切分、标注各类声音特征,形成带时间戳和特征标签的文本和标注文件等)、质检(对数据集进行质量检测,如音字一致性、标注准确率检查等)等训练数据集生产环节;或者针对客户提供的原料音频文件执行加工、质检工作,最终形成客户所需的智能语音训练数据集。
(2)计算机视觉
计算机视觉(Computer Vision,CV)是使机器具备“看”的功能的技术,它使得智能家居、手机、安防设备等机器能够代替人眼对目标进行识别、跟踪和测量等。
以日常生活中的情景为例,在汽车的自动驾驶功能中,计算机视觉技术使得汽车能够“看见”并识别行车过程中的各种行人、路况场景,为后续作出相应的反应奠定基础;在机场、车站安检中,计算机视觉技术使得人脸识别设备能够识别被检验人员是否为其出示的身份证件显示的人员。
公司通过设计训练数据集结构、采集(如定义合适的人脸、动作、场景作为采集对象,组织被采集人按照要求拍摄照片、录制视频,拍摄自动驾驶场景视频等)、加工(对图像、视频文件进行打点、分割标注等)、质检(对数据集进行质量检测,如检验图片、视频文件格式是否正确,检查光照环境、物体种类的数量是否达标,打点标框的准确率是否符合要求等);或者对客户提供的图像、视频文件执行加工、质检工作,最终形成客户所需的计算机视觉训练数据集。
(3)自然语言处理
自然语言处理(Natural Language Processing,NLP)是以机器能够像人一样理解语言意图的技术。
以日常生活中的情景为例,寄送快递时使用的“智能填写”功能即运用了自然语言处理技术,在输入框中填入整段联系信息,软件应用能够理解语义,并从中识别及提取“收件人”、“联系方式”、“地址信息”等所需信息,完成自动填写;智能客服、聊天机器人等人机交互程序也运用了自然语言处理技术,使得程序、机器能够读懂人类语言的真正意图,并相应做出反应、提供服务等。
公司通过设计训练数据集结构、采集(收集自然语言文本、对话等数据信息)、加工(对自然语言文本数据进行单词分割、词性标注、语义语法标注、情感属性标注等)、质检(对数据集进行质量检测,如检验文本、词性或者语义的标注结果是否准确等);或者对客户提供的自然语言文本执行加工、质检工作,最终形成客户所需的自然语言训练数据集。
(4)训练数据相关的应用服务
公司基于自身生产的训练数据提供算法模型相关的训练服务,运用训练数据研发能力助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高AI技术应用效果。
前述产品、服务均以公司生产的专业训练数据集为核心或基础。公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。
成品训练数据集主要由数据文档、说明文档、技术文档三部分构成。以智能语音训练数据集为例,成品训练数据集包含原始采集形成的音频文件、与音频文件对应的带有时间戳的标注文件,训练数据集相关的设计文档、训练数据集说明,发音词典,数据集参数信息文件等,图示如下:
图:训练数据集结构(智能语音)示例
2.2 主要产品或服务的终端应用场景
公司提供的高质量、大规模、结构化的训练数据,为算法模型的训练拓展提供了可靠的训练素材,助力AI技术实现实践应用及商业化落地,赋能AI技术与实体经济深度融合。公司提供的训练数据广泛应用于众多主流AI产品及终端应用的训练过程中,覆盖了个人助手、语音输入、智能家居、智能客服、机器人、语音导航、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧金融、智慧交通、智慧城市、机器翻译、智能问答、信息提取、情感分析、OCR识别等多种应用场景。
图:训练数据集服务的算法模型应用场景示意
(二) 主要经营模式
1) 盈利模式
与主要产品及服务类型对应,公司的盈利模式主要包括以下三类:
(1)定制服务:公司根据客户需求提供定制训练数据集并收取服务费。在此种模式下,公司仅享有服务费收入,不享有最终生成的训练数据的知识产权,不可将此类业务生产的训练数据向其他客户重复销售。
(2)标准化产品:公司开发自有知识产权的训练数据集产品,通过销售训练数据集产品的使用授权许可,获取让渡资产使用权收入。此类训练数据集一经开发完成,可多次销售并获取授权许可收入。
(3)训练数据相关的应用服务:公司基于生产的训练数据提供算法模型相关的模型拓展及训练服务,通常以软件授权或软硬件一体化形式交付算法模型拓展、开发成果,获取让渡资产使用权收入和技术服务收入,以及极少量硬件销售收入。
2) 生产或服务模式
(1)训练数据集生产模式
公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。
图:训练数据生产过程示意图
公司的训练数据生产过程主要包括四个环节:设计(训练数据集结构设计)、采集(获取原料数据)、加工(数据标注)及质检(各环节数据质量、加工质量检测)。
(2)训练数据相关的应用服务模式
公司基于其生产的训练数据提供算法模型相关训练服务,助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定行业和口音的专属算法模型,提高AI技术应用效果。
以某大型科技公司客户项目为例,客户研发了特定语音识别算法模型,需要根据算法模型的实际场景(如法院庭审场景)开发落地应用。公司承担了部分落地应用拓展相关的开发工作,围绕客户的算法模型和接口开发,最终协助客户算法模型实现多个麦克风收集庭审语音内容并实时转成文字记录入系统的功能。
3) 采购模式
按照采购的内容及主体划分,公司的采购包括:
1. 数据服务采购:公司在数据采集、加工环节中,向人力资源服务公司等采购的,非核心技术环节的原料数据采集、标注服务。
2. 岗位服务采购:主要针对临时性的、不设长期岗位的业务领域的外包采购,如保洁、临时招聘服务、少量实习生招聘等。
3. 其他采购:
(1)训练数据生产所需的资产,主要包括软、硬件设备及其他需求物品采购;
(2)日常运营所需的资产及物品,如办公用房、车辆、办公家具、计算机设备等;
(3)日常专项服务采购等,主要包括审计服务、会议服务、差旅服务等。
上述原料数据采集、加工环节所涉及的数据服务采购,为公司最主要的采购类别,由采购部负责;各部门岗位服务采购由人力资源部负责;其余日常运营相关的资产物品采购、专项服务采购等非业务采购由行政部负责。财务部负责参与采购供应商的遴选、监督与管理,并对采购费用进行核算及结算。
经过多年的发展,公司已经建设有完善的《供应商管理制度》、《采购管理制度》、《业务采购实施细则》、《岗位服务采购实施细则》等内部规范制度,设立有完善的采购流程和体系,并与主要的供应商形成了良好稳定的长期合作关系。
4) 销售模式
公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高品质的训练数据集及相关服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过直接拜访潜在客户、口碑传播、参与学术会议和行业展会、官方网站和自媒体展示等方式建立品牌知名度、与客户建立联系,后续再通过商务谈判、招投标等形式获取具体业务机会。
(三) 所处行业情况
1. 行业的发展阶段、基本特点、主要技术门槛
根据国家统计局《战略性新兴产业分类(2018)》,公司所从事的训练数据生产业务属于“新一代信息技术产业—新兴软件和新型信息技术服务—新型信息技术服务—信息处理和存储支持服务—数据加工处理服务”行业,是国家重点支持的“新一代信息技术领域”的战略性新兴产业。公司通过设计训练数据集结构、执行数据采集、加工处理过程,生产用于算法模型开发训练用途的专业数据集,并以软件形式向客户交付,所属行业为软件和信息技术服务业。
根据中国证监会颁布的《上市公司行业分类指引》(2012年修订),公司所属行业为“软件和信息技术服务业”,行业代码为“I65”。
1.1行业的发展阶段、基本特点
1) 训练数据作为AI算法发展和演进“燃料”的作用继续凸显
在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据早已成为算法模型发展和演进的“燃料”。算法模型从技术理论到应用实践的落地过程依赖于大量的训练数据,2012-2016年期间,人工智能行业不断优化算法增加深度神经网络层级,利用大量的数据集训练提高算法精准性,ImageNet数据集的超过1,400万张训练图片和1,000余种分类便在其中起到重要作用。2021年,全球人工智能和机器学习领域最权威的学者之一吴恩达教授提出二八定律:AI研究80%的工作应该放在数据准备上,确保数据质量是最重要的工作;业界如果更多地强调以数据为中心而不是以模型为中心,那么机器学习的发展会更快。
然而,从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练,必须经过专业化的采集、加工,形成相应的工程化训练数据集后才能供深度学习算法等训练使用。目前,应用有监督学习的算法对于训练数据的需求远大于现有的标注效率和投入预算,基础数据服务将持续释放其对于算法模型的基础支撑价值。
2) AI产业对训练数据服务的需求持续产生、规模继续扩大
AI产业对训练数据的需求主要来源于成熟算法模型的拓展性需求和新生算法模型的前瞻性需求。在成熟的拓展性需求方面,Mckinsey Global Institute的研究报告表明:
深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求。为充分发挥技术潜能,深度学习模型需要海量且涵盖图像、视频及语音在内等多种类型的训练数据进行模型训练。此外,人工智能技术要求算法模型根据潜在的应用场景变化而持续更新,因此,算法模型所使用的训练数据亦需要定期更新。具体而言,约1/3的算法模型每月至少更新一次,约1/4的算法模型每日至少更新一次,算法模型持续更新的特点将进一步拓展各领域训练数据的需求空间。
而在新生的前瞻性需求方面,随着人工智能商业化进程的演进,新兴应用场景如智能驾驶、智联网AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进AI技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流。
3) 全球和中国AI基础数据服务行业规模持续扩张
i. 全球和中国AI产业市场规模
经过多年的发展,人工智能技术已在人机交互、智能家居、智能驾驶、智慧金融、智能安防等多个领域实现技术落地,且应用场景愈来愈丰富,AI产业已进入全方位商业化的发展阶段。
根据国际数据公司(IDC)的数据,2021年,全球人工智能市场规模将达到885.7亿美元,预计2025年将达到2,218.7亿美元,年复合增长率达到26.2%。(下转D620版)
扫一扫,即可下载
扫一扫 加关注
扫一扫 加关注
喜欢文章
给文章打分
0/
版权所有证券日报网
京公网安备 11010202007567号京ICP备17054264号
证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。
证券日报社电话:010-83251700网站电话:010-83251800网站传真:010-83251801电子邮件:xmtzx@zqrb.net