数据标注行业素有“人工智能基石”之称,迎来了政策支持。
今天,国家发改委等四个部门发布了《关于促进数据标注产业高质量发展的实施意见》(以下简称《意见》)。其中,到2027年,数据标注产业的专业化、智能化、科技创新能力明显提高,产业规模大幅上升,年均复合增长率超过20%。
本意见强调,培育多家领先的数据标签企业,鼓励资源整合和并购重组,促进数据标签企业的规模、标准化和密集发展。支持和鼓励科技创新数据标签企业承担基础研究、技术研究、产业应用等关键任务,提高产业链协调创新水平。
数据标记,又称数据校准、数据注释,是指对文本、图像、语音、视频等标记数据进行分类、整理、编辑、纠错、标记和注释,为机器学习和人工智能算法提供培训样本。
由于数据的质量和数量直接影响到大型模型的智能水平,数据标记也被视为人工智能的基石。在人工智能应用需求快速增长的背景下,对数据标记的智能要求也在上升。例如,在关键技术研究方面,本意见列出了数据标记领域的三项关键技术。
跨领域跨模态语义对齐:通过设计模型,可以在公共表达空间中表达来自不同领域和模式的输入。
4D标注:传统的 3D 在标记的基础上,增加了时间维度的标记方法。例如,在自动驾驶领域,用于标记车辆、行人、交通标志和其他物体在不同时间的位置和运动状态,以帮助自动驾驶系统了解道路场景的动态变化。
大型模型标记:对大型人工智能模型进行数据标记、注释等处理的过程。
如今,从自动驾驶到智能助手,几乎所有领域都需要大量的数据培训来准确判断人工智能模型的构建。在挖掘数据标记需求方面,《意见》指出,要加强企业数据的开发利用,围绕医疗卫生、人力资源、数字贸易、自动驾驶、低空经济等场景,以业务创新拉动数据标记需求。
东北证券今日研究报告指出,在海外大厂商和国内厂商的推动下,以豆包、腾讯、360为代表的国内AI应用将迎来大爆发。建议关注上游数据处理的相关机会。
据《科技创新板日报》不完全统计,A股上市公司有数据标注:
(来源金融界)市场观察所刊载信息,来源于网络,并不代表本媒体观点。本文所涉及的信息.数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。本文仅供读者参考,任何人不得将本文用于非法用途,由此产生的法律后果由使用者自负。投诉举报请联系邮箱:News_Jubao@163.com
聚焦商业经济报告和前瞻商业趋势分析,市场观察非新闻媒体不提供互联网新闻服务;