写代码、编剧本、解难题,甚至还能进行绘画创作……自2022年底问世以来,这款由OpenAI推出的聊天机器人程序——ChatGPT迅速引起全球范围的高度关注,它的爆火掀起了新一轮生成式人工智能(AIGC)热潮。和以往类似的聊天机器人相比,ChatGPT的智能化程度大幅提升,帮助人们更轻松地与计算机进行交互和沟通。机器翻译,摘要截取,以及情感分析等功能加成,使ChatGPT具备像真人一般的语言理解能力,甚至在效率上强于人类。
ChatGPT的诞生无疑是AI时代的重要里程碑,也预示着新一轮人工智能技术革命正在加速来袭。
01
“跨越山和大海”的人工智能
人工智能可以定义为利用计算机模拟人类思维的过程,是用来描述模仿人类与其他人类思维相关联的“认知”功能的机器,如“学习”和“解决问题”。从概念提出到掀起热潮,人工智能已经探索了六十余载的漫漫长路。
人工智能1.0时代,是从0到1的技术孕育阶段。为解决人工神经网络“结构复杂”问题,1956年,以麦卡锡、马文·明斯基等为代表的从事数学、心理学、计算机科学、信息论和神经学研究的年轻学者们集聚在达特茅斯学院,召开了人类历史上第一次人工智能研讨会,人工智能概念被正式提出,这一年也被视为人工智能的元年。
由于AI技术系统和涉及的子系统非常复杂,只有量的积累到一定程度才能实现质的飞跃。2012年,AI产业终于开启第一轮爆发——AlexNet模型问世开启了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业的应用,激发了人工智能1.0时代的创新周期,“AI”+开始赋能各行各业,带动效率提升。但是,人工智能1.0时代面临着模型碎片化,AI泛化能力不足等问题。
当前,人工智能已经迈入2.0时代,开启从1到10的技术创新周期。2017年Google Brain团队提出Transformer架构,奠定了大模型领域的主流算法基础,从2018年开始大模型迅速流行,2018年谷歌团队的模型参数首次过亿,到2022年模型参数达到5400亿,模型参数呈现指数级增长,“预训练+微调”的大模型有效解决了1.0时代AI泛化能力不足的问题。新一代AI技术有望开始全新一轮的技术创新周期。
近年来,受益于技术的加速突破,我国人工智能行业的发展正在驶入快车道,相关企业注册量逐年上升。天眼查数据显示,截至目前,人工智能相关企业近267.4万余家,其中,2023年一季度新增注册企业17万余家,与2022年同期相比,上涨6.8%;从地域分布来看,广东以39.9万余家位列区域首位;江苏、北京分列二、三位,分别拥有22.4万余家以及21.8万余家;从成立时间来看,53.6%的相关企业成立于1-5年内,成立于1年以内的相关企业占比27.7%;另据天眼查不完全统计,人工智能产业自2023年1月以来,融资事件合计发生143起,融资金额超800亿元。
0
2
市场需求大增!小众“数据标注”逐浪AIGC
人工智能是一门多学科的复杂性科学与产业,需要多个子产业共同努力,合力完成产业发展。而数据、算法、算力作为最核心的三个相关子产业,其发展程度被视为人工智能产业的“风向标”。
作为将人类智能转化为机器智能的“原材料”,数据在业内被称为“新的石油”,是实现人工智能技术与产业结合能力的必要条件。值得注意的是,目前市场上90%以上的数据是非结构化数据,被有效利用的不足10%,对于这些非结构化的数据只有经过标注处理才能激活其价值。如今,AIGC的东风进一步拉动了市场对于数据标注处理的需求。
据天眼查不完全统计,2018年至2020年是数据标注企业注册数量大幅提升的3年,分别新增26、21、21家。从地域分布来看,广东以25家位列区域首位;河南、山东分列二、三位,分别是12家和9家。自2023年1月以来,数据标注有关的专利申请已有34项,均属于发明专利。如今,这类工作量极大、过程极其枯燥且耗时的手动数据标记过程,已经成为AI经济体系中的重要组成部分。
算法之于AI就像是烹饪所采用的“方法”,使之可以根据数据模型和算法模型进行自主学习和自我优化,以实现人工智能的目的。自2020年OpenAI推出GPT-3后,谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构也相继发力,陆续推出超大规模预训练模型,当前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,增大模型和增加训练数据仍是短期内演进方向;跨模态预训练大模型逐渐普遍,如今已经能够处理文本、图像、语音三种模态数据,未来能够使用更多类型数据的预训练模型将会涌现。
天眼查数据显示,2022年新增人工智能算法注册企业3.6万家,较去年增加37%,从地域分布来看,广东以2.6万家位列区域首位;福建和浙江分列二、三位。
算力之于AI就像是烹饪所需的“柴火”。从发展趋势来看,AI时代所需要的算力更多的是“智能算力”、是新算力。
当前,基于GPU的训练芯片持续增多,面向GPU创新的企业开始发力,出现了摩尔线程、天数智芯、壁仞科技等一批专注GPU赛道的初创公司。基于ASIC等架构云端训练芯片能力提升显著,寒武纪的思元370、原科技的“邃思2.0”以及百度的昆仑2等相对上一代产品均有3-4倍以上的算力提升。
天眼查数据显示,2013年新增人工智能算力注册企业7128家,2022年为11.3万家,数量增加了近15倍。从地域分布来看,广东以17.1万家位列区域首位;福建和江苏分列二、三位。另据天眼查不完全统计,人工智能算力产业在近两年分别发生456和418项融资事件,较2020年的296项有大幅提升。
03
顺应变革大周期,与AI共舞
近年来,国家推出多项政策,保障我国人工智能产业长期发展。数据要素层面,十四届全国人大会议提出成立国家数据局、重组科学技术部等有力举措。国家数据局的成立有望加速数据要素市场化。自主创新层面,重组科学技术部、健全新型举国体制也有利于推动我国科技自主创新发展。
以AIGC为契机的变革改变了内容生产的方式,从内容-交互-流程,实现了内容创作过程中大量重复性工作的“工程化”处理,这也引发人们对于工作岗位面临被机器取代的担忧。天眼查研究院认为,机器学习、深度学习、大模型等让人望而却步的概念不过是机器理解世界的范式,AI的进化不会停止,只会加快步伐。任何时候,AI对齐的追求是使得人工智能系统成为有益的工具,学会利用这一工具,释放更多人力在创新思考等更高级的工作上才是“拥抱变化”的关键。