〓【球友会】分享IT计算机各类电子书,包括各类编程语言,人工智能,机器学习、深度学习以及各类大数据、算法等内容的电子书
天眼新知|知已方知未来人工智能产业再迎发展机遇期
天眼新知|知已方知未来人工智能产业再迎发展机遇期

天眼新知|知已方知未来人工智能产业再迎发展机遇期

前言:随着中国数字经济的深入发展,产业数字化进程不断加速,大数据在产业决策中的比重越来越高。天眼查数据研究院特此推出“天眼新知”专栏,以天眼查大数据为依托,梳理产业格局及发展脉络,解读产业领域最新动态和投融资风向,为各方决策提供参考。

人工智能,源于一篇绕口令式的科技论文《神经活动中内在思想的逻辑演算》、源于赫赫有名的“图灵测试”、源于20世纪50年代具备长远眼光的科技先贤们一次“不经意”的讨论。

人工智能,起始于对人类自身理解的深入挖掘,对人的意识、思维的信息过程的模拟。今时今日,人工智能不再是科幻电影中无法触及的概念,它已成为家喻户晓的“现实”,在减轻人类的体力负担和脑力负担方面已渐渐显示出优势,比如在极端天气预测等层面显露头角。

随着深度学习,大模型等关键技术的深入发展,以Chat-GPT爆发为新起点,人工智能将快速迈入下一个“未知”的阶段。

人工智能从标准的定义来讲,可参考《人工智能标准化白皮书(2018)》中所提。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

在大多人的眼中,人工智能是一位非常给力的助手,工具,可以实现处理工作过程的自动化,提升工作效率,比如执行与人类智能有关的智能行为,如判断、推理、证明、识别、感知、理解、通信、设计、思考、规划、学习和问题求解等思维活动。

但与之其工具属性,能力属性相比,人工智能更为重要的是一种思维,是用来描述模仿人类与其他人类思维相关联的“认知”功能的机器,如“学习”和“解决问题”。

人工智能产业在20世纪50年代提出后,限于当时的技术能力,多限于理论知识的讨论,而线年的AlexNet模型问世。

人工智能概念于1956年被提出,AI产业的第一轮爆发源自2012年,2012年AlexNet模型问世开启了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业的应用,带动了人工智能1.0时代的创新周期,AI+开始赋能各行各业,带动效率提升。但是,人工智能1.0时代面临着模型碎片化,AI泛化能力不足等问题。

2017年Google Brain团队提出Transformer架构,奠定了大模型领域的主流算法基础,从2018年开始大模型迅速流行,2018年谷歌团队的模型参数首次过亿,到2022年模型参数达到5400亿,模型参数呈现指数级增长,“预训练+微调”的大模型有效解决了1.0时代AI泛化能力不足的问题。新一代AI技术有望开始全新一轮的技术创新周期。

天眼查数据显示,截至目前,人工智能相关企业近267.4万余家,其中,2023年一季度新增注册企业17万余家,与2022年同期相比,上涨6.8%;

从地域分布来看,广东以39.9万余家位列区域首位;江苏、北京分列二、三位,分别拥有22.4万余家以及21.8万余家;

从成立时间来看,53.6%的相关企业成立于1-5年内,成立于1年以内的相关企业占比27.7%;

另据天眼查不完全统计,人工智能产业自2023年1月以来,融资事件合计发生143起,融资金额超800亿元。

人工智能的快速发展推动数据规模不断提升。据IDC测算,2025年全球数据规模将达到 163ZB,其中80%-90%是非结构化数据。数据服务进入深度定制化的阶段,百度、阿里巴巴、京东等公司根据不同场景和需求推出数据定制的服务;企业需求的数据集从通用简单场景向个性化复杂场景过渡,例如语音识别数据集从普通话向小语种、方言等场景发展,智能对话数据集从简答问答、控制等场景向应用场景、业务问答等方向发展。

各方积极探索建立高质量知识集,推动知识驱动的未来人工智能应用发展。知识集中包含语音、图像、文本等传统数据和定义、规则、逻辑关系等,是知识的数据化呈现,业界著名知识集有Wordnet、Hownet等。例如阿里巴巴联合香港理工大学基于服装设计知识开发FashionAI知识集,加速了AI在服装设计产业落地应用。

根据中国信通院《人工智能白皮书(2022年)》,超大规模预训练模型持续推动技术升级,继续朝着大规模、多模态方向发展。自2020年OpenAI推出GPT-3后,谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构也相继发力,陆续推出超大规模预训练模型,包括Switch Transformer、DALL·EMT-NLG、盘古、悟道2.0、紫东太初和M6等。当前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,增大模型和增加训练数据仍是短期内演进方向;跨模态预训练大模型逐渐普遍,如今已经能够处理文本、图像、语音三种模态数据,未来能够使用更多类型数据的预训练模型将会涌现。

轻量化深度学习技术显著提升计算效率。复杂的深度学习模型需要耗费大量的存储空间和计算资源,在端边等资源受限的情况下难以应用。轻量化深度学习成为解决这一难题的重要技术,具备低内存和低计算量优势,技术包括设计更加紧凑和高效的神经网络结构、对大模型“裁剪”掉部分模型结构,以及对网络参数进行量化从而减少计算量等。例如,紧凑模型的典型代表有谷歌提出的MobileNet和旷视提出ShufleNet等,百度推出的轻量化PaddleOCR模型规模减小至2.8Mb,在GitHub上开源后受到热捧“生成式人工智能”技术不断成熟,未来听、说、读、写等能力将有机结合。目前,“生成式人工智能”技术被广泛应用于智能写作、语音导航、代码生成、新闻播报、有声阅读、影像修复等领域,通过机器自动合成文本、视频、图像、语音等推动互联网数字内容生产的变革。听、说、读、写等能力的有机结合成为未来发展趋势。例如央视、新华社、光明网等均推出了数字人主播。

据天眼查知识产权不完全统计,人工智能相关的专利申请自2023年1月以来,已有1610余项,其中,发明专利占比超过7成。

人工智能算力应需求驱动不断突破,训练用和推断用的芯片仍在加速发展。一方面在模型训练阶段,根据Open AI数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。另一方面,由于推断的泛在性,推断用算力需求持续增长。与此同时,新的算力架构也在不断探索中,类脑芯片、存内计算、量子计算等备受关注。

训练芯片创新加速,推断芯片朝着专用定制化发展。基于GPU的训练芯片持续增多,面向GPU创新的企业开始发力,出现了摩尔线程、天数智芯、壁仞科技等一批专注GPU赛道的初创公司。基于ASIC等架构云端训练芯片能力提升显著,寒武纪的思元370、原科技的“邃思 2.0”以及百度的昆仑2等相对上一代产品均有3-4倍以上的算力提升。

专用定制的端侧推理芯片百花齐放,面向手机应用的智能芯片成为亮点。2021年1月,联发科推出了高端手机芯片 Dimensity 120。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注