雷石产业观察：机器学习与大模型，人工智能赛道上的明珠|行业新闻|兰州顺源模型设计制作有限公司

雷石产业观察：机器学习与大模型，人工智能赛道上的明珠

来源：凤凰网财经作者：中商网更新于：2022/10/26 9:35:04 阅读：

如今，人工智能已经深入到社会的方方面面，渗透到每个人的日常生活，从自动驾驶到人脸识别，再到机器翻译。

然而，大家似乎只知人工智能，却少有人了解机器学习。其实，人工智能得到广泛应用，其底层基石正是机器学习。

绝大多数涉足人工智能的公司，无论是提供解决方案的科技公司，还是应用人工智能的行业用户，都会把机器学习作为其主要业务领域之一。

未来，随着人工智能的社会普及和行业深入，机器学习在产业界的重要性会得到进一步加强。在新兴的大模型领域，会有机会涌现出一批科技创新企业，成为人工智能赛道上真正的明珠。

机器学习是人工智能的基石

机器学习就是让计算机来模拟人类的学习行为，是人工智能的核心，是使计算机具有智能的根本途径。

机器学习具有两个典型的过程，一是训练，二是推理。这两个过程，都需要大量的算力作为保障，尤其是“训练”，不仅需要庞大的AI算力，往往还需要海量的数据。

机器学习的训练和推理，相当于人类的学习和工作。其中训练的过程尤其重要，就像人类要通过16-20年的漫长学习才能具备工作能力一样。训练的结果则是“模型”，类似于人类的知识。而推理的过程则是把模型(知识)，应用到实践工作中。

以自动驾驶为例。自动驾驶汽车上都安装了很多摄像头和传感器，用于探测路况。根据采集到的视频等数据，做出判断之后，决定下一步操作：转弯、并线、加速、减速等。这个过程就是推理，推理依赖的不仅是实时采集到的数据，更需要使用训练产生的模型。

训练的工作是在推理之前完成的。自动驾驶公司要进行数十万，甚至上百万公里的实际道路学习。对于测试中获得的图片和影像数据，通过人工等标注方式，告诉计算机什么是路人、什么是车道、什么是限速牌等等。计算机需要通过各种算法对数据进行分析，最后形成了模型，被装载到自动驾驶汽车上。

目前，机器学习被普遍采用的部署方式是：在云侧进行训练，因为需要大量的数据和算力;在边侧或者端侧进行推理，因为需要低时延和贴近应用。

机器学习的不同实现方式

当前，人工智能的主要处理对象是自然语言、图片、视频等，从这些数据中提取信息，进行处理分析，并加以理解，最终落地实际应用。机器学习的对象，也正是这些数据。如何从数据中获得知识，一直是科学界和产业界共同努力的方向。

在机器学习的训练过程中，算法至关重要，有决策树算法、朴素贝叶斯算法、随机森林算法、神经网络算法等等。但这些是科学家们需要努力攻关的，对于产业界而言，更为关注的是机器学习的实现方法。

按照训练(学习)方式的不同，机器学习通常可以分为监督学习、非监督学习和强化学习三大类。

监督学习，也被称为有导师的学习，如同老师教学生一样。在监督学习过程中，训练的每个示例都是要有标注的，就像上面提到的自动驾驶实际道路学习一样。监督学习依赖于高质量的数据，包括数据的质和量。质——必须准确，否则计算机就会学到错误的知识，导致推理出错;量——要覆盖到实际道路的所有情况，否则计算机就不知道该如何应对该情况。

非监督学习，即没有导师的学习，训练的数据不需要做标记，减少了人工做数据标识的工作量，而且能够覆盖人想象不到的情况。比如在AI工业质检中，可能的产品缺陷种类太多，人工很难穷举。非监督学习的实现难度更大，是机器学习的未来发展方向。

强化学习也叫增强学习，其训练过程不需要数据，而是通过特定环境中一系列行为的后果进行学习。强化学习输入的是环境反馈，即奖惩信号，类似于马戏团的动物训练过程。

此外，深度学习和联邦学习，也是机器学习正在快速兴起的两个分支。前者已经在AlphaGo上得到成功实践，后者则由于数据安全的要求而随着隐私计算得到应用。

迅速壮大的行业应用市场

市场研究公司IDC的预测数据显示，未来五年，全球人工智能IT投资规模的年复合增长率约为26.5%;到2026年，中国市场的规模有望达到266.9亿美元，全球占比约为8.9%，位列全球第二。

在这个快速增长的市场中，机器学习算力、机器学习开发平台、机器学习行业应用，将占据非常重要的组成部分。

在算力层面，除了专业的芯片公司，很多科技公司也在开发用于机器学习的芯片。比如，华为的昇腾芯片、AWS的训练芯片Trainium和推理芯片Inferentia、阿里云的推理芯片含光800等。

人工智能应用要想落地，还必须要有机器学习开发平台的支持，这是一个面向开发者、数据科学家、业务分析师的PaaS平台。目前，机器学习开发平台的提供商大致有两类，一类是云服务商，比如AWS的SageMaker、华为云的ModelArts等;另外一类是专业的人工智能公司，比如第四范式的Sage Platform、九章云极的DataCanvas等。

在应用层面，随着越来越多的企业开始数字化转型以及智能化升级，机器学习在行业市场得到了广泛应用，为人工智能赋能产业提供助力。除了人脸识别、自动驾驶、机器翻译等消费级应用，工业质检、新药开发、金融风险评估等企业级应用，也越来越多。

制造行业的AI视觉质量检测，是机器学习最成熟的应用场景之一。IDC预计，到2025年中国工业AI质检整体市场将达到62亿元，年均复合增长率为28.5%。中科创达在Amazon SageMaker之上构建了创达智慧视觉检测系统，帮助某面板制造企业取代人工质检，检测时间从3.5秒降低到0.1秒，准确率从85%提升到99%。

另外比如蛋白质结构研究，是生命科学领域的基础问题。深势科技与阿里云机器学习 PAI 团队合作，通过全新的蛋白质结构预测推理加速方案FoldAcc，结合深势Uni-Fold最新模型代码和参数，将单次预测能支持的最大氨基酸序列长度提升至6.6k，覆盖99.992%已知的蛋白序列。

无论是机器学习的行业应用还是通用应用，未来都会有更多的科技创新企业涉足其中。这也对其提出了更高的要求——既要懂前沿的AI科技，也要有深度的行业洞察，两者缺一不可。

正在快速兴起的大模型市场

从机器学习的实现方式可以看出，“模型”是机器学习的关键环节，它是“训练”的结果，也是“推理”的基础。要得到一个好的模型，需要海量的高品质数据，也需要海量的算力支持，可谓成本高昂。

一方面是模型训练的投资巨大，另一方面是每个行业应用都是差异化的，这就导致需要重复进行大量的模型训练，使得机器学习的成本居高不下，阻碍了行业应用的普及。

大模型的概念，由此而快速兴起。国内一些头部科技公司亦涉足其中，比如华为的盘古和百度的飞桨等。

大模型更准确的叫法应该是基础模型，是大规模预训练的结果，因为有着多达千亿甚至上万亿的参数，而被称为大模型或者超大模型。

大模型被称为规模化生产高性能机器学习模型的生产线：通过提炼各大领域的共性来进行大规模预训练，生产出标准化的基础大模型;然后再根据各个行业不同的共性需求，训练出行业预训练大模型;最后根据具体应用场景的需求，通过少量定制开发形成推理模型，从而落地应用。

这样的逐级训练大模型的方式，可以最大程度降低全社会在机器学习成本上的投入，实现AI应用的规模化落地。仍以自动驾驶为例，如果每个整车厂都要从头开始做模型训练，无疑是很大的浪费，毕竟大家面临的道路情况是一样的。如果有专业第三方公司来训练和提供标准化的大模型，就可以避免重复投入。这样，既降低成本又能提升性能，使自动驾驶更快落地。

大模型市场才刚刚起步，未来发展空间很大，当然变数也很大。训练好大模型和应用好大模型，同样重要。在这两个环节上，未来或许会涌现出一批创业企业，尤其是专注于生产行业大模型的科技创新企业。