AI大模型技术潜力分析报告

2022-12-29

报告概要:

AI大模型(Foundation Model)也称“人工智能预训练模型”,将海量数据导入具有几亿量级甚至十万亿量级参数的模型中,机器通过做类似“完形填空”等任务,深度学习数据中蕴含的特征、结构,最终被训练成具有逻辑推理和分析能力的人工智能。AI大模型也意味着通过更加先进的算法、整合尽可能多的数据、汇聚大量算力、集约化地训练而形成的模型。

 

AI大模型按照模型架构可以划分为单体模型和混合模型。单体模型是单一的巨量模型。混合模型是专家模型的一个集合,它是由多个小模型混合起来的,中间通过开关机制来工作。混合模型有比较多的子网络,参数会更大,学到的知识会更多,在细分领域的使用效果会更好。单体模型对算力、算法优化、数据分布、模型参数等方面要求更高,其模型精度也更高。

 

AI大模型将朝多模态融合方式演进,大模型和垂直领域小模型联动落地方向发展。单一模态的人工智能在自动驾驶、医疗医药、AIGC等领域的使用都存在很多局限性。多模态 AI 可以打破单一感官的局限导致的应用场景的狭窄。AI大模型并不是一招鲜吃遍天,小模型拥有较快的推理速度和较低的研发成本,以及更加轻量便捷。大小模型联动的学习方式可以实现在保持小模型较快推理速度的同时达到和大模型相当或接近的效果。大模型参数的竞赛如果不能在实际的落地场景中发挥价值,就会变成昙花一现的数值比拼。大模型虽然落地场景还不够成熟,但是在娱乐传媒、直播电商等To C领域,AI大模型已经在实践落地应用。大模型在医疗领域和工业领域的落地应用仍需探索和突破。