人工智能大模型的主要类别包括:大语言模型、视觉大模型、多模态大模型以及基础科学大模型等。目前,大模型已在多个领域得到广泛应用,包括搜索引擎、智能体、相关垂直产业及基础科学等领域,推动了各行业的智能化发展。截至2025年6月底,中国在用算力中心机架总规模达1085万标准机架,智能算力规模达788百亿亿次/秒;已发布1509个大模型,在全球位居前列。人工智能大模型通常是指由人工神经网络构建的一类具有大量参数的人工智能模型。大模型通常通过自监督学习或半监督学习在大量数据上进行训练。最初,大模型主要指大语言模型(Large Language Models, LLM)。随着技术的发展,逐渐扩展出了视觉大模型、多模态大模型以及基础科学大模型等概念。大模型是一个新兴概念,截止目前并没有绝对权威的定义。因此,大模型所需要具有的最小参数规模也没有一个严格的标准。目前,大模型通常是指参数规模达到百亿、千亿甚至万亿的模型。此外,人们也习惯性的将经过大规模数据预训练(显著多于传统预训练模型所需要的训练数据)的数十亿参数级别的模型也可以称之为大模型,如LLaMA-2 7B等。
LLaMA(Large Language Model Meta AI)是由Meta推出的开源大模型。Meta将LLaMA开源,极大地推动了全球AI大模型技术的研究和发展,催生了无数基于LLaMA的创新应用和定制化模型。通过开放模型权重,Meta构建了一个庞大而活跃的开发者社区,共同探索AI大模型的未来。