一、基础概念
- AI(Artificial Intelligence):人工智能,让机器模拟人类智能行为。
- AGI(Artificial General Intelligence):通用人工智能,具备人类级别的通用智能。
- ML(Machine Learning):机器学习,让机器从数据中学习规律。
- DL(Deep Learning):深度学习,基于深度神经网络的机器学习。
- Data Mining:数据挖掘,从大量数据中发现模式、规律。
- Algorithm:算法,解决问题的计算步骤与逻辑。
- Model:模型,学习数据后得到的可预测 / 生成函数。
二、机器学习基础
- Dataset:数据集,训练 / 测试用的数据集合。
- Training:训练,用数据更新模型参数。
- Inference:推理,模型训练完后做预测 / 生成。
- Feature:特征,输入给模型的有效信息。
- Label:标签,监督学习中的目标输出。
- Supervised Learning:监督学习,有标签数据训练。
- Unsupervised Learning:无监督学习,无标签,自动找结构。
- Semi-supervised Learning:半监督学习。
- Reinforcement Learning(RL):强化学习,通过奖励 / 惩罚学习策略。
- Overfitting:过拟合,在训练集表现好,泛化差。
- Underfitting:欠拟合,模型太简单,没学到规律。
- Generalization:泛化能力,模型处理新数据的能力。
- Classification:分类,预测类别。
- Regression:回归,预测连续数值。
- Clustering:聚类,无监督分组。
三、深度学习 & 神经网络
- Neural Network:神经网络,模拟人脑结构的计算模型。
- Neuron/Unit:神经元,网络基本单元。
- Layer:层,输入层、隐藏层、输出层。
- Weight:权重,模型学习的参数。
- Bias:偏置,调整输出的偏移量。
- Activation Function:激活函数(ReLU、Sigmoid、Tanh)。
- Loss Function:损失函数,衡量预测误差。
- Optimizer:优化器,更新参数(SGD、Adam)。
- Backpropagation:反向传播,计算梯度更新权重。
- CNN(Convolutional Neural Network):卷积神经网络,用于图像。
- RNN(Recurrent Neural Network):循环神经网络,处理序列。
- LSTM/GRU:改进型 RNN,解决长序列遗忘问题。
- Transformer:当前大模型主流架构,基于自注意力。
- Attention:注意力机制,聚焦重要信息。
- Self-Attention:自注意力,Transformer 核心。
- Encoder-Decoder:编码 – 解码结构,常用于翻译、生成。
四、大模型 & LLM 术语
- LLM(Large Language Model):大语言模型。
- Foundation Model:基础模型,预训练后可适配多任务。
- Pre-training:预训练,在海量数据上初步训练。
- Fine-tuning:微调,在特定数据上继续训练。
- Parameter:参数,模型规模单位(B = 十亿)。
- Context Window:上下文窗口,能处理的文本长度。
- Prompt:提示词,给模型的输入指令。
- Prompt Engineering:提示词工程。
- Few-shot / One-shot / Zero-shot:小样本 / 单样本 / 零样本学习。
- Hallucination:幻觉,模型编造不存在事实。
- Temperature:温度系数,控制生成随机性。
- Token:词元,模型处理文字的最小单位。
- Embedding:向量 / 嵌入,把内容转为数值向量。
- RAG(Retrieval-Augmented Generation):检索增强生成。
五、AI Agent 智能体系
- AI Agent:智能体,能自主感知、规划、执行、反思的 AI。
- Skill:技能,Agent 可调用的功能模块(总结、翻译、生成等)。
- Tool:工具,外部能力(搜索、API、数据库、计算器)。
- Function Calling:函数调用,LLM 自主调用工具 / 技能的机制。
- Task Decomposition:任务拆解,把复杂任务拆成步骤。
- Planning:规划,Agent 制定执行步骤。
- Memory:记忆(短期 / 长期 / 上下文记忆)。
- Reflection:反思,自我检查、纠错、迭代。
- Action:动作,Agent 对外执行的操作。
- Observation:观测,获取环境 / 工具返回结果。
- Goal-oriented:目标驱动,以完成目标为导向。
- Multi-Agent:多智能体,多个 Agent 协作。
- Autonomous Agent:自主智能体,可无人干预运行。
六、MCP 模型控制平面
- MCP(Model Control Plane):模型控制平面,AI 系统调度中心。
- Model Routing:模型路由,自动选择最优模型。
- Orchestration:编排,调度 Agent、工具、流程。
- Gateway:网关,统一入口、鉴权、限流。
- Load Balance:负载均衡。
- Monitoring:监控,耗时、调用量、异常。
- Audit Log:审计日志。
- Policy Control:策略控制,权限、安全、合规。
- Quota Management:配额 / 成本管理。
七、自然语言处理 NLP
- NLP(Natural Language Processing):自然语言处理。
- NLU(Natural Language Understanding):自然语言理解。
- NLG(Natural Language Generation):自然语言生成。
- ASR(Automatic Speech Recognition):语音转文字。
- TTS(Text To Speech):文字转语音。
- OCR:光学字符识别,图片转文字。
- NER(Named Entity Recognition):命名实体识别。
- Sentiment Analysis:情感分析。
- Machine Translation:机器翻译。
- Summarization:摘要生成。
八、计算机视觉 & 多模态
- CV(Computer Vision):计算机视觉。
- Image Generation:图像生成。
- Diffusion Model:扩散模型,画图主流技术。
- Object Detection:目标检测。
- Segmentation:图像分割。
- Facial Recognition:人脸识别。
- Multi-Modal:多模态,同时处理文本、图像、音频、视频。
- AIGC(AI Generated Content):AI 生成内容。
九、AI 工程与部署
- Model Quantization:模型量化,变小、变快。
- Model Distillation:模型蒸馏,大模型教小模型。
- Pruning:模型剪枝,去掉冗余参数。
- Inference Engine:推理引擎。
- GPU/TPU:加速 AI 计算的芯片。
- Tensor:张量,深度学习基础数据结构。
- Pipeline:流水线,多步骤串联执行。
- Low Latency:低延迟。
- High Throughput:高吞吐。
十、安全 & 伦理
- Alignment:对齐,让 AI 符合人类意图。
- Bias:偏见,模型学到歧视性内容。
- Privacy:隐私,数据脱敏、联邦学习。
- Federated Learning:联邦学习,数据不出本地。
- Jailbreak:越狱,诱导 AI 违规输出。
- Safety Guardrail:安全护栏。
- Explainable AI(XAI):可解释 AI。

