AI词典｜30条AI术语，全网最易懂版！

2025-05-07 13:40:40 来源：本站原创

人工智能技术正在改变各行各业，但很多技术概念却让人云里雾里。本文通过“定义+案例”的方式解读AI领域的30条常见术语，覆盖基础理念、训练技术、应用交互等内容，帮助从业者及技术爱好者快速掌握技术脉络。

AI词典1.jpg

基础理念

1.人工智能

(AI-Artificial Intelligence)

定义：通过计算机系统模拟人类智能行为的技术，涵盖学习、推理、感知、决策等能力。目标是让机器能完成需要人类智慧的任务。

例如：智能音箱能够理解“播放周杰伦的歌曲”的指令并执行，这背后结合了语音识别（感知）和意图理解（推理）这两种人工智能技术。

2.机器学习

(ML-Machine Learning)

定义：通过算法让计算机从数据中自动学习规律，并用于预测或决策的技术。核心是让机器具备“从经验中改进”的能力，而非依赖固定编程规则。

举例：在线购物平台利用机器学习算法根据浏览历史推荐商品，调整推荐以符合用户偏好。

3.深度学习

(DL-Deep Learning)

定义：基于多层神经网络的机器学习方法，能自动提取数据的多层次特征。擅长处理图像、语音等复杂非结构化数据。

举例：手机相册自动识别人脸并分类：通过多层神经网络先识别边缘→五官→整体面部特征，最终确定人物身份。

4.神经网络

(Neural Network)

定义：模仿生物神经网络结构的计算模型，由大量互连的“神经元”分层组成，通过调整连接权重实现信息处理。

示例：在手写数字识别任务中，输入层负责接收像素数据，隐藏层进行笔画特征的提取，而输出层则确定数字属于0到9中的哪一个。

5.自然语言处理

(NLP-Natural Language Processing)

定义：让计算机理解、生成人类语言的技术，涵盖语义分析、机器翻译等领域。

举例：在智能客服解答“如何重置密码”的问题时，首先需要将语音转换为文字，然后理解询问的含义，最终形成回答的文本。

6.计算机视觉

(CV-Computer Vision)

定义：使计算机能够“看懂”图像和视频的技术，包括物体检测、图像分类、人脸识别等应用。

举例：在超市自助结账机中，摄像头通过识别商品条码，匹配数据库中的信息，显示价格；汽车零部件厂商的CV系统检测产品缺陷。

7.大语言模型

(LLM-Large Language Model)

定义：基于海量文本数据训练的深度学习模型，能理解、生成人类语言，完成问答、写作等任务。

举例：在回答问题的过程中，DeepSeek会深入解析文本的含义，并利用其在训练过程中习得的语言规则，来构建一个逻辑连贯的答复。

8.Transformer架构

(Transformer Architecture)

定义：基于注意力机制构建的深度学习模型架构，擅长处理序列数据（如文本），通过并行计算大幅提升训练效率。

举例：在将英文句子翻译成中文时，谷歌翻译模型会同时考虑“bank”在不同语境下的意义（如银行/河岸），从而挑选出恰当的翻译。

9.生成式AI

(GenAI-Generative AI)

定义：能够创造新内容（文本、图像、视频等）的人工智能系统，通过理解数据模式生成符合人类需求的原创性输出。

举例：用AI生成营销文案时，输入产品关键词即可生成广告语、社交媒体推文。

10.多模态

(Multimodal)

定义：同时处理和理解多种类型数据（文本、图像、语音等）的技术，实现跨媒介的信息融合与推理。

举例：智能客服在分析了用户所发文字“这件衣服质量如何”以及产品图片后，综合提供了材质说明和洗涤建议。

11.知识图谱

(KG-Knowledge Graph)

定义：以图结构组织知识的数据库，用节点表示实体，边表示关系，支持语义搜索和智能推理。

示例：在电子商务平台上，用户在购买手机时常常也会看到推荐耳机，这是因为知识图谱中存在“手机-配件-耳机”的连接关系。

12.向量化/嵌入技术

(Embedding)

定义：将文字、图像等数据转换为数值向量的技术，使计算机能够通过数学运算处理语义信息。

举例：“国王”-“男性”+“女性”=“女王”的向量运算，反映词语间的语义关系。

13.智能体

(Agent)

定义：能感知环境、自主决策并执行动作的AI程序，常应用于机器人、游戏AI等场景。

举例：自动驾驶汽车：通过摄像头（感知）识别行人→计算路径（决策）→控制方向盘（执行）完成避让。

14.通用人工智能

(AGI-Artificial General Intelligence)

定义：具备与人类相当的全领域认知能力的人工智能，能灵活应对各种未知任务，目前尚未实现。

举例：在科幻影片里的机器人，不仅能够识别病症，还能编写诗歌，具备多种才能。

训练技术

15.监督学习

(SL-Supervised Learning)

定义：使用带标签数据训练的机器学习方法,模型通过对比预测结果与标准答案调整参数。

举例：在训练模型识别垃圾邮件时，提供大量已标记的“正常邮件”与“垃圾邮件”样本，以便模型学习区分它们的特征。

类比：就像学生使用带有答案的习题集，每解答一题后便与正确答案(标签)进行对照，通过分析错误(损失计算)来防止重复犯错。

16.预训练

(Pre-Training)

定义：在大规模通用数据集上进行的初步训练，使模型获得基础特征提取能力，为后续任务提供初始参数。

举例：BERT模型通过完形填空任务预训练，学习词语上下文关系，之后可用于问答、分类等下游任务。

类比：如同学生广泛阅读百科全书（进行预训练），构建起知识体系，随后专注于特定领域（进行微调）。

17.微调

(FT-Fine-Tuning)

定义：在预训练模型基础上，用特定领域数据继续训练以适配新任务的过程，通常只调整部分网络层参数。

举例：法律文本分类：在通用语言模型基础上，用法律文书数据集微调预训练模型，提升专业术语理解能力。

类比：像定制西装时基于标准版型（预训练模型），根据个人身材数据（领域数据）调整袖长、腰围等细节（参数微调）。

18.数据增强

(DA-Data Augmentation)

定义：通过变换原始数据生成新样本的技术，增加数据多样性，提升模型泛化能力。

举例：图像分类任务中，对猫的图片进行旋转、裁剪、调整亮度等操作，生成更多训练样本。

类比：像用滤镜编辑照片，同一张风景照通过不同滤镜（增强手段）生成晨雾、晚霞、阴天等版本。

19.知识蒸馏

(KD-Knowledge Distillation)

定义：将大型模型（教师模型）的知识迁移到小型模型（学生模型）的技术，通过软化输出概率传递暗知识。

举例：将BERT的知识蒸馏到TinyBERT，教师模型不仅传递预测结果（苹果是水果），还传递“苹果与梨相似度70%”的软标签。

类比：像导师带学生，教授（大模型）不仅传授标准答案（硬标签），还讲解解题思路（类间关系），帮助学生（小模型）举一反三。

20.模型压缩

(MC-Model Compression)

定义：通过剪枝（移除冗余参数）、量化（降低数值精度）、知识蒸馏（小模型模仿大模型）等技术，减小模型体积和计算量，使其更适合在移动端或边缘设备部署。

举例：将手机语音助手模型从500MB压缩到50MB，在保持90%准确率的同时，耗电量降低60%。

类比：像整理行李，通过丢弃不必要的服饰（剪枝）、利用压缩袋缩小体积（量化）、挑选必需品（蒸馏），使行李（模型）轻巧又实用。

21.检索增强生成

(RAG-Retrieval-Augmented Generation)

定义：结合实时检索外部知识库与生成模型的技术，解决大模型事实性错误与信息滞后问题，提升生成内容的准确性。

举例：智能客服回答“最新退换货政策”时，先检索公司知识库获取最新条款，再生成回答文本。

类比：律师办案时，先查阅最新法典（知识检索），再结合案情（用户问题）撰写法律文书（生成回答）。

应用交互

22.多轮对话

(MTD-Multi-Turn Dialogue)

定义：通过对话状态追踪（DST）技术维护上下文，支持超过3轮以上的连贯交互，实现类人对话体验。

示例：用户：杭州有哪些好玩的地方？ →系统：可以去西湖、灵隐寺看看。 → 用户再问：哪个地方更适合带小孩去呢？ → 系统：西湖有游船和博物馆，非常适合亲子游。

比较：就像和老朋友聊天，每次对话都流畅地延续上一次的话题，就像“你之前提到的那家餐厅”→“没错，就是那家美味的本帮小馆”的顺畅对话。

23.意图识别

(IR-Intent Recognition)

定义：将自然语言转化为预定义意图标签（如“查询天气”“订餐”）的技术，是对话系统的核心模块。

举例：用户说“太热了”，系统识别为“调节温度”意图，触发空调降温指令。

类比：像餐厅服务员，听到“来点解渴的”立刻理解需要推荐饮品（意图），而非字面要求“找水解渴”。

24.语义理解

(SU-Semantic Understanding)

定义：通过分析用户输入（如文字或语音）判断其真实需求的技术，是对话系统的核心能力。

举例：对智能音箱说“明天会下雨吗”系统识别出“查询天气”意图并调用天气API。

类比：像餐厅服务员通过顾客的“来份牛排”快速理解对方需要点餐。

25.提示词工程

(PE-Prompt Engineering)

定义：通过结构化指令设计、上下文示例、角色模拟等方法，精确引导大模型输出的系统性技术，类似“与机器沟通的语言艺术”。

举例：想让AI写招聘启事，用“用互联网行业术语撰写Java工程师招聘，要求3年经验，薪资面议”比“写个招聘”更有效。

类比：像使用智能咖啡机时，选择“中杯/热/双份浓缩”比只说“来杯咖啡”更能得到想要的口味。

26.多模态交互

(MMI-Multimodal Interaction)

定义：支持同时使用语音、手势、图像等多种方式进行人机交互的技术，提升交互自然度。

举例：智能厨房中，用户说“调大火力”同时用手指顺时针划圈，系统综合理解后调整灶台火焰。

类比：像与朋友对话,边说“这本书很有趣”边用手指书中插图（多模态），比单纯语言描述更易理解。

其它

27.模型参数量

(MP-Model Parameters)

定义：模型中可调整的权重总数，通常与模型复杂度正相关。

举例：GPT-4有1.76万亿参数，手机端小模型可能只有1亿参数。

类比：图书馆藏书量，书籍越多（参数多）能解答的问题越广泛，但查找信息也更耗时耗能。

28.准确率/召回率/F1分数

(Accuracy/Recall/F1 - Score)

定义：准确率指的是正确预测占全部预测的比例（查得准）；召回率指的是正确识别出的正例占全部正例的比例（查得全）；F1分数指两者平衡的综合指标。

举例：癌症筛查系统：准确率98%：100次诊断98次正确；召回率95%：20名患者中检出19人；F1=96.4%：综合评估指标。

类比：渔夫捕鱼，准确率=捞到的鱼中目标鱼种占比；召回率=所有目标鱼种被捕获的比例；F1=评价综合捕捞效率。

29.工具调用

(TC-Tool Calling)

定义：AI系统通过API接口调用外部工具或服务的能力,扩展模型功能边界,实现复杂任务处理。

举例：智能助手收到“订明早8点闹钟”指令后,调用手机系统API设置闹钟,而非仅生成文本回复。

类比：像全能秘书，接到“安排会议”要求后,实际操作日历软件(工具调用),而非只是口头应答“好的”。

30.思维链

(CoT-Chain of Thought)

定义：要求人工智能在解决复杂问题时，显式展示推理过程中的每个逻辑步骤，如同人类逐步演算草稿，以提升可验证性与可解释性。

举例：面对问题“商品原价580元，打8折后满400减50，最终多少钱?”

分步输出：“首先计算打折后的价格：580乘以0.8等于464元；其次，确认是否满足满减条件：464大于400，因此可以减免50元。最终答案：464元减去50元等于414元。”

类比：像按照指南一步步组装家具——“拆开包装-安装桌腿-固定面板-旋紧螺丝”(分步推理)，相较于直接查看成品图(直接出结果)，更为稳妥可靠。

上一篇：
AI浪潮下，低代码如何发挥其价值？以制造业数字化为例
下一篇：
别被 “智能神话” 误导！真正让工厂增效的 MES 该这样选