AI词典|30条AI术语,全网最易懂版!
人工智能技术正在改变各行各业,但很多技术概念却让人云里雾里。本文通过“定义+案例”的方式解读AI领域的30条常见术语,覆盖基础理念、训练技术、应用交互等内容,帮助从业者及技术爱好者快速掌握技术脉络。
基础理念
1.人工智能
(AI-Artificial Intelligence)
定义:通过计算机系统模拟人类智能行为的技术,涵盖学习、推理、感知、决策等能力。目标是让机器能完成需要人类智慧的任务。
例如:智能音箱能够理解“播放周杰伦的歌曲”的指令并执行,这背后结合了语音识别(感知)和意图理解(推理)这两种人工智能技术。
2.机器学习
(ML-Machine Learning)
定义:通过算法让计算机从数据中自动学习规律,并用于预测或决策的技术。核心是让机器具备“从经验中改进”的能力,而非依赖固定编程规则。
举例:在线购物平台利用机器学习算法根据浏览历史推荐商品,调整推荐以符合用户偏好。
3.深度学习
(DL-Deep Learning)
定义:基于多层神经网络的机器学习方法,能自动提取数据的多层次特征。擅长处理图像、语音等复杂非结构化数据。
举例:手机相册自动识别人脸并分类:通过多层神经网络先识别边缘→五官→整体面部特征,最终确定人物身份。
4.神经网络
(Neural Network)
定义:模仿生物神经网络结构的计算模型,由大量互连的“神经元”分层组成,通过调整连接权重实现信息处理。
示例:在手写数字识别任务中,输入层负责接收像素数据,隐藏层进行笔画特征的提取,而输出层则确定数字属于0到9中的哪一个。
5.自然语言处理
(NLP-Natural Language Processing)
定义:让计算机理解、生成人类语言的技术,涵盖语义分析、机器翻译等领域。
举例:在智能客服解答“如何重置密码”的问题时,首先需要将语音转换为文字,然后理解询问的含义,最终形成回答的文本。
6.计算机视觉
(CV-Computer Vision)
定义:使计算机能够“看懂”图像和视频的技术,包括物体检测、图像分类、人脸识别等应用。
举例:在超市自助结账机中,摄像头通过识别商品条码,匹配数据库中的信息,显示价格;汽车零部件厂商的CV系统检测产品缺陷。
7.大语言模型
(LLM-Large Language Model)
定义:基于海量文本数据训练的深度学习模型,能理解、生成人类语言,完成问答、写作等任务。
举例:在回答问题的过程中,DeepSeek会深入解析文本的含义,并利用其在训练过程中习得的语言规则,来构建一个逻辑连贯的答复。
8.Transformer架构
(Transformer Architecture)
定义:基于注意力机制构建的深度学习模型架构,擅长处理序列数据(如文本),通过并行计算大幅提升训练效率。
举例:在将英文句子翻译成中文时,谷歌翻译模型会同时考虑“bank”在不同语境下的意义(如银行/河岸),从而挑选出恰当的翻译。
9.生成式AI
(GenAI-Generative AI)
定义:能够创造新内容(文本、图像、视频等)的人工智能系统,通过理解数据模式生成符合人类需求的原创性输出。
举例:用AI生成营销文案时,输入产品关键词即可生成广告语、社交媒体推文。
10.多模态
(Multimodal)
定义:同时处理和理解多种类型数据(文本、图像、语音等)的技术,实现跨媒介的信息融合与推理。
举例:智能客服在分析了用户所发文字“这件衣服质量如何”以及产品图片后,综合提供了材质说明和洗涤建议。
11.知识图谱
(KG-Knowledge Graph)
定义:以图结构组织知识的数据库,用节点表示实体,边表示关系,支持语义搜索和智能推理。
示例:在电子商务平台上,用户在购买手机时常常也会看到推荐耳机,这是因为知识图谱中存在“手机-配件-耳机”的连接关系。
12.向量化/嵌入技术
(Embedding)
定义:将文字、图像等数据转换为数值向量的技术,使计算机能够通过数学运算处理语义信息。
举例:“国王”-“男性”+“女性”=“女王”的向量运算,反映词语间的语义关系。
13.智能体
(Agent)
定义:能感知环境、自主决策并执行动作的AI程序,常应用于机器人、游戏AI等场景。
举例:自动驾驶汽车:通过摄像头(感知)识别行人→计算路径(决策)→控制方向盘(执行)完成避让。
14.通用人工智能
(AGI-Artificial General Intelligence)
定义:具备与人类相当的全领域认知能力的人工智能,能灵活应对各种未知任务,目前尚未实现。
举例:在科幻影片里的机器人,不仅能够识别病症,还能编写诗歌,具备多种才能。
训练技术
15.监督学习
(SL-Supervised Learning)
定义:使用带标签数据训练的机器学习方法,模型通过对比预测结果与标准答案调整参数。
举例:在训练模型识别垃圾邮件时,提供大量已标记的“正常邮件”与“垃圾邮件”样本,以便模型学习区分它们的特征。
类比:就像学生使用带有答案的习题集,每解答一题后便与正确答案(标签)进行对照,通过分析错误(损失计算)来防止重复犯错。
16.预训练
(Pre-Training)
定义:在大规模通用数据集上进行的初步训练,使模型获得基础特征提取能力,为后续任务提供初始参数。
举例:BERT模型通过完形填空任务预训练,学习词语上下文关系,之后可用于问答、分类等下游任务。
类比:如同学生广泛阅读百科全书(进行预训练),构建起知识体系,随后专注于特定领域(进行微调)。
17.微调
(FT-Fine-Tuning)
定义:在预训练模型基础上,用特定领域数据继续训练以适配新任务的过程,通常只调整部分网络层参数。
举例:法律文本分类:在通用语言模型基础上,用法律文书数据集微调预训练模型,提升专业术语理解能力。
类比:像定制西装时基于标准版型(预训练模型),根据个人身材数据(领域数据)调整袖长、腰围等细节(参数微调)。
18.数据增强
(DA-Data Augmentation)
定义:通过变换原始数据生成新样本的技术,增加数据多样性,提升模型泛化能力。
举例:图像分类任务中,对猫的图片进行旋转、裁剪、调整亮度等操作,生成更多训练样本。
类比:像用滤镜编辑照片,同一张风景照通过不同滤镜(增强手段)生成晨雾、晚霞、阴天等版本。
19.知识蒸馏
(KD-Knowledge Distillation)
定义:将大型模型(教师模型)的知识迁移到小型模型(学生模型)的技术,通过软化输出概率传递暗知识。
举例:将BERT的知识蒸馏到TinyBERT,教师模型不仅传递预测结果(苹果是水果),还传递“苹果与梨相似度70%”的软标签。
类比:像导师带学生,教授(大模型)不仅传授标准答案(硬标签),还讲解解题思路(类间关系),帮助学生(小模型)举一反三。
20.模型压缩
(MC-Model Compression)
定义:通过剪枝(移除冗余参数)、量化(降低数值精度)、知识蒸馏(小模型模仿大模型)等技术,减小模型体积和计算量,使其更适合在移动端或边缘设备部署。
举例:将手机语音助手模型从500MB压缩到50MB,在保持90%准确率的同时,耗电量降低60%。
类比:像整理行李,通过丢弃不必要的服饰(剪枝)、利用压缩袋缩小体积(量化)、挑选必需品(蒸馏),使行李(模型)轻巧又实用。
21.检索增强生成
(RAG-Retrieval-Augmented Generation)
定义:结合实时检索外部知识库与生成模型的技术,解决大模型事实性错误与信息滞后问题,提升生成内容的准确性。
举例:智能客服回答“最新退换货政策”时,先检索公司知识库获取最新条款,再生成回答文本。
类比:律师办案时,先查阅最新法典(知识检索),再结合案情(用户问题)撰写法律文书(生成回答)。
应用交互
22.多轮对话
(MTD-Multi-Turn Dialogue)
定义:通过对话状态追踪(DST)技术维护上下文,支持超过3轮以上的连贯交互,实现类人对话体验。
示例:用户:杭州有哪些好玩的地方? →系统:可以去西湖、灵隐寺看看。 → 用户再问:哪个地方更适合带小孩去呢? → 系统:西湖有游船和博物馆,非常适合亲子游。
比较:就像和老朋友聊天,每次对话都流畅地延续上一次的话题,就像“你之前提到的那家餐厅”→“没错,就是那家美味的本帮小馆”的顺畅对话。
23.意图识别
(IR-Intent Recognition)
定义:将自然语言转化为预定义意图标签(如“查询天气”“订餐”)的技术,是对话系统的核心模块。
举例:用户说“太热了”,系统识别为“调节温度”意图,触发空调降温指令。
类比:像餐厅服务员,听到“来点解渴的”立刻理解需要推荐饮品(意图),而非字面要求“找水解渴”。
24.语义理解
(SU-Semantic Understanding)
定义:通过分析用户输入(如文字或语音)判断其真实需求的技术,是对话系统的核心能力。
举例:对智能音箱说“明天会下雨吗”系统识别出“查询天气”意图并调用天气API。
类比:像餐厅服务员通过顾客的“来份牛排”快速理解对方需要点餐。
25.提示词工程
(PE-Prompt Engineering)
定义:通过结构化指令设计、上下文示例、角色模拟等方法,精确引导 大模型输出的系统性技术,类似“与机器沟通的语言艺术”。
举例:想让AI写招聘启事,用“用互联网行业术语撰写Java工程师招聘,要求3年经验,薪资面议”比“写个招聘”更有效。
类比:像使用智能咖啡机时,选择“中杯/热/双份浓缩”比只说“来杯咖啡”更能得到想要的口味。
26.多模态交互
(MMI-Multimodal Interaction)
定义:支持同时使用语音、手势、图像等多种方式进行人机交互的技术,提升交互自然度。
举例:智能厨房中,用户说“调大火力”同时用手指顺时针划圈,系统综合理解后调整灶台火焰。
类比:像与朋友对话,边说“这本书很有趣”边用手指书中插图(多模态),比单纯语言描述更易理解。
其它
27.模型参数量
(MP-Model Parameters)
定义:模型中可调整的权重总数,通常与模型复杂度正相关。
举例:GPT-4有1.76万亿参数,手机端小模型可能只有1亿参数。
类比:图书馆藏书量,书籍越多(参数多)能解答的问题越广泛,但查找信息也更耗时耗能。
28.准确率/召回率/F1分数
(Accuracy/Recall/F1 - Score)
定义:准确率指的是正确预测占全部预测的比例(查得准);召回率指的是正确识别出的正例占全部正例的比例(查得全);F1分数指两者平衡的综合指标。
举例:癌症筛查系统:准确率98%:100次诊断98次正确;召回率95%:20名患者中检出19人;F1=96.4%:综合评估指标。
类比:渔夫捕鱼,准确率=捞到的鱼中目标鱼种占比;召回率=所有目标鱼种被捕获的比例;F1=评价综合捕捞效率。
29.工具调用
(TC-Tool Calling)
定义:AI系统通过API接口调用外部工具或服务的能力,扩展模型功能边界,实现复杂任务处理。
举例:智能助手收到“订明早8点闹钟”指令后,调用手机系统API设置闹钟,而非仅生成文本回复。
类比:像全能秘书,接到“安排会议”要求后,实际操作日历软件(工具调用),而非只是口头应答“好的”。
30.思维链
(CoT-Chain of Thought)
定义:要求人工智能在解决复杂问题时,显式展示推理过程中的每个逻辑步骤,如同人类逐步演算草稿,以提升可验证性与可解释性。
举例:面对问题“商品原价580元,打8折后满400减50,最终多少钱?”
分步输出:“首先计算打折后的价格:580乘以0.8等于464元;其次,确认是否满足满减条件:464大于400,因此可以减免50元。最终答案:464元减去50元等于414元。”
类比:像按照指南一步步组装家具——“拆开包装-安装桌腿-固定面板-旋紧螺丝”(分步推理),相较于直接查看成品图(直接出结果),更为稳妥可靠。