股票名称:金现代
股票代码:300830

AI词典|30条AI术语,全网最易懂版!

2025-05-07 13:40:40   来源: 本站原创 

人工智能技术正在改变各行各业,但很多技术概念却让人云里雾里。本文通过“定义+案例”的方式解读AI领域的30条常见术语,覆盖基础理念、训练技术、应用交互等内容,帮助从业者及技术爱好者快速掌握技术脉络。

基础理念

1.人工智能 

(AI-Artificial Intelligence)

定义:通过计算机系统模拟人类智能行为的技术,涵盖学习、推理、感知、决策等能力。目标是让机器能完成需要人类智慧的任务。

例如:智能音箱能够理解“播放周杰伦的歌曲”的指令并执行,这背后结合了语音识别(感知)和意图理解(推理)这两种人工智能技术。

2.机器学习

(ML-Machine Learning)

定义:通过算法让计算机从数据中自动学习规律,并用于预测或决策的技术。核心是让机器具备“从经验中改进”的能力,而非依赖固定编程规则。

举例:在线购物平台利用机器学习算法根据浏览历史推荐商品,调整推荐以符合用户偏好。

3.深度学习

(DL-Deep Learning)

定义:基于多层神经网络的机器学习方法,能自动提取数据的多层次特征。擅长处理图像、语音等复杂非结构化数据。

举例:手机相册自动识别人脸并分类:通过多层神经网络先识别边缘→五官→整体面部特征,最终确定人物身份。

4.神经网络

(Neural Network)

定义:模仿生物神经网络结构的计算模型,由大量互连的“神经元”分层组成,通过调整连接权重实现信息处理。

示例:在手写数字识别任务中,输入层负责接收像素数据,隐藏层进行笔画特征的提取,而输出层则确定数字属于0到9中的哪一个。

5.自然语言处理

(NLP-Natural Language Processing)

定义:让计算机理解、生成人类语言的技术,涵盖语义分析、机器翻译等领域。

举例:在智能客服解答“如何重置密码”的问题时,首先需要将语音转换为文字,然后理解询问的含义,最终形成回答的文本。

6.计算机视觉

(CV-Computer Vision)

定义:使计算机能够“看懂”图像和视频的技术,包括物体检测、图像分类、人脸识别等应用。

举例:在超市自助结账机中,摄像头通过识别商品条码,匹配数据库中的信息,显示价格;汽车零部件厂商的CV系统检测产品缺陷

7.大语言模型

(LLM-Large Language Model)

定义:基于海量文本数据训练的深度学习模型,能理解、生成人类语言,完成问答、写作等任务。

举例:在回答问题的过程中,DeepSeek会深入解析文本的含义,并利用其在训练过程中习得的语言规则,来构建一个逻辑连贯的答复。

8.Transformer架构

(Transformer Architecture)

定义:基于注意力机制构建的深度学习模型架构,擅长处理序列数据(如文本),通过并行计算大幅提升训练效率。

举例:在将英文句子翻译成中文时,谷歌翻译模型会同时考虑“bank”在不同语境下的意义(如银行/河岸),从而挑选出恰当的翻译。

9.生成式AI

(GenAI-Generative AI)

定义:能够创造新内容(文本、图像、视频等)的人工智能系统,通过理解数据模式生成符合人类需求的原创性输出。

举例:用AI生成营销文案时,输入产品关键词即可生成广告语、社交媒体推文。

10.多模态

(Multimodal)

定义:同时处理和理解多种类型数据(文本、图像、语音等)的技术,实现跨媒介的信息融合与推理。

举例:智能客服在分析了用户所发文字“这件衣服质量如何”以及产品图片后,综合提供了材质说明和洗涤建议。

11.知识图谱

(KG-Knowledge Graph)

定义:以图结构组织知识的数据库,用节点表示实体,边表示关系,支持语义搜索和智能推理。

示例:在电子商务平台上,用户在购买手机时常常也会看到推荐耳机,这是因为知识图谱中存在“手机-配件-耳机”的连接关系。

12.向量化/嵌入技术

(Embedding)

定义:将文字、图像等数据转换为数值向量的技术,使计算机能够通过数学运算处理语义信息。

举例:“国王”-“男性”+“女性”=“女王”的向量运算,反映词语间的语义关系。

13.智能体

(Agent)

定义:能感知环境、自主决策并执行动作的AI程序,常应用于机器人、游戏AI等场景。

举例:自动驾驶汽车:通过摄像头(感知)识别行人→计算路径(决策)→控制方向盘(执行)完成避让。

14.通用人工智能

(AGI-Artificial General Intelligence)

定义:具备与人类相当的全领域认知能力的人工智能,能灵活应对各种未知任务,目前尚未实现。

举例:在科幻影片里的机器人,不仅能够识别病症,还能编写诗歌,具备多种才能。

训练技术

15.监督学习

(SL-Supervised Learning)

定义:使用带标签数据训练的机器学习方法,模型通过对比预测结果与标准答案调整参数。

举例:在训练模型识别垃圾邮件时,提供大量已标记的“正常邮件”与“垃圾邮件”样本,以便模型学习区分它们的特征。

类比:就像学生使用带有答案的习题集,每解答一题后便与正确答案(标签)进行对照,通过分析错误(损失计算)来防止重复犯错。

16.预训练

(Pre-Training)

定义:在大规模通用数据集上进行的初步训练,使模型获得基础特征提取能力,为后续任务提供初始参数。

举例:BERT模型通过完形填空任务预训练,学习词语上下文关系,之后可用于问答、分类等下游任务。

类比:如同学生广泛阅读百科全书(进行预训练),构建起知识体系,随后专注于特定领域(进行微调)。

17.微调

(FT-Fine-Tuning)

定义:在预训练模型基础上,用特定领域数据继续训练以适配新任务的过程,通常只调整部分网络层参数。

举例:法律文本分类:在通用语言模型基础上,用法律文书数据集微调预训练模型,提升专业术语理解能力。

类比:像定制西装时基于标准版型(预训练模型),根据个人身材数据(领域数据)调整袖长、腰围等细节(参数微调)。

18.数据增强

(DA-Data Augmentation)

定义:通过变换原始数据生成新样本的技术,增加数据多样性,提升模型泛化能力。

举例:图像分类任务中,对猫的图片进行旋转、裁剪、调整亮度等操作,生成更多训练样本。

类比:像用滤镜编辑照片,同一张风景照通过不同滤镜(增强手段)生成晨雾、晚霞、阴天等版本。

19.知识蒸馏

(KD-Knowledge Distillation)

定义:将大型模型(教师模型)的知识迁移到小型模型(学生模型)的技术,通过软化输出概率传递暗知识。

举例:将BERT的知识蒸馏到TinyBERT,教师模型不仅传递预测结果(苹果是水果),还传递“苹果与梨相似度70%”的软标签。

类比:像导师带学生,教授(大模型)不仅传授标准答案(硬标签),还讲解解题思路(类间关系),帮助学生(小模型)举一反三。

20.模型压缩

(MC-Model Compression)

定义:通过剪枝(移除冗余参数)、量化(降低数值精度)、知识蒸馏(小模型模仿大模型)等技术,减小模型体积和计算量,使其更适合在移动端或边缘设备部署。

举例:将手机语音助手模型从500MB压缩到50MB,在保持90%准确率的同时,耗电量降低60%

类比:像整理行李,通过丢弃不必要的服饰(剪枝)、利用压缩袋缩小体积(量化)、挑选必需品(蒸馏),使行李(模型)轻巧又实用。

21.检索增强生成

(RAG-Retrieval-Augmented Generation)

定义:结合实时检索外部知识库与生成模型的技术,解决大模型事实性错误与信息滞后问题,提升生成内容的准确性。

举例:智能客服回答“最新退换货政策”时,先检索公司知识库获取最新条款,再生成回答文本。

类比:律师办案时,先查阅最新法典(知识检索),再结合案情(用户问题)撰写法律文书(生成回答)。

应用交互

22.多轮对话

(MTD-Multi-Turn Dialogue)

定义:通过对话状态追踪(DST)技术维护上下文,支持超过3轮以上的连贯交互,实现类人对话体验。

示例:用户:杭州有哪些好玩的地方? →系统:可以去西湖、灵隐寺看看。 → 用户再问:哪个地方更适合带小孩去呢? → 系统:西湖有游船和博物馆,非常适合亲子游。

比较:就像和老朋友聊天,每次对话都流畅地延续上一次的话题,就像“你之前提到的那家餐厅”→“没错,就是那家美味的本帮小馆”的顺畅对话。

23.意图识别

(IR-Intent Recognition)

定义:将自然语言转化为预定义意图标签(如“查询天气”“订餐”)的技术,是对话系统的核心模块。

举例:用户说“太热了”,系统识别为“调节温度”意图,触发空调降温指令。

类比:像餐厅服务员,听到“来点解渴的”立刻理解需要推荐饮品(意图),而非字面要求“找水解渴”。

24.语义理解

(SU-Semantic Understanding)

定义:通过分析用户输入(如文字或语音)判断其真实需求的技术,是对话系统的核心能力。

举例:对智能音箱说“明天会下雨吗”系统识别出“查询天气”意图并调用天气API。

类比:像餐厅服务员通过顾客的“来份牛排”快速理解对方需要点餐。

25.提示词工程

(PE-Prompt Engineering)

定义:通过结构化指令设计、上下文示例、角色模拟等方法,精确引导 大模型输出的系统性技术,类似“与机器沟通的语言艺术”。

举例:想让AI写招聘启事,用“用互联网行业术语撰写Java工程师招聘,要求3年经验,薪资面议”比“写个招聘”更有效。

类比:像使用智能咖啡机时,选择“中杯/热/双份浓缩”比只说“来杯咖啡”更能得到想要的口味。

26.多模态交互

(MMI-Multimodal Interaction)

定义:支持同时使用语音、手势、图像等多种方式进行人机交互的技术,提升交互自然度。

举例:智能厨房中,用户说“调大火力”同时用手指顺时针划圈,系统综合理解后调整灶台火焰。

类比:像与朋友对话,边说“这本书很有趣”边用手指书中插图(多模态),比单纯语言描述更易理解。

其它

27.模型参数量

(MP-Model Parameters)

定义:模型中可调整的权重总数,通常与模型复杂度正相关。

举例:GPT-4有1.76万亿参数,手机端小模型可能只有1亿参数。

类比:图书馆藏书量,书籍越多(参数多)能解答的问题越广泛,但查找信息也更耗时耗能。

28.准确率/召回率/F1分数

(Accuracy/Recall/F1 - Score)

定义:准确率指的是正确预测占全部预测的比例(查得准);召回率指的是正确识别出的正例占全部正例的比例(查得全);F1分数指两者平衡的综合指标。

举例:癌症筛查系统:准确率98%:100次诊断98次正确;召回率95%:20名患者中检出19人;F1=96.4%:综合评估指标。

类比:渔夫捕鱼,准确率=捞到的鱼中目标鱼种占比;召回率=所有目标鱼种被捕获的比例;F1=评价综合捕捞效率。

29.工具调用

(TC-Tool Calling)

定义:AI系统通过API接口调用外部工具或服务的能力,扩展模型功能边界,实现复杂任务处理。

举例:智能助手收到“订明早8点闹钟”指令后,调用手机系统API设置闹钟,而非仅生成文本回复。

类比:像全能秘书,接到“安排会议”要求后,实际操作日历软件(工具调用),而非只是口头应答“好的”。

30.思维链

(CoT-Chain of Thought)

定义:要求人工智能在解决复杂问题时,显式展示推理过程中的每个逻辑步骤,如同人类逐步演算草稿,以提升可验证性与可解释性。

举例:面对问题“商品原价580元,打8折后满400减50,最终多少钱?”

分步输出:“首先计算打折后的价格:580乘以0.8等于464元;其次,确认是否满足满减条件:464大于400,因此可以减免50元。最终答案:464元减去50元等于414元。

类比:像按照指南一步步组装家具——“拆开包装-安装桌腿-固定面板-旋紧螺丝”(分步推理),相较于直接查看成品图(直接出结果),更为稳妥可靠。