AI詞典|30條AI術語,全網最易懂版!
人工智能技術正在改變各行各業,但很多技術概念卻讓人云里霧里。本文通過“定義+案例”的方式解讀AI領域的30條常見術語,覆蓋基礎理念、訓練技術、應用交互等內容,幫助從業者及技術愛好者快速掌握技術脈絡。
基礎理念
1.人工智能
(AI-Artificial Intelligence)
定義:通過計算機系統模擬人類智能行為的技術,涵蓋學習、推理、感知、決策等能力。目標是讓機器能完成需要人類智慧的任務。
例如:智能音箱能夠理解“播放周杰倫的歌曲”的指令并執行,這背后結合了語音識別(感知)和意圖理解(推理)這兩種人工智能技術。
2.機器學習
(ML-Machine Learning)
定義:通過算法讓計算機從數據中自動學習規律,并用于預測或決策的技術。核心是讓機器具備“從經驗中改進”的能力,而非依賴固定編程規則。
舉例:在線購物平臺利用機器學習算法根據瀏覽歷史推薦商品,調整推薦以符合用戶偏好。
3.深度學習
(DL-Deep Learning)
定義:基于多層神經網絡的機器學習方法,能自動提取數據的多層次特征。擅長處理圖像、語音等復雜非結構化數據。
舉例:手機相冊自動識別人臉并分類:通過多層神經網絡先識別邊緣→五官→整體面部特征,最終確定人物身份。
4.神經網絡
(Neural Network)
定義:模仿生物神經網絡結構的計算模型,由大量互連的“神經元”分層組成,通過調整連接權重實現信息處理。
示例:在手寫數字識別任務中,輸入層負責接收像素數據,隱藏層進行筆畫特征的提取,而輸出層則確定數字屬于0到9中的哪一個。
5.自然語言處理
(NLP-Natural Language Processing)
定義:讓計算機理解、生成人類語言的技術,涵蓋語義分析、機器翻譯等領域。
舉例:在智能客服解答“如何重置密碼”的問題時,首先需要將語音轉換為文字,然后理解詢問的含義,最終形成回答的文本。
6.計算機視覺
(CV-Computer Vision)
定義:使計算機能夠“看懂”圖像和視頻的技術,包括物體檢測、圖像分類、人臉識別等應用。
舉例:在超市自助結賬機中,攝像頭通過識別商品條碼,匹配數據庫中的信息,顯示價格;汽車零部件廠商的CV系統檢測產品缺陷。
7.大語言模型
(LLM-Large Language Model)
定義:基于海量文本數據訓練的深度學習模型,能理解、生成人類語言,完成問答、寫作等任務。
舉例:在回答問題的過程中,DeepSeek會深入解析文本的含義,并利用其在訓練過程中習得的語言規則,來構建一個邏輯連貫的答復。
8.Transformer架構
(Transformer Architecture)
定義:基于注意力機制構建的深度學習模型架構,擅長處理序列數據(如文本),通過并行計算大幅提升訓練效率。
舉例:在將英文句子翻譯成中文時,谷歌翻譯模型會同時考慮“bank”在不同語境下的意義(如銀行/河岸),從而挑選出恰當的翻譯。
9.生成式AI
(GenAI-Generative AI)
定義:能夠創造新內容(文本、圖像、視頻等)的人工智能系統,通過理解數據模式生成符合人類需求的原創性輸出。
舉例:用AI生成營銷文案時,輸入產品關鍵詞即可生成廣告語、社交媒體推文。
10.多模態
(Multimodal)
定義:同時處理和理解多種類型數據(文本、圖像、語音等)的技術,實現跨媒介的信息融合與推理。
舉例:智能客服在分析了用戶所發文字“這件衣服質量如何”以及產品圖片后,綜合提供了材質說明和洗滌建議。
11.知識圖譜
(KG-Knowledge Graph)
定義:以圖結構組織知識的數據庫,用節點表示實體,邊表示關系,支持語義搜索和智能推理。
示例:在電子商務平臺上,用戶在購買手機時常常也會看到推薦耳機,這是因為知識圖譜中存在“手機-配件-耳機”的連接關系。
12.向量化/嵌入技術
(Embedding)
定義:將文字、圖像等數據轉換為數值向量的技術,使計算機能夠通過數學運算處理語義信息。
舉例:“國王”-“男性”+“女性”=“女王”的向量運算,反映詞語間的語義關系。
13.智能體
(Agent)
定義:能感知環境、自主決策并執行動作的AI程序,常應用于機器人、游戲AI等場景。
舉例:自動駕駛汽車:通過攝像頭(感知)識別行人→計算路徑(決策)→控制方向盤(執行)完成避讓。
14.通用人工智能
(AGI-Artificial General Intelligence)
定義:具備與人類相當的全領域認知能力的人工智能,能靈活應對各種未知任務,目前尚未實現。
舉例:在科幻影片里的機器人,不僅能夠識別病癥,還能編寫詩歌,具備多種才能。
訓練技術
15.監督學習
(SL-Supervised Learning)
定義:使用帶標簽數據訓練的機器學習方法,模型通過對比預測結果與標準答案調整參數。
舉例:在訓練模型識別垃圾郵件時,提供大量已標記的“正常郵件”與“垃圾郵件”樣本,以便模型學習區分它們的特征。
類比:就像學生使用帶有答案的習題集,每解答一題后便與正確答案(標簽)進行對照,通過分析錯誤(損失計算)來防止重復犯錯。
16.預訓練
(Pre-Training)
定義:在大規模通用數據集上進行的初步訓練,使模型獲得基礎特征提取能力,為后續任務提供初始參數。
舉例:BERT模型通過完形填空任務預訓練,學習詞語上下文關系,之后可用于問答、分類等下游任務。
類比:如同學生廣泛閱讀百科全書(進行預訓練),構建起知識體系,隨后專注于特定領域(進行微調)。
17.微調
(FT-Fine-Tuning)
定義:在預訓練模型基礎上,用特定領域數據繼續訓練以適配新任務的過程,通常只調整部分網絡層參數。
舉例:法律文本分類:在通用語言模型基礎上,用法律文書數據集微調預訓練模型,提升專業術語理解能力。
類比:像定制西裝時基于標準版型(預訓練模型),根據個人身材數據(領域數據)調整袖長、腰圍等細節(參數微調)。
18.數據增強
(DA-Data Augmentation)
定義:通過變換原始數據生成新樣本的技術,增加數據多樣性,提升模型泛化能力。
舉例:圖像分類任務中,對貓的圖片進行旋轉、裁剪、調整亮度等操作,生成更多訓練樣本。
類比:像用濾鏡編輯照片,同一張風景照通過不同濾鏡(增強手段)生成晨霧、晚霞、陰天等版本。
19.知識蒸餾
(KD-Knowledge Distillation)
定義:將大型模型(教師模型)的知識遷移到小型模型(學生模型)的技術,通過軟化輸出概率傳遞暗知識。
舉例:將BERT的知識蒸餾到TinyBERT,教師模型不僅傳遞預測結果(蘋果是水果),還傳遞“蘋果與梨相似度70%”的軟標簽。
類比:像導師帶學生,教授(大模型)不僅傳授標準答案(硬標簽),還講解解題思路(類間關系),幫助學生(小模型)舉一反三。
20.模型壓縮
(MC-Model Compression)
定義:通過剪枝(移除冗余參數)、量化(降低數值精度)、知識蒸餾(小模型模仿大模型)等技術,減小模型體積和計算量,使其更適合在移動端或邊緣設備部署。
舉例:將手機語音助手模型從500MB壓縮到50MB,在保持90%準確率的同時,耗電量降低60%。
類比:像整理行李,通過丟棄不必要的服飾(剪枝)、利用壓縮袋縮小體積(量化)、挑選必需品(蒸餾),使行李(模型)輕巧又實用。
21.檢索增強生成
(RAG-Retrieval-Augmented Generation)
定義:結合實時檢索外部知識庫與生成模型的技術,解決大模型事實性錯誤與信息滯后問題,提升生成內容的準確性。
舉例:智能客服回答“最新退換貨政策”時,先檢索公司知識庫獲取最新條款,再生成回答文本。
類比:律師辦案時,先查閱最新法典(知識檢索),再結合案情(用戶問題)撰寫法律文書(生成回答)。
應用交互
22.多輪對話
(MTD-Multi-Turn Dialogue)
定義:通過對話狀態追蹤(DST)技術維護上下文,支持超過3輪以上的連貫交互,實現類人對話體驗。
示例:用戶:杭州有哪些好玩的地方? →系統:可以去西湖、靈隱寺看看。 → 用戶再問:哪個地方更適合帶小孩去呢? → 系統:西湖有游船和博物館,非常適合親子游。
比較:就像和老朋友聊天,每次對話都流暢地延續上一次的話題,就像“你之前提到的那家餐廳”→“沒錯,就是那家美味的本幫小館”的順暢對話。
23.意圖識別
(IR-Intent Recognition)
定義:將自然語言轉化為預定義意圖標簽(如“查詢天氣”“訂餐”)的技術,是對話系統的核心模塊。
舉例:用戶說“太熱了”,系統識別為“調節溫度”意圖,觸發空調降溫指令。
類比:像餐廳服務員,聽到“來點解渴的”立刻理解需要推薦飲品(意圖),而非字面要求“找水解渴”。
24.語義理解
(SU-Semantic Understanding)
定義:通過分析用戶輸入(如文字或語音)判斷其真實需求的技術,是對話系統的核心能力。
舉例:對智能音箱說“明天會下雨嗎”系統識別出“查詢天氣”意圖并調用天氣API。
類比:像餐廳服務員通過顧客的“來份牛排”快速理解對方需要點餐。
25.提示詞工程
(PE-Prompt Engineering)
定義:通過結構化指令設計、上下文示例、角色模擬等方法,精確引導 大模型輸出的系統性技術,類似“與機器溝通的語言藝術”。
舉例:想讓AI寫招聘啟事,用“用互聯網行業術語撰寫Java工程師招聘,要求3年經驗,薪資面議”比“寫個招聘”更有效。
類比:像使用智能咖啡機時,選擇“中杯/熱/雙份濃縮”比只說“來杯咖啡”更能得到想要的口味。
26.多模態交互
(MMI-Multimodal Interaction)
定義:支持同時使用語音、手勢、圖像等多種方式進行人機交互的技術,提升交互自然度。
舉例:智能廚房中,用戶說“調大火力”同時用手指順時針劃圈,系統綜合理解后調整灶臺火焰。
類比:像與朋友對話,邊說“這本書很有趣”邊用手指書中插圖(多模態),比單純語言描述更易理解。
其它
27.模型參數量
(MP-Model Parameters)
定義:模型中可調整的權重總數,通常與模型復雜度正相關。
舉例:GPT-4有1.76萬億參數,手機端小模型可能只有1億參數。
類比:圖書館藏書量,書籍越多(參數多)能解答的問題越廣泛,但查找信息也更耗時耗能。
28.準確率/召回率/F1分數
(Accuracy/Recall/F1 - Score)
定義:準確率指的是正確預測占全部預測的比例(查得準);召回率指的是正確識別出的正例占全部正例的比例(查得全);F1分數指兩者平衡的綜合指標。
舉例:癌癥篩查系統:準確率98%:100次診斷98次正確;召回率95%:20名患者中檢出19人;F1=96.4%:綜合評估指標。
類比:漁夫捕魚,準確率=撈到的魚中目標魚種占比;召回率=所有目標魚種被捕獲的比例;F1=評價綜合捕撈效率。
29.工具調用
(TC-Tool Calling)
定義:AI系統通過API接口調用外部工具或服務的能力,擴展模型功能邊界,實現復雜任務處理。
舉例:智能助手收到“訂明早8點鬧鐘”指令后,調用手機系統API設置鬧鐘,而非僅生成文本回復。
類比:像全能秘書,接到“安排會議”要求后,實際操作日歷軟件(工具調用),而非只是口頭應答“好的”。
30.思維鏈
(CoT-Chain of Thought)
定義:要求人工智能在解決復雜問題時,顯式展示推理過程中的每個邏輯步驟,如同人類逐步演算草稿,以提升可驗證性與可解釋性。
舉例:面對問題“商品原價580元,打8折后滿400減50,最終多少錢?”
分步輸出:“首先計算打折后的價格:580乘以0.8等于464元;其次,確認是否滿足滿減條件:464大于400,因此可以減免50元。最終答案:464元減去50元等于414元。”
類比:像按照指南一步步組裝家具——“拆開包裝-安裝桌腿-固定面板-旋緊螺絲”(分步推理),相較于直接查看成品圖(直接出結果),更為穩妥可靠。