Embedding 嵌入模型

Sun, 31 May 2026 00:00:00 +0800

Embedding（嵌入）可以理解为：把文字、图片、音频、用户等对象，转换成一串数字向量，用这些数字来表示它们的 “语义特征” 或 “含义”。

因为大模型的本质就是处理数字，而我们输入的文本需要先经过 tokenization，再被转换成 embedding 向量，才能进入模型参与计算；因为表示的是语义特征，所以语义相近的文本在向量空间中的距离往往更近，因为这个特性，它在语义搜索、上下文检索和 RAG 等场景中非常重要。

Embedding - 标签 - SA的自留地 & 重启计划