<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>Embedding - 标签 - SA的自留地 &amp; 重启计划</title><link>https://moe.sakanoy.com/tags/embedding/</link><description>Embedding - 标签 - SA的自留地 &amp; 重启计划</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>bfchengnuo@gmail.com (Kerronex)</managingEditor><webMaster>bfchengnuo@gmail.com (Kerronex)</webMaster><lastBuildDate>Sun, 31 May 2026 00:00:00 +0800</lastBuildDate><atom:link href="https://moe.sakanoy.com/tags/embedding/" rel="self" type="application/rss+xml"/><item><title>Embedding 嵌入模型</title><link>https://moe.sakanoy.com/embedding%E5%B5%8C%E5%85%A5%E6%A8%A1%E5%9E%8B/</link><pubDate>Sun, 31 May 2026 00:00:00 +0800</pubDate><author><name>Kerronex</name></author><guid>https://moe.sakanoy.com/embedding%E5%B5%8C%E5%85%A5%E6%A8%A1%E5%9E%8B/</guid><description>&lt;p>Embedding（嵌入）可以理解为：把文字、图片、音频、用户等对象，转换成一串数字向量，用这些数字来表示它们的 “语义特征” 或 “含义”。&lt;/p>
&lt;p>因为大模型的本质就是处理数字，而我们输入的文本需要先经过 tokenization，再被转换成 embedding 向量，才能进入模型参与计算；因为表示的是语义特征，所以语义相近的文本在向量空间中的距离往往更近，因为这个特性，它在语义搜索、上下文检索和 RAG 等场景中非常重要。&lt;/p></description></item></channel></rss>