AI相关
- AI实战
  - 大模型微调
  - 大模型蒸馏
- AI工具
  - CherryStudio
  - Coze
  - Cursor
  - DeepSeek
  - Ima
  - Manus
  - MaxKB
  - Trae
  - 通义千问
- AI技术
  - Embedding
  - FunctionCall
  - MCP
  - MOE架构
- AI框架
  - Eino
  - LangChain
  - Ollama
- Dify
- LlamaFactory
- 大模型基础

Java框架
- Apollo
- Aviator
- Caffeine
- Canal
- Drools
- Eureka
- Feign
- Guava
- Hystrix
- MyBatis
- Nacos
- Seata
- Sentinel
- ShardingSphere
- Spring

Web3相关
- MetaMask
- 以太坊
- 区块链

业务相关
- 优惠券业务
- 广告业务
- 推荐业务
- 用户增长

中间件
- Dubbo
- Elasticsearch
- Netty
- Solr
- ZooKeeper

代码整洁
- CodeReview
- Redis开发规范
- 代码重构

公众号文章
- AI文章
  - AI大模型如何提高上下文长度
  - AI大模型的Token到底指什么
  - AI提示词万能公式
  - DeepSeekV3低成本做出顶级AI
  - 为什么AI大模型训练离不开GPU
  - 免费开源模型大超市HuggingFace
  - 如何给AI大模型喂数据
  - 简单解释什么是AI智能体
- Disruptor框架
- ElasticSearch深度分页
- KAFKA高可用
- MySQL锁表
- Redis延时队列
- RocketMQ事务消息
- RocketMQ延时消息
- RocketMQ消息重试
- RocketMQ负载均衡
- RocketMQ顺序消息
- Tomcat线程池
- Web实时通信
- 动态代理
- 幂等性设计
- 架构设计之CQRS
- 正则表达式
- 泛型策略模式
- 缓存一致性
- 缓存常见问题
- 领域设计之仓储模式
- 领域设计之聚合

前端相关
- CSS
- React
- Vue
- 小程序

基础知识
- JVM
- 分布式
- 并发编程
- 爬虫知识
- 设计模式

大数据相关
- DataX
- DolphinScheduler
- Doris
- Flink
- Hadoop
- Hive
- SQOOP
- Spark
- 大数据基础
- 数据血缘

学习专栏
- 22讲通关Go语言
- 23讲搞定后台架构实战
- RPC实战与核心原理
- 从0开始学大数据
- 从0开始学架构
- 代码之丑
- 大厂晋升指南
- 如何成为学习高手
- 如何设计一个秒杀系统
- 架构设计面试精讲
- 程序员工作法
- 给程序员的职场情商课
- 高并发架构实战课

学习书籍
- 人物书籍
  - 我在北京送快递
- 历史书籍
  - 孙子兵法
  - 明朝那些事儿
- 心理书籍
  - 认知觉醒
- 技能书籍
  - 英语魔法师之语法俱乐部
  - 高效能人士的七个习惯
- 文学书籍
  - 你当像鸟飞往你的山
  - 当下的力量
  - 活着
- 编程书籍
  - Effective Java
  - HBase不睡觉书
  - Java并发编程实战
  - Java并发编程的艺术
  - Java开发手册
  - MySQL技术内幕
  - Redis设计与实现
  - 人月神话
  - 亿级流量网站架构核心技术
  - 从零开始读懂Web3
  - 代码整洁之道
  - 大型网站技术架构
  - 大型网站系统
  - 深入理解Java虚拟机
  - 程序员修炼之道
  - 程序员必读之软件架构
  - 重构改善既有代码的设计

实战相关
- CompletableFuture
- Spring Event
- SpringAI
- Spring

工具相关
- Anki
- Arthas
- Hexo
- Maven
- Mermaid
- PlantUML

成长相关
- 2025年度计划
- 工作相关
- 技术学习
- 面试相关

数据库
- ClickHouse
- DRDS
- HBase
- MongoDB
- MySQL
- Redis
- SQLite
- TIDB

服务器
- 1Panel
- Docker
- Nginx
- Tomcat
- 运维知识

架构相关
- DDD
- 架构图
- 架构学习
- 系统保障
- 系统性能
- 系统设计

框架相关
- Antlr4
- JWT
- LiteFlow
- Python框架
  - JUPYTER
- RPC框架
- Redisson
- Thrift
- TransmittableThreadLocal
- WebRTC
- XXLJOB

消息队列
- KAFKA
- RabbitMQ
- RocketMQ

源码相关
- KAFKA
- RocketMQ
- SpringBoot
- Spring

算法相关
- LeetCode
- 剑指OFFER
- 算法知识

系统设计
- 12306系统
- 广告系统
- 推荐系统
- 榜单系统
- 消息队列
- 登录系统
- 短链系统
- 社区系统
- 秒杀系统
- 红包系统
- 订单系统

编程语言
- Go基础
- Java基础
- Python基础

计算机基础
- Linux
- 操作系统
- 数据结构
- 网络基础

认知相关
- 保持人间清醒
- 停止比较
- 利己心态
- 告别胡思乱想
- 如何自律
- 学习冥想
- 摆脱内耗
- 缓解负面情绪
- 走出孤独

面试题相关
- JVM面试真题
- MySQL面试真题
- Redis面试真题
- 并发编程面试真题
- 操作系统面试真题
- 数据结构面试真题
- 计算机网络面试真题

Embedding

月伴飞鱼 2025-03-09 16:55:16

AI相关 > AI技术

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者！

在大模型中，Embedding指的是将某种类型的输入数据（如文本、图像、声音等）转换成一个稠密的数值向量的过程。

这些向量通常包含较多维度，每一个维度代表输入数据的某种抽象特征或属性。

Embedding 的目的是将实际的输入转化为一种格式，使得计算机能够更有效地处理和学习。

f953e351ba5e012967275f49e34e92bc

为什么使用Embedding？

Embedding的主要优势是能够将实体转换为计算机易于处理的数值形式，同时减少信息的维度和复杂度。

有助于提高处理效率，而且也使得不同实体之间的比较（如计算相似度）变得可行。

Embedding通常通过大量数据的训练而得到，能够捕捉到复杂的模式和深层次的关系，这是传统方法难以实现的。

什么是Embedding模型？

Embedding模型是RAG技术的核心，也是大模型应用落地必不可少的技术。

Embedding模型是指将高维度的数据（例如文字、图片、视频）映射到低维度空间的过程。

简单来说，Embedding向量就是一个N维的实值向量，它将输入的数据表示成一个连续的数值空间中的点。

文本Embedding

将文字或短语转换成数值向量的过程。

这些向量捕捉了单词的语义特征，例如意义、上下文关系等。

图像Embedding

对于图像，Embedding过程通常涉及使用卷积神经网络（CNN）等模型来提取图像中的特征，并将这些特征转换为一个高维向量。

这样的向量可以代表图像的内容、风格、色彩等信息，从而用于图像识别、分类或检索任务。

声音Embedding

在声音处理领域，Embedding通常指的是将音频信号转换为一个表示其特征的向量，这包括音调、节奏、音色等。

通过这样的转换，可以进行声音识别、音乐生成等任务。

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者！