打开AI世界的大门

奔赴山海,保持热爱

在 Markdown 中,你可以使用 Unicode 字符Emoji 简码 来插入各种常用图标。以下是一些常见的分类整理,适用于文档、链接、提示等场景:


📌 常用图标分类

阅读全文 »

基本原理剖析

Text2SQL 的实现就是基于 RAG 技术 ,根据 Query 内容,从数据库中查询与 Query 有关的表 DDL 信息,然后将检索到的表 DDL 一起嵌入到预设的 Prompt 模板中,将 Prompt 和 Query 输入到 LLM 中,以生成最终的 SQL。

阅读全文 »

1. 大语言模型(LLM)的局限性

  1. LLM 容易出现“幻觉”现象,即生成不准确或虚构的内容
  2. LLM 的上下文窗口有限,无法处理过长的文本。
  3. LLM 存在隐私泄露的风险,也就是数据安全问题。

为了弥补这些不足 RAG(检索增强生成)技术应运而生,也就是最早的Naive(朴素的) RAG或者说Vanilla(普通的) RAG

使用如BM25(TF-IDF)或者Dense(Embedding) Retrieval的方式。

2. RAG技术在适应复杂应用场景和不断发展的技术需求中经历了从Naive RAG ,到流程优化的 Advanced RAG,再到更具灵活性的 Modular RAG 的演变。

阅读全文 »

之前的课程我们已经学完了RAG的完整流程,这里先做个回顾:

  • 索引阶段

    • 文档解析技术

    • 分块策略

      • 固定大小分块、重叠分块、递归分块、文档特定分块、语义分块、混合分块
    • 嵌入模型选择

  • 检索阶段

    • 向量数据库选择

    • 混合检索

      • 关键词检索

      • 向量检索

    • 重排序

  • 生成阶段

    • 大语言模型选择

    • 提示词工程

阅读全文 »
0%