打开AI世界的大门

奔赴山海,保持热爱

文档数据(Documents)经过解析后,通过分块技术将信息内容划分为适当大小的文档片段(chunks),从而使 RAG 系统能够高效处理和精准检索这些片段信息。

选择适合特定场景的分块策略是提升 RAG 系统召回率的关键。

  • 为什么说分块很重要?

    • 分块的目标在于确保每个片段在保留核心语义的同时,具备相对独立的语义完整性,从而使模型在处理时不必依赖广泛的上下文信息,增强检索召回的准确性

    • 分块的重要性在于它直接影响 RAG 系统的生成质量。首先,合理的分块能够确保检索到的片段与用户查询信息高度匹配,避免信息冗余或丢失。

    • 好的分块有助于提升生成内容的连贯性,精心设计的独立语义片段可以降低模型对上下文的依赖,从而增强生成的逻辑性与一致性。

    • 分块策略的选择还会影响系统的响应速度与效率,模型能够更快、更准确地处理和生成内容。

    • 分块策略最大的挑战在于确定分块的大小。

      阅读全文 »

做AI场景的知识分享,尤其是涉及头部的智能体平台,我前面主要介绍了Dify的使用,这里就不得不提这两天各种关于 Manus 炸裂的新闻。

  • 首先说清楚,我没拿到邀请码,申请的时候网站还崩了,所以我在官网看了下效果并查看了其他博主演示视频。

  • 说说我的想法

    • 第一点,Manus如果公测或者正式发布,效果不打折扣,那么它确实能从本质上帮助普通用户几乎没有门槛的使用AI技术。带来的可能是很多领域将实现技术平权。

    • 再来说第二点,很快国内的大厂应该就会推出同类产品,市场将出现Agent技术的一次跃升。

      • 从目前头部的几个集成平台说起:
      • 字节的扣子
        • 积累了大量的开发者和插件,再加上火山引擎算力支持,完全有能力实现弯道超车。
      • Dify
        一个可以私有化部署的开源框架,已经有很多企业和个人搭建了自己的AI平台,整合出一个通用Agent也是早晚得事。
      • 再者还有腾讯的元宝或者说元器平台也是有机会的。
      • 这里面因为Manus这种产品形态对算力要求太高了,所以大厂有资源不会放过这个机会。
阅读全文 »

RAG索引流程中面临的文档解析任务

1. 文档解析现状

  • 文档解析技术的本质在于将格式各异、版式多样、元素多种的文档数据,包括段落、表格、标题、公式、多列、图片等文档区块,转化为阅读顺序正确的字符串信息。
  • 高质量的文档解析能够从各种复杂格式的非结构化数据中提取出高精准度的信息,对 RAG 系统最终的效果起决定性的作用。
  • RAG应用场景中涉及的数据类型通常有:PDF、TXT、Word、PPT、Excel、CSV、Markdown、XML、HTML以及关系型和非关系型数据库等,这里面最常见也是最难的就是PDF的解析。
  • PDF 文档往往篇幅巨大、页数众多,且企业及专业领域 PDF 文件数据量庞大,因此文档解析技术还需具备极高的处理性能,以确保知识库的高效构建和实时更新。
  • image-20250307075848111
阅读全文 »


一. 在 Hexo 博客中无法渲染数学公式,通常是因为 Hexo 默认不支持 LaTeX 公式渲染。你需要安装插件并配置 Hexo 以支持数学公式。以下是解决方案:


阅读全文 »

扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)是生成模型中的两种重要方法,广泛应用于图像、文本和音频生成任务。它们各有特点,适用于不同的场景。


阅读全文 »

Postgres.new 和 Vanna 是两个不同的工具,分别用于不同的场景和目的。以下是它们的对比:


阅读全文 »

暂时推荐这两个机场(在没有魔法的情况下网站可以登录)

1. 费用自己看着选,贵的速率和稳定性都好一些

2. 如果大家有好的机场也可以给我推荐一下(最好在没有魔法时可以登录)

阅读全文 »

从 0 到 1 快速搭建 RAG 应用

  • 技术框架与选型

    • RAG 技术框架:LangChain

      • LangChain 是专为开发基于大型语言模型(LLM)应用而设计的全面框架,其核心目标是简化开发者的构建流程,使其能够高效创建 LLM 驱动的应用。
    阅读全文 »
0%