背景信息

Dify 是一款面向开发者与企业的 AI 应用开发平台,致力于简化大语言模型(LLM)集成与开发流程,助力用户高效构建智能化应用。腾讯云向量数据库作为其官方支持的向量数据库组件,凭借高效的[向量检索与稀疏向量能力,为 Dify 平台上的 RAG(检索增强生成)应用提供底层支持,显著提升语义理解与检索精度。用户可将文档、图表等数据向量化存储,结合 Dify 的 LLM 交互逻辑,直接搭建智能知识库,实现精准问答与知识检索。

准备工作

\1. 选型并购买向量数据库实例。

\2. 在向量数据库中,创建数据库。

\3. 客户端运行环境准备。

类别 要求
地域与网络环境 使用腾讯云外网访问,需手动配置白名单,开通外网功能。具体操作,请参见 开启外网访问。使用腾讯云内网方式访问,确保购买的 CVM 所处地域与向量数据库为同地域,且 VPC 和安全组策略能正常连通向量数据库实例。
客户端 使用腾讯云外网方式,可使用本地客户端操作环境即可。使用腾讯云内网方式,推荐选择 云服务器 CVM,如 SA3.LARGE8、SA3.2XLARGE16等规格。

\4. 登录客户端运行环境,安装 Docker。具体操作,请参见 Docker Compose 部署。若选择 云服务器 CVM,请参见 搭建 Docker,快速安装与 CVM 操作系统版本适配的 Docker 环境。

\5. 克隆 Dify 源代码至本地环境。

\6. 准备知识库数据源文本。本示例以腾讯云向量数据库的官网文档为例搭建,存放知识库文件 demo_file1.pdfdemo_file2.md 于本地。

快速搭建

\1. 登录客户端环境,进入克隆的 dify 目录的 docker 文件。

\2. 执行cp .env.example .env 拷贝一份配置文件。

\3. 使用 vim .env 打开配置文件,将配置文件中的 VECTOR_STORE 修改为 tencent,并配置向量数据库信息。

img

配置参数 参数解释 配置说明
TENCENT_VECTOR_DB_URL 向量数据库实例的内网地址或外网地址。建议使用内网方式。 请登录 向量数据库控制台,在实例详情页面网络信息区域直接复制访问地址。具体操作,请参见 查看实例信息
TENCENT_VECTOR_DB_API_KEY 向量数据库实例 API 密钥,用于进行身份认证。 请登录 向量数据库控制台,在密钥管理页面直接复制密钥。具体操作,请参见 密钥管理
TENCENT_VECTOR_DB_TIMEOUT 连接超时时间。 -
TENCENT_VECTOR_DB_USERNAME 指定访问向量数据库的用户名。 具体信息,请参见账号与权限管理
TENCENT_VECTOR_DB_DATABASE 指定已准备的向量数据库名。 Database 命名要求如下:只能使用英文字母,数字,下划线_、中划线-,并以英文字母开头。长度要求:[1,128]。
TENCENT_VECTOR_DB_SHARD 指定创建集合所需的分片数量。 取值类型:uint64。取值范围:[1,100]。例如:5。配置建议:在搜索时,全部分片是并发执行的,分片数量越多,平均耗时越低,但是过多的分片会带来额外开销而影响性能。单分片数据量建议控制在300万以内,例如500万向量,可设置2个分片。如果数据量小于300万,建议使用1分片。系统对1分片有特定优化,可显著提升性能。
TENCENT_VECTOR_DB_REPLICAS 指定创建集合的副本数量。 取值类型:uint64。取值范围如下所示。搜索请求量越高的索引,建议设置越多的副本数,避免负载不均衡。单可用区实例:0。两可用区实例:[1,节点数-1]。三可用区实例:[2,节点数-1]。
TENCENT_VECTOR_DB_ENABLE_HYBRID_SEARCH 指定是否开启混合检索。 true:开启。

\4. 在浏览器地址栏中,输入部署的服务器的 IP 地址,进入 Dify 平台并完成账号创建,如下图所示。

img

\5. 在 Dify 工作空间上方,选择知识库,并单击创建知识库,如下所示。

img

\6. 在创建知识库的导航页面,上传知识库的数据源文本,单击下一步

img

\7. 在文本分段与清洗指引页面,设置分段规则,Embedding 模型以及检索方式。

7.1 在分段设置区域,选择父子分段,保持默认配置。

img

7.2 在索引方式区域,选择高质量,在 Embedding 模型的下拉列表,选择嵌入模型。

说明:

第一次使用,在 Embedding 模型的下拉列表,单击模型设置,可在模型供应商页面,选择所需的模型并安装。

img

7.3 在检索设置区域,选择混合检索,并根据页面指引,选择检索结果排序方式。

说明:

Dify 已支持使用腾讯云向量数据库自带的稠密向量 + 稀疏向量 实现混合检索,通过双路检索的方式,整体提升 RAG 应用的效果,实现精准问答与知识检索。

img

\8. 单击保存并处理,在如下图所示页面,知识库默认以导入的数据源文件命名,等待数据源文件嵌入完成,则知识库创建成功。

img

\9. 在Dify工作空间上方,选择工作室,并单击创建空白应用,单击创建。如下图所示。

img

\10. 在创建空白应用页面,选择应用类型为聊天助手,并在应用名称 & 图标的输入框,输入应用名称,如下所示。

在这里插入图片描述

\11. 在创建的工作室中,在知识库区域,单击添加,导入新建的知识库(本示例以腾讯云向量数据库的官网文档为例搭建,知识库文件 demo_file1.pdf),便可以在下方输入框,输入具体问题进行知识问答,如下图所示。

img

如何学习AI大模型 ?

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈

(👆👆👆安全链接,放心点击)

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。(全套教程文末领取哈)
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型,我这份资料就可以无偿分享给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈

(👆👆👆安全链接,放心点击)
Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐