首页 » 智能科技 » 设计图AI搜索产品设计轨范(SOP)

设计图AI搜索产品设计轨范(SOP)

德才装饰股份通讯 2025-01-06 0

扫一扫用手机浏览

文章目录 [+]

实现一个垂直领域的AI搜索引擎须要多个步骤和细致的流程。
以下是一个标准操作程序(SOP):

核心问题确定

设计图AI搜索产品设计轨范(SOP) 设计图AI搜索产品设计轨范(SOP) 智能科技

1. Source List

设计图AI搜索产品设计轨范(SOP) 设计图AI搜索产品设计轨范(SOP) 智能科技
(图片来自网络侵删)

选择数据源时,应确保其覆盖目标垂直领域的紧张信息渠道。
可以包括:

在线数据库:如PubMed(医学)、IEEE Xplore(技能)、arXiv(学术论文)等。

网站和平台:如Stack Overflow(编程问答)、GitHub(代码库)、Hacker News(技能新闻)等。

新闻和媒体:如TechCrunch、Wired、MIT Technology Review等。

2. Answer Prompt

利用以下模板回答:

根据您的问题,我们找到以下干系信息:

- 结果1:{result1}

- 结果2:{result2}

- 结果3:{result3}

如果须要更多详细信息,请访问供应的链接。

3. LLM Model

选择一个强大的措辞模型,如:

OpenAI GPT-4

Google BERT

Baidu Wenxin Yiyan

搜索前Query Rewrite

1. 判断当前Query是否须要Retrieve

结合用户的历史和高下文,确定当前查询是否须要新的数据检索。

如果用户讯问的是之前已经回答过的问题,可以直接调用缓存结果。

如果是新问题,连续下一步。

2. 指代消解

将代词更换为详细的名词:

例如:“它是什么?”更换为“AI搜索引擎是什么?”

3. 提取关键词

从处理后的query中提取关键词,用于检索。

例如:“AI搜索引擎的事情事理”提取为“AI 搜索引擎 事情事理”。

实现一个垂直领域的AI搜索引擎须要多个步骤和细致的流程。
以下是一个标准操作程序(SOP):

核心问题确定

1. Source List

选择数据源时,应确保其覆盖目标垂直领域的紧张信息渠道。
可以包括:

在线数据库:如PubMed(医学)、IEEE Xplore(技能)、arXiv(学术论文)等。

网站和平台:如Stack Overflow(编程问答)、GitHub(代码库)、Hacker News(技能新闻)等。

新闻和媒体:如TechCrunch、Wired、MIT Technology Review等。

2. Answer Prompt

利用以下模板回答:

标准提示词模板:

markdown

复制代码

根据您的问题,我们找到以下干系信息: - 结果1:{result1} - 结果2:{result2} - 结果3:{result3} 如果须要更多详细信息,请访问供应的链接。

3. LLM Model

选择一个强大的措辞模型,如:

OpenAI GPT-4

Google BERT

Baidu Wenxin Yiyan

搜索前Query Rewrite

1. 判断当前Query是否须要Retrieve

结合用户的历史和高下文,确定当前查询是否须要新的数据检索。

如果用户讯问的是之前已经回答过的问题,可以直接调用缓存结果。

如果是新问题,连续下一步。

2. 指代消解

将代词更换为详细的名词:

例如:“它是什么?”更换为“AI搜索引擎是什么?”

3. 提取关键词

从处理后的query中提取关键词,用于检索。

例如:“AI搜索引擎的事情事理”提取为“AI 搜索引擎 事情事理”。

RAG(Retrieval-Augmented Generation)流程

1. 获取检索结果

利用query + keywords作为入参,从source list获取检索结果。

在线API检索:如Google Scholar API、Twitter API等。

本地索引检索:利用预先构建的索引数据库。

2. 检索结果聚合重排

对检索到的结果进行聚合,并根据干系性进行重排(reranking)。

3. 获取重排后的Top_k内容详情

选择排名靠前的结果,提取详细内容。

4. 天生回答

利用预设的提示词模板,将检索到的内容和历史作为context,天生回答。

紧张工程量

1. 对内容源Build Index

对内容源进行索引构建:

增量构建:通过source的搜索框获取最新数据。

存量构建:利用搜索引擎网页快照获取历史数据。

2. 更新Source权重

预置权重:根据数据源的主要性和质量预设初始权重。

动态更新:根据用户点击和反馈调度权重。

3. 多信息源重排

利用高效的重排框架,如FlashRank,对多信息源的结果进行快速重排。

4. 构建Chunk内容池

对检索到的内容进行chunk拆分。

存储到向量数据库,方便相似度匹配和高下文要求。

5. 构建关键词库

定期剖析历史query,提取热搜关键词。

构建关键词库,命中关键词库的query利用缓存结果

标签:

相关文章

让低频嗨爆你 JVC HA-XP50BT耳机评测

让低频嗨爆你 JVC HA-XP50BT耳机评测说道低频,我们常常会遐想到路边的10元山寨“魔音”耳机。无论从任何角度,山寨耳机真...

智能科技 2025-01-08 阅读0 评论0

刨根问底 电子狗的组成部分有哪些?

电子狗是什么东东电子狗别名安全预警仪,是车载电子测速装置,紧张是利用GPS定位和雷达旗子暗记的检测,来为车主提醒限速电子眼或移动测...

智能科技 2025-01-08 阅读0 评论0

朱砂:再造辰砂饰品 天然辰砂 辰砂处理

紫金砂2-区分天然辰砂和辰砂处理:依据是是否改变了商品原始形状。晶体砂3-当有害身分高的时候不能通过质检。天然辰砂粉和还原辰砂那么...

智能科技 2025-01-08 阅读0 评论0