设计图AI搜索产品设计轨范（SOP）

文章目录 [+]

实现一个垂直领域的AI搜索引擎须要多个步骤和细致的流程。
以下是一个标准操作程序（SOP）：

核心问题确定

设计图AI搜索产品设计轨范（SOP）设计图AI搜索产品设计轨范（SOP）智能科技

1. Source List

（图片来自网络侵删）

选择数据源时，应确保其覆盖目标垂直领域的紧张信息渠道。
可以包括：

在线数据库：如PubMed（医学）、IEEE Xplore（技能）、arXiv（学术论文）等。

网站和平台：如Stack Overflow（编程问答）、GitHub（代码库）、Hacker News（技能新闻）等。

新闻和媒体：如TechCrunch、Wired、MIT Technology Review等。

2. Answer Prompt

利用以下模板回答：

根据您的问题，我们找到以下干系信息：

- 结果1：{result1}

- 结果2：{result2}

- 结果3：{result3}

如果须要更多详细信息，请访问供应的链接。

3. LLM Model

选择一个强大的措辞模型，如：

OpenAI GPT-4

Google BERT

Baidu Wenxin Yiyan

搜索前Query Rewrite

1. 判断当前Query是否须要Retrieve

结合用户的历史和高下文，确定当前查询是否须要新的数据检索。

如果用户讯问的是之前已经回答过的问题，可以直接调用缓存结果。

如果是新问题，连续下一步。

2. 指代消解

将代词更换为详细的名词：

例如：“它是什么？”更换为“AI搜索引擎是什么？”

3. 提取关键词

从处理后的query中提取关键词，用于检索。

例如：“AI搜索引擎的事情事理”提取为“AI 搜索引擎事情事理”。

实现一个垂直领域的AI搜索引擎须要多个步骤和细致的流程。
以下是一个标准操作程序（SOP）：

核心问题确定

1. Source List

选择数据源时，应确保其覆盖目标垂直领域的紧张信息渠道。
可以包括：

在线数据库：如PubMed（医学）、IEEE Xplore（技能）、arXiv（学术论文）等。

网站和平台：如Stack Overflow（编程问答）、GitHub（代码库）、Hacker News（技能新闻）等。

新闻和媒体：如TechCrunch、Wired、MIT Technology Review等。

2. Answer Prompt

利用以下模板回答：

标准提示词模板：

markdown

复制代码

根据您的问题，我们找到以下干系信息： - 结果1：{result1} - 结果2：{result2} - 结果3：{result3} 如果须要更多详细信息，请访问供应的链接。

3. LLM Model

选择一个强大的措辞模型，如：

OpenAI GPT-4

Google BERT

Baidu Wenxin Yiyan

搜索前Query Rewrite

1. 判断当前Query是否须要Retrieve

结合用户的历史和高下文，确定当前查询是否须要新的数据检索。

如果用户讯问的是之前已经回答过的问题，可以直接调用缓存结果。

如果是新问题，连续下一步。

2. 指代消解

将代词更换为详细的名词：

例如：“它是什么？”更换为“AI搜索引擎是什么？”

3. 提取关键词

从处理后的query中提取关键词，用于检索。

例如：“AI搜索引擎的事情事理”提取为“AI 搜索引擎事情事理”。

RAG（Retrieval-Augmented Generation）流程

1. 获取检索结果

利用query + keywords作为入参，从source list获取检索结果。

在线API检索：如Google Scholar API、Twitter API等。

本地索引检索：利用预先构建的索引数据库。

2. 检索结果聚合重排

对检索到的结果进行聚合，并根据干系性进行重排（reranking）。

3. 获取重排后的Top_k内容详情

选择排名靠前的结果，提取详细内容。

4. 天生回答

利用预设的提示词模板，将检索到的内容和历史作为context，天生回答。

紧张工程量

1. 对内容源Build Index

对内容源进行索引构建：

增量构建：通过source的搜索框获取最新数据。

存量构建：利用搜索引擎网页快照获取历史数据。

2. 更新Source权重

预置权重：根据数据源的主要性和质量预设初始权重。

动态更新：根据用户点击和反馈调度权重。

3. 多信息源重排

利用高效的重排框架，如FlashRank，对多信息源的结果进行快速重排。

4. 构建Chunk内容池

对检索到的内容进行chunk拆分。

存储到向量数据库，方便相似度匹配和高下文要求。

5. 构建关键词库

定期剖析历史query，提取热搜关键词。

构建关键词库，命中关键词库的query利用缓存结果

标签：结果须要

设计图AI搜索产品设计轨范（SOP）

相关文章

36氪独家｜「环宇智行」完成5000万元A轮融资将构造域控制器芯片自立研发

铂力特：推出全新进级的BLT-S450设备助力规模化批量分娩

让低频嗨爆你 JVC HA-XP50BT耳机评测

刨根问底电子狗的组成部分有哪些？

“爆改”风吹进办公室？别让你的工位“火”起来

朱砂:再造辰砂饰品天然辰砂辰砂处理

最近发表

36氪独家｜「环宇智行」完成5000万元A轮融资将构造域控制器芯片自立研发

好消息！高级职称证书可以网上打印了！

工行衢州衢江支行成功落地辖内首笔“单一窗口”电子关税保函营业

SK2产品全套运用效果才能倍增！明星产品运用感分享

2023年全球市场锂离子电池组装设备市场现状分析与成久远景猜测

电子稳定性系统 (ESP )全国产化电子元件推荐筹划

铂力特：推出全新进级的BLT-S450设备助力规模化批量分娩

矿物精细加工｜高纯石英常见的选矿提纯工艺

奔驰全新一代GLC曝光！外不雅观周全翻新/明年首发

聊聊高德地图这款产品

热门文章

标签列表