会话式搜索
启用此功能后,搜索结果将提供给一个IBM watsonx生成式人工智能模型,该模型会针对用户的问题生成对话式回复。
使用对话式搜索与搜索集成,例如 Elasticsearch、 Milvus ,或使用自定义服务,帮助您的助手从排名最高的查询结果中提取答案,并返回给用户文本响应。
watsonx生成式人工智能模型目前仅在达拉斯和法兰克福地区托管。 默认情况下,除 "Frankfurt外,所有区域的助手都使用 "Dallas区域的模型。 Frankfurt区域的助理使用 "Frankfurt区域托管的模型。
准备工作
您必须配置搜索集成以启用会话搜索功能。 有关配置Elasticsearch集成的更多信息,请参阅Elasticsearch搜索集成设置。
启用对话式搜索
您可以启用对话式搜索,准确回答客户的询问。 此外,您还可以通过设置引用标题来启用引用,该标题可提供源内容的参考文献列表,而助手就是从这些参考文献中获取回复的。 您可以在对话回复和引文之间看到引文标题。
要启用对话式搜索,请执行以下步骤:
转到搜索整合窗口。
将对话搜索切换设置为 "
On。利用语境感知功能,根据语境选择会话搜索类型。
单轮对话式搜索
对于只需要当前输入即可检索搜索结果并生成答案的上下文,请选择单次输入。
使用整个对话进行会话搜索
对于与上下文有关的问题,可能会考虑到以前的输入,请选择 "整个对话"。
整个对话使用整个会话继续进行。 这可能会让人想起不再属于谈话范围的话题。
在 "定义引文标题文本"中,键入 "
How do we know?。
定义引文标题文本仅在对话搜索切换至 "On时启用。
网络聊天集成不支持引用标题功能。
在搜索配置部分配置检索置信度阈值、 生成的响应长度和响应置信度阈值的值。
检索置信度阈值决定了模型从知识库或数据库中检索信息所需的最低置信度。 它可以确保助手只获取相关信息,从而提高回复的准确性和可靠性。 如需了解更多信息,请参阅 “检索置信度评分 ”。
对话式搜索中生成的回复长度是指允许模型在回复用户查询时生成的最大字符或单词数。 有关更多详细信息,请参阅 “调整生成的响应长度 ”。
响应置信度阈值设定了模型生成响应所需的最低确定性水平。 这一设置可确保助手只在对其输出结果有高度信心时才做出响应,从而提供准确可靠的答案。 如需了解更多信息,请参阅 “响应置信度评分 ”。
您可以配置 "引用 "部分显示的引用数量。 有关引用的更多详情,请参阅“引用”部分。
单击保存。
在对话式搜索中调整生成回复的长度
助手中的生成回复长度功能可自定义回复长度,以最大程度满足您的需求。
您可以选择三种回复长度:简洁、适中和冗长。 该功能可调整助手回复的长度,以更好地满足您在对话搜索中的需求。 默认设置为 "适中",但也可根据需要进行更改:
响应长度 | 描述 |
|---|---|
| 回复较短,直奔主题,非常适合直接询问。 |
| 答复既详细又简洁,适合大多数一般性询问。 |
| 答复可提供更详细、更全面的信息,适用于复杂的查询或需要详尽解释的情况。 |
响应长度特性会影响watsonx Assistant生成的响应的平均长度。 虽然它的目标是与指定长度相匹配,但由于用户输入的复杂性和大语言模型(LLM)的固有局限性,实际响应会有所不同。
配置助手使用对话式搜索
启用会话搜索后,必须配置搜索路由设置,以便在没有与用户回复匹配的操作时将助手回复路由到会话搜索。 有关搜索路由配置的更多信息,请参阅配置无操作匹配时的搜索路由。 要将助手配置为针对特定主题或操作的会话搜索路由,可以将搜索添加为新操作或现有操作的一个步骤。
当助手没有收到Elasticsearch响应用户查询的搜索结果,或与Elasticsearch的连接失败时,助手会向用户发送一条失败消息。 您可以在搜索集成设置中配置无搜索结果和连接失败的失败消息。
测试对话式搜索
您可以在操作预览、预览页面或使用预览链接测试会话搜索。
在本例中,用户询问 "Tell me about a custom extension。 当对话搜索为 "Off时,搜索结果将从您的知识库中提取。 在这种情况下,答案将作为与自定义扩展相关的卡片列表返回。

当对话搜索为 "On时,同样的搜索结果会从知识库中提取。 结果将被传递给IBM watsonx生成式人工智能模型。 该模型会以文本回复的形式对用户的问题进行对话式回答,内容涉及自定义扩展。

调试对话式搜索中的故障
如果对话式搜索失败,您可能需要查看系统API发送和返回的详细信息,以调试问题。
更多信息,请参阅对话式搜索故障排除
对话式搜索的流式响应
对话式搜索的流式响应使用watsonx.ai功能,在您的助手中提供连续、实时的响应。 默认情况下,网络聊天和助手预览面板禁用了流式响应。
通过使用流式响应支持功能,可以减少响应的等待时间。
要启用流式响应,请执行以下操作:
转到主页>预览>自定义网络聊天。
单击 "样式"选项卡。
将流媒体切换按钮设置为 "
On。单击保存并退出。