在使用LLM进行结构化信息提取过程中,提示词的设计非常重要。主要表现在:
- 好的提升词可以提升LLM结构化信息的提取准确性
- 提示词的设计往往会影响后期提示词的维护和扩展。
1.结构化标签设计
为了使用提示词驱动LLM提取结构化标签信息,标签信息需包含在提示词当中。为了提升结构后标签信息的准确性和后期的扩展性,需对结构化标签进行设计。
在《LLM结构化信息提取能力建设进阶 – 以提取营销线索为例》中,我们将LLM提取的标签信息设置为如下的六元组。
其中静态属性往往包含在设计的提示词当中,而动态属性常是LLM推理的结果。
为了提升LLM提取结果的准确率和限制整个提示词的长度,对于标签静态属性来说,名称和描述往往是必须的,其他的静态属性非必须。
2.LLM标签管理
基于标签结构,可实现不同标签的合理管理。同时可满足基于不同的标签组合形成不同的提示词,从而获取不同的提取结果。
3.如何基于标签构建提示词
基于以上的标签结构,可按照如下步骤构建LLM的提示词。
第一步:确定角色和提取的范围:提取范围基于标签名称、标签描述、值范围进行确定
第二步:确定提取步骤(非必须)
第三步:提供提取标签的案例(非必须
第四步:提供要提取的对话文本
例如:
该构建方法可随着选择的标签不同而形成不同的提示词,从而获取我们想要提取的结果。