📢 转载信息
原文链接:https://machinelearningmastery.com/prompt-engineering-time-series-analysis/
原文作者:Iván Palomares Carrascosa
在本文中,您将学习到实用的提示工程模式,这些模式能使大型语言模型在时间序列分析和预测中变得有用且可靠。
我们将涵盖的主题包括:
- 如何构建时间上下文并提取有用的信号
- 如何将LLM的推理能力与经典统计模型相结合
- 如何为预测、异常值检测和领域约束构建数据和提示的结构
话不多说,让我们开始吧。
时间序列分析的提示工程
图片来源:编辑
引言
听起来可能很奇怪,但大型语言模型(LLMs)可以被应用于数据分析任务,包括时间序列分析等特定场景。关键在于将您的提示工程技能正确地转化为特定的分析场景。
本文概述了七种可用于利用LLMs进行时间序列分析任务的提示工程策略。
除非另有说明,这些策略的描述都围绕一个零售销售数据场景,具体来说,考虑一个包含每日销售随时间变化的双变量时间序列数据集进行分析。
1. 情景化时间结构
首先,一个有效的提示要能获得有用的模型输出,就应该帮助模型理解时间序列数据集的时间结构。这包括可能提及的上升/下降趋势、季节性、已知的周期(如促销或假日)等等。这种上下文信息将帮助您的LLM将时间波动解释为——顾名思义——波动,而不是噪声。总之,在提示附带的上下文中清晰地描述数据集的结构,通常比在提示中加入复杂的推理指令更有价值。
示例提示:
“这是过去 365 天的每日销售量(单位)。数据显示出每周的季节性(周末销量更高)、一个逐渐增加的长期趋势,以及因发薪日促销而在每月月底出现的峰值。请利用这些知识来预测接下来的 30 天。”
2. 特征与信号提取
与其要求模型直接从原始数字进行预测,不如提示它首先提取一些关键特征?这可以包括潜在模式、异常值和相关性。要求LLM提取特征和信号,并将其纳入提示(例如,通过汇总统计数据或分解),有助于揭示未来预测或波动背后的原因。
示例提示:
“根据过去 365 天的销售数据,计算日均销售额、标准差,识别出销量超过平均值加上两倍标准差的任何天数(即潜在的异常值),并指出任何重复出现的周或月模式。然后解释可能导致高销量日或低谷的原因,并标记任何不寻常的异常情况。”
3. 混合 LLM + 统计工作流
让我们面对现实:单独使用LLM在需要数值精度和捕获时间序列中时间依赖性的任务上通常会遇到困难。因此,简单地将它们与经典统计模型结合使用是获得更好结果的方案。这种混合工作流如何定义?诀窍在于将LLM的推理能力——高层次的解释、假设形成和上下文理解——与ARIMA、ETS或其他定量模型一起注入。
例如,LeMoLE(LLM增强的线性专家混合模型)就是一个混合方法的实例,它通过提示生成的特征来丰富线性模型。
结果融合了上下文推理和统计严谨性:兼顾两者的最佳优势。
4. 基于模式的数据表示
虽然原始时间序列数据集通常是传递给LLM输入的格式不佳的格式,但使用JSON或紧凑表格等结构化模式可能是让LLM更可靠地解释这些数据的关键,正如多项研究所证明的那样。
要与提示一起传递的示例 JSON 片段:
附带 JSON 数据的提示:
“根据上述 JSON 数据和元数据,分析时间序列并预测接下来的 30 天销售情况。”
5. 提示式预测模式
在提示中设计和正确构建预测模式——例如短期与长期预测范围,或模拟特定的“假设”场景——可以帮助引导模型产生更有用的响应。这种方法对于生成您所请求分析的高度可操作的见解非常有效。
示例:
6. 异常检测提示
这个更具任务特定性,重点在于正确构建提示,以帮助LLM不仅进行预测,而且在与统计方法结合时还能检测异常值,并推理其可能的原因,甚至提出应调查的事项。关键在于,首先使用传统的时间序列工具进行预处理,然后提示模型对发现的结果进行解释。
示例提示:
“使用销售数据 JSON,首先标记出任何销售额偏离周平均值超过两倍周标准差的日期。然后,针对每个标记的日期,解释可能的原因(例如,缺货、促销、外部事件),并建议是否需要调查(例如,检查库存日志、营销活动、商店客流量)。”
7. 领域注入推理
领域知识,如零售季节性模式、假日效应等,可以揭示宝贵的见解,将其嵌入到提示中可以帮助LLM执行更有意义且可解释的分析和预测。这归结为利用“数据集上下文”的关联性,无论是在语义上还是在领域特定方面,作为引导模型推理的灯塔。
这样的提示可以帮助LLM更好地预测月末峰值或因假日折扣导致的销量下降:
“这是某连锁零售店的每日销售数据。销售额通常在月末达到高峰(客户收到薪水),在公共假日下降,在促销活动期间增加。此外,偶尔会出现某些 SKU 的库存短缺导致的销量下滑。在分析和预测时,请利用这些领域知识。”
总结
本文描述了七种不同的策略,这些策略在很大程度上是基于并得到了最新研究的支持,旨在使LLM辅助的时间序列分析和预测任务的提示更有效。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区