📢 转载信息
原文链接:https://simonwillison.net/2025/Oct/4/drew-on-dspy/#atom-everything
原文作者:Simon Willison’s Weblog
重磅:让大模型自己写提示词——深入理解DSPy在复杂AI管道中的应用
最近,我发现了一段关于 DSPy 的绝佳讲解。这段时长半小时的演讲来自 Drew Breunig 在最近的 Databricks Data + AI Summit 上的分享,它比我之前看到的任何解释都更清晰地阐述了 DSPy 能够解决哪些难题。
如果你想看演讲的文字版本,可以访问 Drew 的 博文。
GIS领域的终极挑战:POI数据融合(Conflation)
Drew 参与的 Overture Maps 项目,其核心任务是将来自众多供应商的兴趣点(POI)数据整合起来,创建一个统一的 POI 数据库。这正是地理信息系统(GIS)中一个出了名难搞的任务——数据融合(Conflation),即对多源数据集进行去重和合并。
DSPy如何优化本地小模型的性能
Drew 的实践案例非常具有代表性:他使用一个低成本的本地模型 Qwen3-0.6B,来比对多达7000万条地址记录,以识别匹配项。例如,判断地址为 Place(address="3359 FOOTHILL BLVD", name="RESTAURANT LOS ARCOS")
和 Place(address="3359 FOOTHILL BLVD", name="Los Arcos Taqueria'")
是否指向同一个地点。
提示词优化立竿见影
DSPy 在这里的核心作用是:优化用于这个小型模型的提示词(Prompt)。Drew 使用了 GPT-4.1 和 dspy.MIPROv2 优化器,生成了一个 700 个 token 的优化提示词,结果令人震惊:数据匹配的评分从初始的 60.7% 猛增到了 82%!
为什么要做提示词优化?
Drew 总结道:采用这种提示词优化管道的好处在于,如果未来有其他模型能用定制的优化提示词获得更高的分数,我们可以非常轻松地评估和切换到这些新模型,而无需手动进行大量的试错和优化工作。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区