- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据库系统的?然语?交互?法探索FromDatabaseQuerytoNaturalLanguageQuery范元凯复旦?学博?后研究员2024.4.20
汇报提纲背景介绍生成-排序的NL2SQL翻译方法统一的NL2SQL优化框架大模型与NL2SQL模型交互式NL2SQL总结
汇报提纲背景介绍生成-排序的NL2SQL翻译方法统一的NL2SQL优化框架大模型与NL2SQL模型交互式NL2SQL总结
智能化数据分析一直以来是企业和研究机构追求的目标,通过这种分析可以更有效地挖掘数据中的价值,做出更明智的决策背景“ThefutureofBIisConversational.”-GartnerThere’sagrowingdisconnectbetweenbusinessleadersexpectingadata-drivenorganization,andemployeeswhoeitheraren’tcomfortablequestioningmetricsorleveragingdataanalysistodriveactions./solutions/ai-analytics/augmented-analytics数据分析成为实践中的一个主要瓶颈
NL2SQL的核心是通过语义解析理解自然语言查询,并将其转换为对应的数据库查询语句,可以在给定的数据库上进行数据查询操作NL2SQL技术的出现
NL2SQL需要解决的问题自然语言理解(NLUnderstanding)复杂语言中语义的解析视图剪枝(SchemaPruning)快速过滤不相关的数据视图结构视图链接(SchemaLinking)自然语言查询中提及或涉及哪些视图元素约束解码(ConstrainedDecoding)基于SQL语法的有效生成过程
NL2SQL难在哪?复杂的数据模型复杂的查询语言表达形式复杂的数据库查询操作海量数据的有效访问…
使用seq2seq框架实现o 分别在编码器侧、解码器侧进行模型设计基于深度学习的NL2SQL?法输入编码器解码器输出SQL查询自然语言问题数据视图BERT关系感知的Transformer架构中间表示(NatSQL)Coarse-fine方法RAT-SQL+NatSQLSQL查询自然语言问题数据视图GRAPPA关系感知的Transformer架构中间表示(线性代数)BottomUp解析器SmBoP/events/datahour/datahour-natural-language-to-sql-translation-the-challenges-evolution-and-future
开箱即用的大模型在自然语言和代码生成上预训练的基础大型语言模型微调后的大模型在特定任务上微调后的大模型,例如代码/SQL(CodeLlama,SQLCoder等)利用精心设计的提示信息通过上下文学习(In-contextlearning)实现NL2SQL过程LLM即NL2SQL模型
LLM即NL2SQL模型/abs/2402.16347
汇报提纲背景介绍生成-排序的NL2SQL翻译方法统一的NL2SQL优化框架大模型与NL2SQL模型交互式NL2SQL总结
大部分传统的翻译方法将NL2SQL视为一种语言翻译任务,并依赖通用的语言模型实现更好的自然语言的语义理解局限性:通用语言模型很难利用世界知识理解每个数据库中存在的独特结构和语义信息o 例如,现有的翻译方法出现的大部分错误都发生在一些复杂查询上现状:领域数据库中可能存在一些历史查询数据(查询日志),模型无法有效使用STARTselectcount(amount) from...ViewtotalsalesthisyearNL2SQLModelsselectcount(amount) from传统NL2SQL翻译?法
?成-排序的NL2SQL?法-GARYuankaiFan,ZhenyingHe,TonghuiRen,DianjunGuo,LinChen,RuisiZhu,GuanduoChen,YinanJing,KaiZhang,X.SeanWang.GAR:AGenerate-and-RankApproachforNaturalLanguagetoSQLTranslation,In39thInternationalConferenceonDataEngineering(ICDE‘23)YuankaiFan,TonghuiRen,ZhenyingHe,X.SeanWang,
文档评论(0)