Building Advanced RAG Over Complex Documents构建能够处理复杂文档的高级RAG应用-LlamaIndex Talk (Data + AI Summit 2024)数据AI峰会上分享了如何构建能够处理复杂文档的高级RAG应用,几乎涵盖了目前数据处理、RAG、Agentic RAG 等顶级前沿的理念并开放了PPT和代码.pptx
- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
1BuildingAdvancedRAGOverComplexDocumentsJerryLiu
June11,2024
BuildingaKnowledgeAssistantRAGOverview:BasicRAGandwhereitgoeswrongImprovingDataQuality:ImproveLLMreasoningovercomplexdataWorkshop:LlamaParseoverComplexDocumentsImprovingQueryComplexity:fromRAGtoagentsWorkshop:LlamaParse-powereddocumentagentWhat’snext?2Agenda
3EnterpriseUseCases
4EnterpriseUseCasesDocumentProcessingTaggingExtractionKnowledgeSearchQA(RAG)ConversationalAgentWorkflowAutomationAgent:…Human:…Agent:…DocumentTopic:Summary:Author:KnowledgeBaseAnswer:Sources:…Workflow:ReadlatestmessagesfromuserASendemailsuggestingnext-stepsInboxreadEmailwrite
5BuildingaKnowledgeAssistantAgent:…Human:…Agent:…KnowledgeBaseAnswer:Sources:…Human:QuestionHuman:…
6BuildingaKnowledgeAssistantAgent:…Human:…Agent:…KnowledgeBaseAnswer:Sources:…Human:QuestionHuman:…Goal:Buildaninterfacethatcantakeinanytaskasinputandgivebackanoutput.Inputforms:simplequestions,complexquestions,researchtasksOutputforms:shortanswer,structuredoutput,researchreport
7RAG
8RetrievalAugmentedGeneration(RAG)AnoverviewofaRAGPipelineDataParsingIngestionDataQueryingIndexDataDataParsing+IngestionRetrievalLLM+PromptsResponse
9NaiveRAGPyPDFSentenceSplittingChunkSize256SimpleQAPromptDenseRetrievalTop-k=5IndexDataDataParsing+IngestionRetrievalLLM+PromptsResponse
10ChallengeswithNaiveRAG
NaiveRAGapproachestendtoworkwellforsimplequestionsoverasimple,smallsetofdocuments.“WhatarethemainriskfactorsforTesla?”(overTesla202110K)“WhatdidtheauthordoduringhistimeatYC?”(PaulGrahamessay)11EasytoPrototype,HardtoProductionize
12EasytoPrototype,HardtoProductionizeButproductionizingRAGovermorequestionsandalargersetofdataishard!
FailureModes:SimpleQuestionsoverComplexDataSimpleQuestionsoverMultipleDocumentsComplexQuestions13EasytoPrototype,Hardt
您可能关注的文档
- 2023年长租公寓青年租客租住行为调研报告.pdf
- 2023中国长租公寓市场白皮书-44页.pdf
- 公立医院高质量发展评价指标(试行)操作手册(2022版).pdf
- 挂靠模式下会计收入确认的思路以及涉税问题的探讨.pdf
- 交易中如何选择正规券商.pdf
- 金融-证券Ⅱ行业:中资券商出海:案例与借鉴-广发证券[陈福]-20231227【27页】.pdf
- (教学设计)第1章 第3节 科学验证:动量守恒定律2023-2024学年新教材高中物理选择性必修第一册(鲁科版2019).docx
- 语文版中职数学基础模块上册3.5《函数的实际应用举例》word教案2().docx
- 2024-2025学年小学生积极心理预防教学设计.docx
- 2023-2024学年统编版语文七年级下册第2课《说和做》教学设计.docx
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)