semaphore提示您:看后求收藏(新笔趣阁www.xbqg5200.com),接着再看更方便。
我将分为四个部分来介绍我的毕业论文。首先是研究背景。那么为什么要开展我这个研究呢?随着信息技术和网络技术的快速发展下,非结构化数据的比例迅速上升,传统的数据库并不能存储这些数据,所以这无疑带来了数据管理领域的重大挑战。文献是科技工作者获取知识的重要来源。英语作为国际通用语言,英文文献的重要性便不言而喻。文献通常以PDF进行存储。传统的pdf信息提取,比较局限,采用人工查阅将所需的有效信息进行提取,再把这些信息标记在论文资源上供人们定位和使用。这就要求负责这项工作的人具有相当专业的知识,世界各地,各行各业,每天都会产生大量文章,信息提取的效率相当重要,怎么才能避免资源浪费,就是一个待解决的问题。随着大语言模型的兴起,诞生了检索增强生成技术,它从大量的文本数据中提取出有用的信息,并对这些信息进行分析和处理,为用户提供更全面、更准确的信息服务。基于此,选取检索增强生成技术来对大量文献进行信息提取,相较于先前的人工查阅降本增效,安全性高。我选择的数据对象是,电力行业LCA英文文献。第二部分我将介绍我本次研究最核心的关键技术。检索增强生成技术。大语言模型的知识包括,自己本身的知识,用户的前置输入,和联网或者检索专业的知识库所获取的知识,将这三部分结合,便是检索增强生成所包含的内容。说的再直白一点,就是让大语言模型外挂一个知识库,或联网搜索,去抽取到相关知识,是检索。把专业的知识和提问一起,送给大语言模型归纳生成,生成一个更准确的答案,是增强