GraphAgent团队 投稿量子位 | 公众号 QbitAI萝莉 色情
论文能不可中?不错用AI提前瞻望~
港大黄超锻练团队建议多智能体自动化框架GraphAgent,能自动构建妥协析学问图谱中的复杂语义收集,叮嘱各样瞻望和生成任务。
GraphAgent通过图生成、任务贪图和任务施行三大中枢智能体的协同运作,会通谎言语模子与图话语模子的上风,告捷谄谀了结构化图数据与非结构化文本数据,在文本回来与关系建模方面结束了赫然晋升。
实验中,在瞻望性任务(如节点分类)和生成性任务(如文本生成)上,GraphAgent均获取杰出效劳,仅以8B参数范畴便达到了与GPT-4、Gemini等大范畴闭塞源模子格外的性能水平。
尽头在零样本学习和跨域泛化等场景中,GraphAgent展现出显贵上风。
有利旨兴味的是,团队将GraphAgent应用到了学术论文评审场景。
在骨子投稿经过中,作家不时需要字据评审意见准备Rebuttal回话,而GraphAgent仅基于论文评审意见(Reviews)就能匡助作家更好地评估论文的登科可能。
GraphAgent长啥样?
实际寰宇的数据呈现双重本性:一方面是结构化的图谄谀数据,另一方面口舌结构化的文本与视觉信息。
这些数据中蕴含的关系收集也分为两类:显式的谄谀关系(如酬酢收集互动),以及隐式的语义依赖(常见于学问图谱)。
这种复杂性带来了三大中枢挑战:
异构数据会通:系统需要整合多种样子的信息。以学术收集为例,论文间的援用组成了图结构关系,而标题、概要等文本则承载着丰富的语义信息。有用整合这些异构信息可支持学问回来、科学问答等应用。多脉络关系知道:骨子场景中不时存在多维度的关联。举例电商平台中,用户-商品交互组成行为图谱,家具驳斥则形谚语义收集。深化知道这些多层关系有助于晋升用户-商品交互瞻望的准确性。任务多元化:应用场景条目系统具备庸碌的处理材干。瞻望类任务包括节点分类、一语气推断等图分析;生成类任务触及图增强文本生成、学问图谱问答等。这需要系统大约生动稳妥不同任务本性,并充分利用数据中的结构化与语义信息。
为叮嘱上述挑战,商榷团队建议多智能体自动化框架GraphAgent。
该框架通过三大中枢智能体的协同团结,结束了图结构与语义信息的深度会通,可同期支持瞻望型(图分析、节点分类)和生成型(文本创作)等各样化任务。
其中枢架构包括:
图生成智能体(Graph Generator Agent)任务贪图智能体(Task Planning Agent)任务施行智能体(Task Execution Agent)三大智能体通过协同机制紧密团结,会通谎言语模子与图话语模子的上风,有用挖掘数据中的关系收集与语义依赖。
底下详备先容各个智能体的中枢功能:
图生成智能体
图生成智能体崇敬构建语义学问图谱(Semantic Knowledge Graph, SKG),通过翻新的双阶段迭代机制结束深层语义信息的索求与整合。
该智能体的责任经过分为两个中枢阶段:
1)学问节点索求阶段
该阶段收受自稳妥的分层政策,从非结构化文本中识别多维度的学问实体:
通过定制化的系统指示,调用谎言语模子(LLM)处理输入文本利用迭代式识别时间,同期拿获宏不雅范围主张(如”Machine Learning”)和微不雅时间细节(如”Self-Supervised Learning”)基于多轮迭代构建脉络化学问结构,确保学问体系的完竣性与连贯性2)学问描摹增强阶段
这一阶段介怀晋升学问示意的丰富度与准确性:
为每个识别的节点生成详尽的语义描摹整合相干高下文信息,构建完竣的学问经营收受动态迭代更新机制:i) 将每轮描摹看成下轮优化的基础;ii) 陆续深化和拓展学问内容;iii) 通过多轮迭代会通,最终形谚语义完备的学问图谱任务贪图智能体
任务贪图智能体看成框架的决策中枢,通过精密的三阶段处理机制完成复杂任务的贪图与领悟。
其责任经过包括:
1)意图识别与任务制定
该阶段专注于准确知道用户需求并细目处理政策:
深度解析用户查询,索求核情意图将任务分类为三大类型:预界说图瞻望(Predictive_predefined),处理已知结构的图分析;洞开图瞻望(Predictive_wild),叮嘱未知结构的图推理;目田生成任务(Open_generation),施行生动的创作需求。2)图结构步调化处理
此阶段结束不同类型图数据的吞并抒发:
利用专科图构建器具(GBW_Tool)进行结构赈济同步处理显式关系图(G_exp)与语义学问图(G_skg)栽培步调化的异构图示意体系,确保处理一致性3)图文特征会通
这一阶段介怀结束信息的深度整合:
结合预磨练文本编码器与图神经收集,构建双层编码体系生成文本语义与图结构的联接示意为卑鄙任务提供丰富的特征支持,奠定施行基础图动作智能体
图动作智能体是框架的中枢施行单位,通过翻新的三维处理架构,结束了任务的精确施行与性能优化。
其责任机制包括:
1)智能化任务处理机制
针对不同类型任务收受互异化处理政策:
瞻望类任务:联想专属系统指示,调换模子进行精确瞻望生成类任务:会通语义学问图谱,晋升文本生成的质地与相干性自稳妥优化:字据任务本性动态调整处理经过,确保施行效劳2)深度图指示对皆时间
翻新性地结束了多脉络的模态对皆:
同类型图结构对皆:增强模子对特定图方法的知道材干跨类型学问会通:晋升处理异构图关系的准确性双向增强机制:显贵晋升模子在各样化场景下的泛化阐述3)渐进式学习政策
收受先进的课程学习方法:
基于难度梯度的任务编排:从基础到进阶的平滑过渡邃密化的磨练序列联想:确保学问蓄积的一语气性全处所性能调优:在各样任务中保持褂讪的高水平阐述实验
数据集树立
实验评估收受了六个各具特色的基准数据集,涵盖了不同场景和任务类型。
如Table 1所示,这些全心选定的数据集在范畴、结构和应用范围等方面展现出显贵互异,为全面考证框架性能提供了理思的测试基础。
为全面评估GraphAgent的通用性能,本商榷精选了六个具有代表性的基准数据集开展系统实验。这些数据集按照任务特征可区分为三大类:
结构化图数据集: 收受了两个经典的节点分类数据集IMDB和ACM。其中IMDB数据集包含11,616个节点,ACM数据集涵盖10,942个节点,这两个数据集都具有明晰的图结构特征,为评估模子在结构化数据处理方面的材干提供了可靠基准。
文本处理数据集:选定了Arxiv-Papers和ICLR-Peer Reviews两个具有代表性的数据集。Arxiv-Papers构建了包含153,555个SKG节点的语义学问图,用于评估文档分类性能;ICLR-Peer Reviews则包含161,592个SKG节点,专门用于论文请托瞻望任务,这些数据集体现了模子处理复随笔本及语义关系的材干。
智能生成数据集: 引入了Related Work Generation和GovReport回来两个具有挑战性的数据集。Related Work Generation基于多篇论文构建,包含875,921个SKG节点,用于考证模子的相干责任生成材干;GovReport包含15,621个SKG节点,针对长文档概要生成任务,这两个数据集都对模子的生成材干建议了较高条目。
实验效果分析
结构化数据瞻望性能分析
为深化评估GraphAgent在结构化图任务中的零样本学习材干,商榷团队联想了一组的对比实验。
实验收受IMDB数据集进行模子磨练,分别在1-shot和40-shot两种低资源场景下考证模子性能,并在ACM数据集的1,000个未见节点上开展挪动测试,以评估模子的泛化材干。
实验铁心标明:GraphAgent在所相环节目的上都显贵优于面前首先进的图话语模子HiGPT,平均性能晋升进步28%。模子在40-shot树立下获取了显贵性能晋升:Micro-F1和Macro-F1均达74.98%(晋升48.5%/63.5%),AUC达80.90%(晋升27.2%)。
GraphAgent的出奇性能主要源于三项中枢时间翻新:
开端,智能图生成机制通过自动构建语义学问图谱(SKG)为模子注入丰富的补充信息,显贵增强了复杂语义关系的知道材干;
其次,精确的任务贪图机制使模子大约准确知道和领悟用户意图,并为不同应用场景制定最优施行政策;
终末,翻新性的双重优化政策结合了图文对皆和任务微调机制,不仅晋升了模子的基础性能,还增强了挪动学习材干,使模子即使在1-shot等低资源场景下仍能保持褂讪的高性能阐述。
语义知道材干分析
为深化评估GraphAgent在复杂语义关系处理方面的性能,商榷团队基于两个典型数据集开展了系统实验:利用Arxiv-Papers数据集进行论文分类考证,并通过ICLR-Peer Reviews数据集测试论文请托瞻望材干。
通过严格的实验评估,GraphAgent在处理隐式语义依赖关系时展现出如下杰出上风:
实验铁心突显了GraphAgent的三大中枢上风:
在参数范畴优化方面,仅有8B参数的GraphAgent凭借其独有的语义学问图谱架构,告捷结束了对复杂语义依赖关系的精确把抓,通过多脉络语义信息的局部与全局整合,在各项评估目的上显贵杰出了Llama3-70b和Qwen2-72b等大范畴模子,平均性能晋升达31.9%。
在泛化材干阐述上,GraphAgent展现出出奇的跨任务学习后劲。其多任务版块GraphAgent-General在Arxiv-Papers数据集的阐述致使优于专门优化的单任务版块。
尽头值得详尽的是,8B范畴的GraphAgent在零样本场景下也能达到Deepseek-Chat-V2等大型闭源模子的性能水平。
在架构效劳方面,GraphAgent通过翻新性地整合语义学问图谱和结构化学问示意,比较传统的监督微调方法和GraphRAG系统,不仅显贵晋升了模子性能,还有用缩小了输入支拨,同期告捷缓解了谎言语模子常见的幻觉问题。
文本生成任务
三隅 倫 巨乳GraphAgent在图增强文本生成任务中展现出出奇阐述,通过性能评估、模子对比和架构分析三个维度的系统实验,充分考证了其杰出上风。
基于Llama3-70b和Qwen2-72b的双重对比考证标明,GraphAgent在困惑度(PPL)等中枢目的上显贵优于基线模子。不同于传统的监督微调(SFT)和GraphRAG方法,GraphAgent通过智能构建语义学问图谱,从根柢上晋升了模子的推理知道材干,有用管制了旧例微长入学问注入方法在处理复杂推理方法时的固有局限。
在架构翻新和性能对标方面,GraphAgent展现出杰出上风。
以GPT-4为评判基准的实验炫耀,GraphAgent比较Llama3-8b和Llama3-70b分别结束了114%和45%的性能晋升,在67%的测试案例中开端同等范畴模子,58%的情况下杰出主流开源决议。
尤为显贵的是,GraphAgent仅以8B的参数范畴和极低的算计支拨便达成这些出奇效劳,充分考证了基于语义学问图谱的架构联想在增强文本生成材干方面的显贵效果。
消融实验
通过系统化的消融实验(Ablation Study),商榷团队深化评估了GraphAgent架构中三个中枢组件的性能孝顺,商榷铁心揭示了以下枢纽发现:
语义学问图谱(SKG)的基础缓助作用:移除SKG组件导致模子性能显贵缩小15.2%,充分证据了自动构建的语义学问图谱在提供枢纽补充信息方面的不可替代性。这一发现强调了结构化学问示意对模子合座性能的决定性影响。
图文对皆机制的紧迫性:实验标明,缺失图文对皆机制变成了最显贵的性能失掉,困惑度(PPL)加多达11.282。这杰出标明深脉络的图文知道材干关于需要复杂推理的生成任务至关紧迫,是保险模子高质地输出的枢纽技艺。
课程学习政策的优化效果:天然相较其他组件影响相对较小(瞻望任务缩小4.0%,生成任务PPL加多0.503),但课程学习政策的缺失仍对双任务性能产生赫然负面影响。这考证了渐进式学习旅途在优化模子磨练效果方面的积极作用。
终末商榷团队走漏了他们的将来商榷标的,包括:
多模态材干拓展:推测打算将面前框架的处理材干彭胀至视觉信息范围,栽培支持关系型数据、文本内容和视觉元素的抽象处理机制。这一拓展不仅包括多模态信息的知道与会通,还将要点诱惑跨模态学问示意和生成材干,从而结束更丰富的智能交互场景。尽头照拂视觉-文本-关系的协同建模,为多模态智能系统开辟新的商榷标的。
模子性能优化:奋力于晋升模子在复杂实际场景中的泛化阐述,要点商榷如安在保持或晋升性能的同期结束模子压缩。这触及翻新的模子架构联想、高效的参数分享机制以及先进的学问蒸馏时间。同期,将探索算计资源优化政策,提高模子在骨子部署环境中的效劳,为大范畴应用奠定基础。
应用场景彭胀:积极探索框架在多个骨子范围的落地应用,要点照拂科学商榷辅助和营业智能分析等高价值场景。在科研范围,将诱惑专门的文件分析和学问发现器具;在营业范围,介怀构建面向决策支持的智能分析系统。同期,密切照拂新兴时间趋势,探索在医疗健康、金融科技等范围的应用场景。
神气地址:https://github.com/HKUDS/GraphAgent论文一语气:https://arxiv.org/abs/2412.17029实验室主页: https://sites.google.com/view/chaoh萝莉 色情