
打造24小时在线的科研_教学助手DeepSeek+智能体构建.docx
26页打造24小时的科研_教学助手DeepSeek+智能体构建一、揭开智能体的神秘面纱(一)智能体是什么?智能体源自AI Agent (也称人工智能代理),指的是一种能够感知环境、进行决策和执行动作的智能实 体智能体像人一样,它有记忆、有逻辑分析能力、有问题任务的拆解能力、以及综合统一解决问题的能 力Agent 这个词早在1950年代就已出现,当时由Alan Turing提出【智能】概念,并扩展到人工 实体,提出的著名的图灵测试这些人工智能实体通常被称为—代理 (Agent*)「 代 理」这一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体在 人工智能领域,这一术语被赋予了一层新的含义:具有自主性、反应性、积极性和社交能力 特征的智能实体Agent 术语的中文译名并未形成共识,有学者将其翻译为智能体、行为 体、代理或智能代理,本文中出现的「智能体」均指代Agent大型语言模型 (LLMs) 的出现为智能体的进一步发展带来了希望如果将NLP 到AGI的发展路线分为五级:语料库、互联网、感知、具身和社会属性,那么目前的大型语 言模型已经来到了第二级,具有互联网规模的文本输入和输出。
智能体社会的进展0504030201语料库级别互联网规模具身空间代理社会感 知 空 间在这个基础上,如果赋予 LLM-based Agents感知空间和行动空间,它们将达到第三、第四级进一步地,多个智能体通过互动、合作解决更复杂的任务,或者反映出现实世界的社会行为,则有潜力来到第五级—智能体社会一个由人与多智能体构成的和谐社会,人类也可参与其中场景取材自《原神》中的海灯 节智能体的定义(祛魅版):智能体就像一个为你独身打造的机器人小助理,能识别你的需求, 帮助你搜索信息、整理资料、交互对话,还可以根据你的反馈实现自我迭代优化,甚至在长 久的训练下,还能自主完成复杂的工作任务二)智能体分类按照智能体的工作原理来划分,智能体可以分为对话式智能体、自主智能体、生成智能体、具身智能体 对话式智能体GPTs -文心一言具身智能体环境交互 -学习与适应自主智能体-AutoGPT任务自动化生成智能体Smallille 一社会动态智能体的类 型0对话式智能体 (Conversational Agent) 通过自然语言与人类互动,完成各种任务,主要用于回答问 题、提供建议和帮助用户解决问题,强调语言理解和答案生成能力,如GPTs 、文心一言等平台都属于 这一类。
绘本智能体: from=bots_card&bid=6e6rfn60g1015自主智能体 (Autonomous Agent) 能够根据用户通过自然语言提出的需求,自动执行任务并实现预 期结果,如AutoGPT能够通过理解自然语言需求并自动完成任务AutoGPT网站:https://www.genspark.ai/autopilotagent生成智能体 (Generative Agent) 则是在模拟复杂社会环境中“生活”的智能体,拥有自己的记忆和 目标,能够与人类和其他智能体互动,例如斯坦福和谷歌的研究者联合构建的 “Smallville” 虚拟小镇 中的生成智能体,这些智能体不仅能够与人类互动,还能在模拟的社会环境中进行复杂的交流和互动,模拟真实世界中的社会动态学习视频:斯坦福实验:25个Al小人一起生活,重现《西部世界》card.all.click&vd_source=belaec544a9cb94181febc61184b66b3具身智能体 (Embodied agent) 是一种能够与环境进行交互、通过自身的身体感知和行动来学习和适 应环境的智能实体三)基于大语言模型的智能体组成结构一个Agent 的诞生拥有大模型加持的智能体会是什么样?复旦大学自然语言处理团队(FudanNLP) 受到达尔文「适者生 存」法则的启发,提出了基于大模型的智能体通用框架。
一个人如果想要在社会中生存,就必须学会适应环境,因此需要具有认知能力,并且能够感知、应对 外界的变化同样,智能体的框架也由三个部分组成:控 制 端 (Brain)、 感知端 (Perception) 和行动端 (Action)·控制端:通常由大语言模型构成,是智能体的核心它不仅可以存储记忆和知识,还承担着信息处 理、决策等不可或缺的功能它可以呈现推理和计划的过程,并很好地应对未知任务,反映出智能体 的泛化性和迁移性·感知端:将智能体的感知空间从纯文本拓展到包括文本、视觉和听觉等多模态领域,使智能体能够 更有效地从周围环境中获取与利用信息·行动端:除了常规的文本输出,还赋予智能体具身能力、使用工具的能力,使其能够更好地适应环 境 变 化 , 通 过 反 馈 与 环 境 交 互 , 甚 至 能 够 塑 造 环 境 Generalizne/TransferBrainStorageKnowledgeSummaryMakingPlanning户 /ReasoningDecision0Leam RetrieveMemoryRecallPerceptionInputsEnvironmentLook at the sky,do you think itwill rain tomorrow?If so,give theumbrella to me.Reasoning from the current weatherconditions and theweather reports onthe intemet,it islikely to raintomorrow.Here isyour umbrella.EmbodimentActionText Tools 二Calling API …Agent智能体的工作流程如下:当人类询问是否会下雨时,感知端 (Perception) 将指令转换为大 语言模型可以理解的内容。
之后控制端 (Brain) 开始根据当前天气和互联网上的天气预报进 行推理和行动规划最后,行动端 (Action) 做出响应并将雨伞递给人类四)Agent 是集大模型、数据、工具多维一体的系统化工程在技术框架的不断探索中,Agent 的技术框架认知逐渐统一,大模型作为大脑,驱动规划、工具使用、 记忆三大基本能力模块指导行动,智能体逐渐通过与环境、智能体和人类交互的反馈中不断进化Agent 通用技术框架长期记忆 短期记忆· COT记忆大模型外 部API反思改进行动环境感知反馈智能体Plan-and-Solve· TOT GOT …· ReAct· Reflexion· CRITICSelf-Refine任务拆解工具使用智能体规划二、主流对话式智能体平台1.扣 子 (Coze)由字节跳动出品的Coze (扣子)已然成为智能体界的明星产品提及智能体,人们往往首先想到它, 可谓独占鳌头它几乎囊括了所有类型的插件,既支持配置工作流,又支持多个智能体串联以形成多 智能体无论是小白用户还是具有技术背景的用户,各类用户都能在此找到适合自己的使用方式主要特点:· 插件丰富多样。
· 支持多智能体及工作流串联· 适用于各类用户群体链接:扣子,让AI 离应用更近一步r 时体港库. ·*s 82.文心智能体百度推出的文心智能体在布局和功能方面与字节跳动的Coze (扣子)有一定相似之处它支持工作 流,不过插件相对较少,主要以搜索功能为主无论是普通用户还是开发者,都可以轻松上手使用, 并且能够串联多个节点来打造完整的工作流主要特点:· 支持零代码和低代码配置· 集成百度自家搜索引擎链接:3.智谱清言智能体智谱清言智能体在功能特性上更侧重于对提示词的封装以进行对话,给人的感觉就像是一个轻量级的 智能体它不支持工作流的配置,然而其在使用上却极为容易上手,无论是毫无经验的新手还是经验 丰富的专业人士,不同人群都能针对特定的场景有效地使用它智谱清言智能体具有诸多显著特点:· 其一,它支持AI 绘画功能,能够让用户轻松创作出精美的艺术作品· 其二,具备联网搜索能力,可快速为用户提供丰富的信息资源· 其三,拥有一定的代码能力,为有相关需求的用户提供便利· 此外,其轻量级的特性使得它不会占用过多的系统资源,同时易上手的优势也让用户能够在短时间 内熟练掌握其使用方法,从而更好地满足不同人群在特定场景下的需求。
链接:4.天工智能体天工智能体具备丰富多样的功能,其智能体广场呈现出众多不同类型的智能体这些智能体拥有强大 的能力,不仅能够进行高效的搜索,还可以完成各类写作任务,甚至能够生成音乐然而,羊仔在使 用过程中并未找到创建智能体的入口,这不禁让人怀疑是否打开的方式存在错误主要特点如下:· 拥有数量较多的智能体,涵盖多种功能领域· 具有高度集成的特性,将多种能力整合在智能体系统中链接:智能体广场 播件广场 我的Q◎KT2f 加 上Aa 共s九应2响出*凡案Pi真应入全国文胞ss黑王绝妃夏模8 楼E. e在照里Z注 鹿 , 所生 ts19 8I9第会文廉le 28女友 需 7ma: 沪S 不nB 毛六0计师 面 aP!体/猛Q ss工 天 工AIE 用g 姓a 在二亚K9 手希 图irgau5.腾讯元器腾讯的元器平台在能力方面尽管不如扣子那般全面,但也具备了核心的关键能力基本上所需的主要 功能都涵盖其中,它支持工作流的配置,拥有插件功能,同时也具备知识库不过,相对而言其插件 数量较少在发布渠道方面,它有力地支持在 以及企业上进行发布。
主要特点:· 对工作流、知识库以及插件均提供支持· 支持在腾讯生态体系内进行发布操作链接:腾讯元器tn领人曲1 人B. 。
