API中转站 260+AI大模型 0.95一刀 立即进入

阿里云无影AgentBay

AI 时代的Agent云基础设施,为企业、开发者、AI厂商提供可一键配置的AI Agent任务执行工具和执行环境

产品概述

无影AgentBay是阿里云推出的AI时代Agent云基础设施,面向企业、开发者和AI厂商,提供可一键配置的AI Agent任务执行工具和执行环境。用户可以通过无影API或AgentBay MCP Server快速集成,调用相关工具获取Serverless服务。

无影AgentBay不是简单的虚拟机,而是一个完整的AI Agent云基础设施平台,为AI时代的智能体提供"手脚",让AI能真正为人类解决实际问题。

核心定位

无影AgentBay是阿里云推出的面向AI时代的Agent云基础设施,主要面向三类用户:

技术架构与核心能力

技术架构

无影AgentBay基于阿里云多年的云桌面技术积累,构建了一套完整的AI Agent云基础设施:

核心功能与优势

标准Runtime

预集成大量面向Agent任务执行的标准工具,并以MCP封装,以便企业快速集成。支持Browser、File、Terminal、Python等多种工具。

用户状态持久化

通过无影自研的持久化架构,安全隔离地保存用户配置文件、Cookie等,并动态挂载,让云环境无限接近本地环境。

实时端云交互

无影自研ASP协议可将云端画面实时串流到用户本地,让用户和AI可以交替控制云环境。支持网络和外设重定向通道。

云端算力

任务在阿里云的资源池中执行,不占用本地计算资源,解决Agent执行任务时本地设备算力不足的问题。

完整MCP生态兼容

完全支持MCP(Model Context Protocol)协议,提供标准化的MCP接口,可与现有MCP生态系统无缝集成。

数据安全隔离

为每个用户提供完全隔离的VM环境,环境会话结束后即重置,不留存任何数据,保障用户隐私。

规格与环境

云服务规格

项目 说明
云资源 公测期间限量免费服务。支持调用专属桌面或共用资源,共用资源的并发数上限为10台。服务地域按照客户接入IP自动分配。
运行环境 服务支持内置Linux版本镜像,无影在保证向下兼容的基础上持续丰富和更新镜像能力。
MCP工具 首期发布环境默认支持Browser工具、File工具、Terminal工具。持续更新中。
免费额度 公测期间单账号的资源使用时长上限为100小时,可申请提高额度。

资源类型对比

对比项 专属桌面 通用资源池 独立资源池
生成方式 支持基于自定义镜像生成 支持(需自行维护) 支持(需自行维护)
基于无影镜像生成 支持(随MCP能力自动升级) 支持(需自行维护) 支持(需自行维护)
地域分配 基于访问IP自动分配 基于访问IP自动分配 基于访问IP自动分配
通过MCP协议连接 支持 支持 支持
通过模型反馈链接访问画面流 不支持 支持 支持
有效期限 14天,到期后资源自动回收 停止连接超过30天后可能被回收 停止连接超过30天后可能被回收
数据保留 关机后User目录内数据不保留,其他部分文件内容不随自动关机清理 不保留数据,每次断连后重置 不保留数据,每次断连后重置

使用流程

使用无影AgentBay只需简单几步即可完成配置:

  1. 创建API Key

    登录AgentBay控制台,在"服务管理"页面创建API Key,系统会生成一个以"akm-"开头的唯一标识。公测期间最多可创建10个API Key。

  2. 配置资源类型和镜像

    在"资源管理"页面创建资源,选择资源类型(专属桌面/通用资源池/独立资源池)和系统镜像。

  3. 完成MCP服务配置

    对于通用资源池或独立资源池,可在资源详情页获取MCP连接信息,然后在支持MCP的工具(例如Cursor)中配置连接。支持SSE和STDIO两种连接方式。

  4. 使用画面流(可选)

    对于通用资源池或独立资源池,支持通过无影Web SDK iframe内嵌或浏览器拉取无影Web客户端的方式打开云电脑画面。

与大模型集成

为应用对接支持MCP服务的大模型,需要使用通义千问MAX、Claude 3.7等支持MCP服务的模型。在智能体应用中,大模型会根据用户的问题,智能判断是否调用MCP服务。

您可以通过内置提示词"使用wuying-agentbay打开浏览器,并访问wuying.aliyun.com"或类似提示词来测试效果。配置无误后,系统会拉起无影云环境并执行浏览器操作,同时模型会提供Web链接供您打开无影画面流并接管操作。

常见问题解答

无影AgentBay是什么?是虚拟机吗?

无影AgentBay不是简单的虚拟机,而是一个完整的AI Agent云基础设施平台。它是阿里云推出的AI时代的Agent云基础设施,具有标准Runtime、用户状态持久化和实时端云交互等核心功能,底层基于无影资源池,集成了多种标准MCP工具集。

市场上的AI Agent产品如何接入无影AgentBay?

AI Agent产品可通过无影服务端SDK+API或MCP Server两种方式接入。基础接入流程包括:申请API Key、配置资源池、完成MCP服务配置(可选)、集成Web SDK(可选)、发起工具使用请求。支持客户端内嵌WebView串流云环境或跳转浏览器使用。

无影AgentBay支持MCP协议,和市场上的MCP Server有什么关系?

无影AgentBay完全支持MCP(Model Context Protocol)协议,提供标准化的MCP接口,确保与现有MCP生态兼容。提供Browser、File、Terminal等主流MCP工具集,可与现有MCP Server生态系统无缝集成。

无影AgentBay如何保障用户隐私和数据安全?

无影AgentBay通过隔离机制为每个用户提供完全隔离的VM环境,环境会话结束后即重置,不留存数据。采用API Key进行身份认证,提供安全的访问控制机制。本地数据不会上传到云端,云端数据不会被保留,除非用户明确授权。

无影AgentBay如何解决Agent执行任务时本地设备算力不足的问题?

通过云端执行模式,任务在阿里云的资源池中执行,不占用本地计算资源。提供Serverless服务,按需分配计算资源,支持弹性扩展。采用云端分布式计算,支持任务并行处理,资源自动扩缩容,本地设备只需处理基础交互操作。

无影AgentBay提供哪些Desktop Auto能力?支持自定义镜像吗?

无影AgentBay提供丰富的Desktop Auto能力,包括Browser工具(浏览器自动化)、File工具(文件操作)、Terminal工具(命令行)、Python工具等基础自动化能力,还支持GUI Agent、自定义知识空间等进阶能力。支持内置Linux基础镜像,并允许用户在基础镜像上制作自定义镜像。

开始使用

无影AgentBay现已开放公测,限量免费服务,欢迎体验!

免费体验(前往产品控制台) 查看帮助文档

技术规格与限制

详细技术规格

无影AgentBay提供的云基础设施有着完善的技术体系,以下是更详细的技术规格:

技术指标 专属桌面 通用/独立资源池
硬件规格 可定制CPU、内存和GPU配置 根据任务动态分配
镜像类型 自定义镜像、无影基础镜像 主要为无影优化镜像
存储容量 根据需求灵活配置 任务所需最小存储,自动伸缩
连接协议 MCP、ASP(无影专有协议) MCP、WebSocket、HTTP
并发能力 单用户独占 支持多任务并发,上限10并发
网络性能 高速专用通道 共享网络资源

MCP工具集全览

Browser工具

支持全功能浏览器自动化操作,包括页面访问、元素点击、表单填写、屏幕截图、Cookie管理等。适用于网页内容抓取、网站测试和自动化任务。

File工具

提供完整文件系统访问能力,包括文件创建、读取、写入、复制、移动和删除。支持二进制和文本文件处理,适合数据处理和文档操作。

Terminal工具

提供命令行终端访问能力,支持执行Shell命令、脚本运行、软件安装和系统配置等操作。适用于开发环境搭建和系统管理任务。

Python工具

内置Python执行环境,支持代码动态执行、依赖管理和模块导入。适合数据分析、机器学习模型训练和自动化脚本执行。

GUI Agent工具

提供图形界面自动化能力,支持屏幕识别、元素定位和交互操作。适用于桌面应用自动化和复杂交互场景。

数据库工具

支持多种数据库连接和操作,包括SQL执行、数据查询和修改。适合数据持久化和信息管理场景。

系统架构

无影AgentBay采用多层架构设计,保证系统高可用性和扩展性:

  1. 接入层:处理API请求、认证授权和负载均衡
  2. 调度层:资源分配、任务调度和服务编排
  3. 执行层:容器化环境、工具集成和状态管理
  4. 存储层:持久化文件系统、状态缓存和结果存储
  5. 监控层:性能监控、故障检测和自动恢复

Agent开发与集成范例

Web浏览自动化示例

使用场景:自动化信息收集

下面是一个简化的示例,展示如何使用无影AgentBay的Browser工具进行网页自动化操作:

// 通过MCP协议调用无影AgentBay的Browser工具
// 1. 打开浏览器访问指定网站
const browser = await mcp.tools.browser.open();
await browser.goto("https://example.com");

// 2. 执行搜索操作
await browser.type("#search-input", "无影云电脑");
await browser.click("#search-button");

// 3. 等待结果并提取数据
await browser.waitForSelector(".search-results");
const results = await browser.extractData(".result-item", {
  title: ".title",
  description: ".description",
  link: "a.link@href"
});

// 4. 保存结果
await mcp.tools.file.writeJSON("/tmp/search-results.json", results);

AI模型与无影AgentBay集成示例

使用场景:通义千问模型调用无影AgentBay执行任务

下面是一个示例,展示大模型如何使用无影AgentBay执行复杂任务:

// 用户向通义千问提问:分析最新股市数据并生成报告

// 1. 通义千问判断需要执行数据分析任务
// 2. 调用无影AgentBay
await agentbay.connect({
  apiKey: "akm-xxxxxxxx",
  externalId: "financial-analysis"
});

// 3. 执行数据获取和分析
const terminalTool = await agentbay.tools.terminal.create();
await terminalTool.execute("pip install pandas matplotlib seaborn");
const pythonTool = await agentbay.tools.python.create();

// 4. 运行Python分析代码
const result = await pythonTool.execute(`
import pandas as pd
import matplotlib.pyplot as plt
# 获取股市数据
df = pd.read_csv('https://example.com/market_data.csv')
# 数据分析...
# 生成图表...
plt.savefig('/tmp/market_analysis.png')
`);

// 5. 获取生成的图片并返回给用户
const fileTool = await agentbay.tools.file.create();
const reportImage = await fileTool.readFile('/tmp/market_analysis.png');
// 将结果返回给用户

实际应用案例展示

案例1:电商数据自动化抓取与分析

某电商数据分析公司使用无影AgentBay的Browser工具和Python环境,每日自动抓取多个电商平台的商品价格和评论数据,进行趋势分析和竞品监控。传统方案需要维护大量代理IP和本地计算资源,现在只需配置Agent任务,大幅降低了运维成本和硬件投入。

案例2:建筑设计3D渲染农场

某建筑设计公司利用无影AgentBay的GPU资源和专业软件工具,构建了云端渲染农场。设计师上传模型后,系统自动分配渲染任务到多个云端实例并行处理,将渲染时间从数小时缩短至数分钟,大大提高了工作效率。

案例3:AI客服知识库更新与训练

某企业利用无影AgentBay构建了AI客服系统的自动化维护流程,包括定期从企业内部文档系统抓取最新信息、处理格式化、更新向量数据库并重新训练模型。整个过程无需人工干预,确保客服系统始终使用最新知识。

AgentBay与行业技术对比

无影AgentBay作为AI时代的Agent云基础设施,与市场上其他相关技术方案有明显的区别和优势:

对比项 无影AgentBay 传统云服务器 容器服务 Serverless
启动速度 秒级 分钟级 秒级 毫秒级
预装工具集 丰富(Browser、File、Terminal等) 基础系统 自定义镜像 有限功能
图形界面支持 完整GUI支持 需远程桌面 复杂配置 不支持
MCP协议支持 原生支持 需自行部署 需自行部署 有限支持
资源伸缩 自动弹性 手动 配置自动伸缩 自动
适合场景 AI Agent任务、自动化、浏览器操作 通用计算 应用部署 事件驱动函数
计费模式 按使用时长 包月或按量 按CPU/内存用量 按调用次数

AgentBay与常见Agent框架的集成

LangChain

无影AgentBay可与LangChain框架无缝集成,为Agent提供更强大的执行工具。开发者可以在LangChain中定义高级任务,由AgentBay提供底层执行环境和工具支持,特别适合需要浏览器操作和文件处理的复杂工作流。

AutoGPT

AgentBay可以作为AutoGPT的执行环境,大幅扩展其能力范围。通过AgentBay提供的Browser工具和GUI操作能力,AutoGPT能够执行更复杂的自动化任务,如网页交互、数据采集和文件操作等。

百炼Agent框架

阿里云百炼平台的Agent框架与AgentBay有深度集成,可实现一键部署和双向绑定。通过百炼平台定义的智能体可以直接调用AgentBay的云端资源和工具,实现从模型调用到执行的完整闭环。

未来发展路线图

根据阿里云无影团队的规划,AgentBay未来将持续完善和扩展功能,为更多AI应用场景提供支持:

  1. Android系统支持

    即将推出Android系统镜像支持,让Agent能够执行移动应用自动化任务,如APP测试、内容获取和社交媒体管理等。

  2. AgentAPI标准化

    计划推出标准化AgentAPI接口,便于企业将Agent集成到现有系统中,如ERP、CRM等核心业务系统,实现数据互通和流程自动化。

  3. 垂直行业解决方案

    将针对金融、教育、医疗、零售等特定行业推出定制化解决方案,包含行业专用工具集、数据接口和优化的执行环境。

  4. 多Agent协作框架

    开发面向多Agent协作的基础设施,支持复杂任务分解和并行执行,提高解决问题的能力和效率,适合企业级复杂业务流程自动化。

  5. Agent创建与管理平台

    建设面向企业的Agent创建、部署和管理平台,降低开发门槛,实现低代码或零代码创建专用Agent的能力,加速企业数字化转型。

开发者资源与支持

开发者社区

加入无影AgentBay开发者社区,与其他开发者交流经验,分享最佳实践,获取最新版本信息和功能更新。社区提供问答、案例展示和代码分享等服务。

技术支持

阿里云为AgentBay用户提供专业技术支持,包括故障排查、性能优化和安全配置等方面的帮助。公测期间可通过控制台或钉钉群获取支持服务。

培训与认证

阿里云计划推出AgentBay专业认证课程,帮助开发者和企业掌握AI Agent开发和管理的核心技能,提升技术实力和市场竞争力。

行业影响与前景展望

无影AgentBay作为AI Agent云基础设施的先行者,正在塑造未来企业软件和AI应用的发展方向。根据行业专家分析,AgentBay有望在以下方面产生深远影响:

Agent经济

AgentBay将推动"Agent经济"的兴起,创造全新的软件分发和使用模式。企业可以订阅或购买专用Agent服务,按使用频率或解决问题的价值付费,形成新型软件经济生态。

软件中间件变革

传统软件中间件将逐步被Agent层替代,不同系统间的数据交换和业务流程不再需要复杂的API集成,而是通过智能Agent自动完成,大幅降低集成成本和维护难度。

企业知识民主化

基于AgentBay构建的企业知识Agent将打破传统信息孤岛,让每位员工都能便捷获取和利用企业核心知识,提高决策效率和质量,实现知识民主化。

开发模式转变

软件开发将从"编写完整应用"转向"指导Agent执行任务",开发者角色更多是任务设计师和Agent引导者,而非传统的代码编写者,极大提高软件生产效率。

立即开始体验

阿里云无影AgentBay现已开放公测,限量免费使用,让您第一时间体验AI时代的Agent云基础设施。

"无影AgentBay让AI不再只是回答问题,而是能真正解决问题。它为AI提供了'手脚',让智能体可以实际操作和执行任务,这是AI应用的重要里程碑。"

—— 阿里云无影事业部总裁 张献涛

通过以下方式开始您的AgentBay之旅:

注册免费账号

访问AgentBay控制台注册账号,获取免费100小时使用时长,体验完整功能和服务。公测期间每个账号可创建最多10个API Key。

前往注册

查阅开发文档

阅读详细的API文档、最佳实践和示例代码,快速掌握AgentBay的使用方法和集成技巧,加速您的开发进程。

阅读文档

加入开发者社区

扫描下方二维码加入钉钉用户交流群,与其他开发者和阿里云专家交流经验,获取最新产品动态和技术支持。

了解更多

免费体验(前往产品控制台) 查看帮助文档