Midscene 提供了 MCP 服务,允许 AI 助手通过自然语言命令控制浏览器,自动化执行 UI 任务,以及生成 Midscene 自动化脚本。
MCP 是一种标准化的方式,使 AI 模型能够与外部工具和功能进行交互。MCP 服务器暴露一组工具后,AI 模型可以调用这些工具来执行各种任务。对于 Midscene 来说,这些工具允许 AI 模型控制浏览器、导航网页、与 UI 元素交互等等。
给 Sauce Demo 站点生成 Midscene 测试用例
将 Midscene MCP 服务器添加到你的 MCP 配置中:
有关配置 AI 模型的更多信息,请参阅选择 AI 模型。
Midscene MCP 提供以下浏览器自动化工具:
功能分类 | 工具名称 | 功能描述 |
---|---|---|
导航 | midscene_navigate | 在当前标签页导航到指定 URL |
标签页管理 | midscene_get_tabs | 获取所有打开的浏览器标签页列表 |
midscene_set_active_tab | 通过 ID 切换到特定标签页 | |
页面交互 | midscene_aiTap | 点击通过自然语言描述的元素 |
midscene_aiInput | 在表单字段或元素中输入文本 | |
midscene_aiHover | 悬停在元素上 | |
midscene_aiKeyboardPress | 按下特定键盘按键 | |
midscene_aiScroll | 滚动页面或特定元素 | |
验证和观察 | midscene_aiWaitFor | 等待页面上的条件为真 |
midscene_aiAssert | 断言页面上的条件为真 | |
midscene_screenshot | 对当前页面截图 | |
Playwright 代码示例 | midscene_playwright_example | 提供了 Midscene 的 Playwright 代码示例 |
midscene_get_tabs:获取所有打开的浏览器标签页列表,包括它们的 ID、标题和 URL
midscene_set_active_tab:通过 ID 切换到特定标签页
midscene_aiTap:点击通过自然语言描述的元素
midscene_aiInput:在表单字段或元素中输入文本
midscene_aiHover:悬停在元素上
midscene_aiKeyboardPress:按下特定键盘按键
midscene_aiScroll:滚动页面或特定元素
midscene_aiWaitFor:等待页面上的条件为真
midscene_aiAssert:断言页面上的条件为真
midscene_screenshot:对当前页面截图
问题描述
当用户在本地多个 Client (Claude Desktop、Cursor MCP、) 中同时使用了 Midscene MCP 将会出现端口占用导致服务报错
如何解决
在每次执行完任务后都会生成 Midscene 任务报告,可以在命令行直接打开该 html 报告