准备工作

安装 Node.js

安装 Node.js 18 或以上版本

准备 API Key

准备一个视觉语言(VL)模型的 API Key。

你可以在 模型策略 文档中查看 Midscene.js 支持的模型和配置。

准备 WebDriver 服务

在开始之前,你需要先设置 iOS 开发环境:

  • macOS(iOS 开发必需)
  • Xcode 和 Xcode 命令行工具
  • iOS 模拟器或真机设备

配置环境

在使用 Midscene iOS 之前,需要先准备 WebDriverAgent 服务。

版本要求

WebDriverAgent 版本需要 >= 7.0.0

请参考官方文档进行设置:

验证环境配置

配置完成后,可以通过访问 WebDriverAgent 的状态接口来验证 服务是否启动:

访问地址http://localhost:8100/status

正确响应示例

{
  "value": {
    "build": {
      "version": "10.1.1",
      "time": "Sep 24 2025 18:56:41",
      "productBundleIdentifier": "com.facebook.WebDriverAgentRunner"
    },
    "os": {
      "testmanagerdVersion": 65535,
      "name": "iOS",
      "sdkVersion": "26.0",
      "version": "26.0"
    },
    "device": "iphone",
    "ios": {
      "ip": "10.91.115.63"
    },
    "message": "WebDriverAgent is ready to accept commands",
    "state": "success",
    "ready": true
  },
  "sessionId": "BCAD9603-F714-447C-A9E6-07D58267966B"
}

如果能够正常访问该端点并返回类似上述的 JSON 响应,说明 WebDriverAgent 已经正确配置并运行。