HarmonyOS 开始使用
本指南将带你完成使用 Midscene 自动化 HarmonyOS 设备所需的一切:通过 HDC 连接真机、配置模型 API Key、体验零代码 Playground,并运行你的首个 JavaScript 脚本。
配置 AI 模型服务
将你的模型配置写入环境变量,可参考 模型策略 了解更多细节。
准备工作
在编写脚本前,先确认 HDC 能够连接设备且设备信任当前电脑。
安装 HDC
HDC(HarmonyOS Device Connector)是 HarmonyOS 提供的命令行工具,用于与 HarmonyOS 设备通信。安装方式:
- 通过 DevEco Studio 安装(推荐)
- 通过 HarmonyOS 命令行工具 单独安装
验证 HDC 是否安装成功:
出现版本号表示安装成功。
如果 hdc 不在系统 PATH 中,你可以设置 HDC_HOME 环境变量指向 HDC 所在目录:
启用开发者模式并验证设备
在 HarmonyOS 设备的设置中进入 开发者选项,开启 USB 调试,然后用数据线连接设备。
验证连接:
出现设备 ID 代表连接成功:
试用 Playground(零代码)
Playground 是验证连接、观察 AI Agent 的最快方式,无需编写代码。它与 @midscene/harmony 共享相同的代码实现,因此在 Playground 上验证通过的流程,用脚本运行时也完全一致。
- 启动 Playground CLI:
- 点击 Playground 窗口中的齿轮按钮,粘贴你的 API Key 配置。如果还没有 API Key,请回到 模型配置 获取。
开始体验
配置完成后,你可以立即开始体验 Midscene。它提供了多个关键操作 Tab:
- Act: 与网页进行交互,这就是自动规划(Auto Planning),对应于
aiAct方法。比如
- Query: 从界面中提取 JSON 结构的数据,对应于
aiQuery方法。
类似的方法还有 aiBoolean(), aiNumber(), aiString(),用于直接提取布尔值、数字和字符串。
- Assert: 理解页面,进行断言,如果不满足则抛出错误,对应于
aiAssert方法。
- Tap: 在某个元素上点击,这就是即时操作(Instant Action),对应于
aiTap方法。
关于自动规划(Auto Planning)和即时操作(Instant Action)的区别,请参考 API 文档。
集成 Midscene Agent
当 Playground 运行正常后,就可以切换到可复用的 JavaScript 脚本。
第 1 步:安装依赖
第 2 步:编写脚本
下面的示例会在设备上打开设置应用,并执行滚动操作。
第 3 步:运行示例
第 4 步:查看报告
脚本成功后会输出 Midscene - report file updated: /path/to/report/some_id.html。在浏览器中打开该 HTML 文件即可回放每一步交互、查询与断言。
进阶
当你需要自定义设备行为、把 Midscene 接入独立框架,或排查 HDC 问题时,可参考本节内容。更多构造函数参数可前往 API 参考(HarmonyOS)。
扩展 HarmonyOS 上的 Midscene
使用 defineAction() 定义自定义手势,并通过 customActions 传入。Midscene 会把自定义动作追加到规划器中,让 AI 可以调用你领域特定的动作名。
关于自定义动作和动作 Schema 的更多解释,请参阅 与任意界面集成。
更多
- 查看所有 Agent 方法:API 参考(通用)
- HarmonyOS 专属参数与接口:HarmonyOS Agent API
- 示例项目
- HarmonyOS JavaScript SDK 示例:https://github.com/web-infra-dev/midscene-example/blob/main/harmony/javascript-sdk-demo
- HarmonyOS + Vitest 示例:https://github.com/web-infra-dev/midscene-example/tree/main/harmony/vitest-demo
完整示例(Vitest + HarmonyAgent)
合并报告默认存放在 midscene_run/report 目录。在 CI 中运行时可通过 MIDSCENE_RUN_DIR 覆盖。

