API 参考(PC 桌面)
本页记录了 @midscene/computer 提供的 PC 桌面特定 API。
有关适用于所有平台的通用 API,请参阅 通用 API 参考。
Agent 创建
agentFromComputer(opts?): Promise<ComputerAgent>
创建用于桌面自动化的 agent。
参数:
displayId(可选):指定要控制的显示器。使用ComputerDevice.listDisplays()获取可用显示器。customActions(可选):向设备添加自定义操作。
示例:
设备管理
ComputerDevice.listDisplays(): Promise<DisplayInfo[]>
列出所有可用显示器。
返回:
示例:
checkComputerEnvironment(): Promise<EnvironmentCheck>
检查计算机环境是否正确配置。
返回:
示例:
ComputerAgent
ComputerAgent 类继承自 PageAgent<ComputerDevice>,并继承所有通用 agent 方法:
aiAct(action: string):使用 AI 执行操作aiQuery(query: string):使用 AI 提取信息aiAssert(assertion: string):使用 AI 断言条件aiWaitFor(condition: string):等待条件aiLocate(description: string):定位元素- 更多...
详见 通用 API 参考。
可用操作
ComputerDevice 支持以下操作:
鼠标操作
Tap(点击)
在目标位置单击。
DoubleClick(双击)
在目标位置双击。
RightClick(右键)
右键点击打开上下文菜单。
MouseMove(移动鼠标)
移动鼠标到目标元素。
DragAndDrop(拖放)
从一个位置拖动并放到另一个位置。
键盘操作
KeyboardPress(按键)
按键盘按键,可选修饰键。
支持的按键:
- 普通键:
a-z、0-9、Enter、Escape、Space、Tab等 - 方向键:
ArrowUp、ArrowDown、ArrowLeft、ArrowRight - 功能键:
F1-F12 - 修饰键:
Command/Cmd(macOS)、Control/Ctrl、Alt、Shift、Win(Windows) - 媒体键:
VolumeUp、VolumeDown、Mute等
示例:
Input(输入)
在输入框中输入文本。
ClearInput(清空输入)
清空输入框内容。
滚动操作
滚动屏幕或特定区域。
显示器操作
ListDisplays(列出显示器)
获取所有已连接显示器的信息。

