通过使用 Midscene.js Chrome 插件,你可以快速在任意网页上体验 Midscene 的主要功能,而无需编写任何代码。
该扩展与 npm @midscene/
包共享了相同的代码,因此你可以将其视为 Midscene 的一个 Playground 或调试工具。
请先准备好以下任意模型的 API 密钥:OpenAI GPT 4o, Qwen-2.5-VL, UI-TARS 或任何其他支持的模型。我们稍后会用到。
你可以在 选择模型 文档中查看 Midscene.js 支持的模型和配置。
前往 Chrome 扩展商店安装 Midscene 扩展:Midscene
启动扩展(可能默认折叠在 Chrome 扩展列表中),通过粘贴 Key=Value 格式配置插件环境:
配置完成后,你可以立即开始使用 Midscene。它一共有三个关键操作 Tab:
快来试试吧!
插件体验结束后,你可能想将 Midscene 集成到代码中。这里有几种不同集成形式的文档:
这一般是与其他插件冲突所致,如页面已经被其他插件注入了 <iframe />
或 <script />
。
找到可疑插件:
<iframe />
或 <script />
,一般 URL 是 chrome-extension://{这串就是ID}/...
格式,复制其 ID。chrome://extensions/
,用 cmd+f 找到相同 ID 的插件,禁用它。