小瓶RPA屏幕元素定位选择方法总结

小瓶RPA 2026-04-10 15:52:56

小瓶RPA屏幕元素定位选择方法总结版本,优先级排序:

多重选择方法按照优先顺序,总有一个适合你 ✅


📴 离线4种:(不需要网络+高速)

①浏览器元素选择器定位 🔍(需要安装浏览器插件)

pbottle.browserCMD_click()

详细参考:

https://rpa.pbottle.com/docs/API%E6%B5%8F%E8%A7%88%E5%99%A8%E5%A2%9E%E5%BC%BA.html#%E5%85%83%E7%B4%A0%E9%80%89%E6%8B%A9%E5%99%A8

demo示例:WEB增强-账号密码登录演示.js


②屏幕图像选择定位 🖼️

pbottleRPA.waitImage()

返回目标坐标位置,可点击操作

demo示例:微信朋友圈自动点赞.js


③快捷键元素焦点切换定位 ⌨️

  • 多次按下 tab 键:pbottleRPA.keyTap('tab')

可确认输入等操作


④OCR文字定位 📝(需要开启OCR本地模型)

pbottleRPA.findText()

返回目标坐标位置,可点击操作

demo示例:文字提取查找OCR演示.js



🌐 在线1种(消耗token,额外大模型费用)

①多模态AI大模型 🤖

屏幕截图后:

pbottleRPA.cloud_GPTV("请返回图像中微信图标的位置", screenshot)

返回目标坐标位置,可点击操作

咨询小瓶科技
咨询我们