智能助手网
标签聚合 操控

/tag/操控

linux.do · 2026-04-17 09:11:43+08:00 · tech

OpenAI 发布 Codex 重大更新,目前每周有超过 300 万开发者使用这款产品。此次更新的核心变化是 Codex 不再局限于写代码,开始介入软件开发的全流程。 最大的功能跃迁是「后台电脑操控」:Codex 现在可以直接在 Mac 上看屏幕、点鼠标、敲键盘,操作任何应用程序,且多个代理可并行工作,各用各的光标,不干扰用户正在做的事情。对开发者来说,这意味着迭代前端界面、测试应用或操作没有 API 的工具时,不用再手动截图描述,代理自己看着办。 应用内新增浏览器,用户可以直接在页面上标注评论给代理下指令,适合前端和游戏开发中的快速迭代。图片生成方面集成了 gpt-image-1.5,可在同一工作流中生成产品概念图、UI 设计稿和游戏素材。新增超过 90 个插件,覆盖 Atlassian Rovo(JIRA 管理)、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks 等开发工具链。 自动化能力的扩展更值得关注。Codex 现在可以复用已有对话线程保留上下文,自行安排未来任务并自动唤醒继续执行,时间跨度可达数天甚至数周。同时推出记忆功能预览版,能记住用户的偏好、纠正和历史操作中积累的信息,让后续任务完成得更快。Codex 还会基于项目上下文、已连接的插件和记忆,主动建议用户从哪里开始一天的工作或接续之前的项目,比如识别 Google Docs 中待处理的评论,拉取 Slack、Notion 和代码库的相关上下文,生成优先级排序的行动清单。 开发者工作流方面新增 GitHub PR 评审评论处理、多终端标签页、通过 SSH 连接远程 devbox(alpha 阶段),以及侧边栏文件预览(支持 PDF、电子表格、幻灯片和文档)。 这些更新正在向已登录 ChatGPT 的 Codex 桌面端用户逐步推送。记忆和主动建议功能将稍后面向企业版、教育版及欧盟/英国用户开放,电脑操控目前仅支持 macOS。 https://openai.com/index/codex-for-almost-everything/ 3 个帖子 - 3 位参与者 阅读完整话题

www.ithome.com · 2026-04-17 07:36:21+08:00 · tech

IT之家 4 月 17 日消息,OpenAI 公司今天(4 月 17 日)更新 Codex AI 编程助手,新增 Mac 桌面应用操作能力,支持多智能体并行运行和长期任务执行。 本次更新最值得关注的变化,就是赋予 Codex AI 编程助手操作 Mac 桌面应用的能力。Codex 现在拥有独立光标, 能够查看屏幕内容、点击界面元素、输入文字,直接操作桌面应用完成任务。 开发者可用它测试应用、迭代前端界面,而多个智能体可并行运行,互不干扰用户正常工作。 记忆功能让 Codex 能保存用户偏好、重复工作流和技术栈信息。借助自动化改进,Codex 可在暂停后通过现有对话线程恢复工作,还能自主调度未来任务,跨越数天甚至数周持续推进。它会根据项目上下文、记忆内容和已连接插件主动提出工作建议。IT之家附上相关视频如下: 应用内浏览器让用户能直接在页面上添加评论,为智能体提供更精确的指令。OpenAI 表示 Codex 未来将获得完整浏览器操作能力,可自主打开网站、执行用户流程、截图并检查输出结果。 图像生成方面,Codex 集成 gpt-image-1.5 模型,用于创建产品概念图和界面原型。同时新增多终端标签支持、GitHub 评论处理功能,侧边栏可直接打开 PDF 和电子表格等文件并预览。 插件生态同步扩展,新增 90 多个插件。这些插件可组合技能、应用集成和 MCP 服务器,增强 Codex 的上下文获取和执行能力。

linux.do · 2026-04-15 21:00:13+08:00 · tech

我在玩一个监狱背景的酒馆角色卡,这个卡属于纯净向的。我操控角色一步步在监狱内部的帮派内崛起,成为领导 中间收了一个女角色,当会计。 本来我打算纯纯当成一个纯励志向的逆袭爽文玩,但是我突然灵机一动,想让男主角和女角色瑟瑟一下。 于是我就看到了两个人一边瑟瑟一边对账单、谈工作的画面······ 好命苦的角色的说 今天干了十块钱token 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-15 17:32:59+08:00 · tech

终端工具 Warp 发布 Universal Agent Support 更新,核心思路是把自己从一个终端变成所有 CLI 编程 Agent 的统一管理界面。目前支持 Claude Code、Codex、Gemini CLI 和 OpenCode。 最直观的变化是垂直标签栏(Vertical Tabs)。水平标签栏换成了侧边栏,每个标签页显示 Agent 类型图标、运行状态(进行中/完成/出错/阻塞)、当前 Git 分支和 diff 统计,同时跑多个 Agent 时不用逐个切换就能掌握全局进度。配合新的 Tab Configs 功能,可以为每个标签预设工作目录、启动命令、主题和 worktree,一键创建。 其余几项更新围绕「减少在 Agent 和编辑器之间来回切换」展开: 统一通知中心:所有 Agent 的通知汇总到一处,支持系统级推送,不用盯着每个终端窗口 代码审查集成:在 Warp 内置的 diff 视图中写行内评论,评论会直接发送到正在运行的 Agent 会话 上下文附加:选中代码片段或文件,直接喂给正在运行的 Agent,不用复制粘贴 富文本输入:在任意第三方 Agent 中使用多行编辑、语音输入、图片附加,以及 Warp 自己的 /prompts 和 @context 语法 远程操控:将任意 Agent 会话发布到云端,从手机或另一台电脑监控和介入 Warp 的定位正在从「更好用的终端」转向「编程 Agent 的工作台」。当 Claude Code、Codex 等 Agent 本身越来越强,终端作为它们的运行环境反而成了体验瓶颈,Warp 押注的就是这个中间层的价值:不跟 Agent 竞争智能,而是让管理多个 Agent 的体验更顺畅。 Warp Introducing Universal Agent Support: level up any coding agent with Warp Warp now supports any CLI coding agent — Claude Code, Codex, Gemini CLI, OpenCode and more — with vertical tabs, notifications, native code review, rich input, and remote control. 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-14 15:59:39+08:00 · tech

GitHub 4 月 13 日发布 Copilot CLI 远程控制功能公开预览版。启动时加 copilot --remote 参数,CLI 会生成一条链接和二维码,用户可从另一台设备的浏览器或 GitHub 移动端 App 实时接入正在运行的会话。会话状态在本地 CLI 与远程端之间实时同步,每个远程会话仅对发起者可见。 远程端支持的操作与本地一致:追加转向指令、在 Agent 当前轮次结束后继续驱动任务、修改执行计划、在计划/交互/自动驾驶三种模式之间切换、审批或拒绝权限请求,以及回答 Agent 通过 ask_user 工具提出的问题。使用时工作目录须为 GitHub 仓库,长时间任务可配合 /keep-alive 防止设备休眠。 iOS 和 Android 均已开放测试版,分别通过 TestFlight 和 Google Play 测试渠道获取。Copilot Business 和 Copilot Enterprise 用户需由管理员先行开启远程控制策略。 这个功能真正解决的是「启动任务后必须守着电脑」的问题。AI 编程任务往往需要跑几十分钟,现在用户可以锁屏离开,手机上随时检查进度、补发指令,不必担心任务卡住无人处理。 The GitHub Blog Remote control CLI sessions on web and mobile in public preview - GitHub... The Copilot CLI is no longer a purely local experience. Today we’re launching copilot --remote: With remote capabilities, you can now monitor and steer a running CLI session directly from… Est. reading time: 2 minutes 1 个帖子 - 1 位参与者 阅读完整话题

imjuya.github.io · 2026-03-24 08:52:51+08:00 · tech

AI 早报 2026-03-24 视频版:哔哩哔哩 | YouTube 概览 要闻 Claude 桌面端上线操控电脑功能,限 macOS ↗ #1 OpenClaw 连更两个版本,增加大量功能 ↗ #2 模型发布 Luma AI 发布 Uni-1,推理视觉同步 ↗ #3 产品应用 OpenAI 推出 ChatGPT Library 功能 ↗ #4 网易云音乐推出 CLI 工具,接入 OpenClaw ↗ #5 千问上线打车能力,支持自然语言叫车支付 ↗ #6 技术与洞察 Cursor 发文介绍新型文本索引,降低 Agent 搜索延迟 ↗ #7 Claude 桌面端上线操控电脑功能,限 macOS #1 Anthropic 宣布在 Claude 桌面端上线“Computer Use”功能,允许 Claude 通…