No.67630063 - X岛揭示板

No.67630063 - 无标题 - 技术宅

回应模式

No.67630063

名称

管理员

E-mail

标题

颜文字

正文

附加图片

水印

•程序语言、压制投稿、视频制作以及各计算机领域的技术问题
•我觉得还是CSDN靠谱一点
•本版发文间隔为15秒。

无标题无名氏 2025-12-13(六)03:04:31 ID:Jg8y3hr [举报] [订阅] [只看PO] No.67630063 [回应]

这个开源ai操作手机是不是之后还可以拓展出不少功能，比如微信直接提取出重要信息就不用看那些事多的聊一些有的没的了(`ヮ´
https://github.com/zai-org/Open-AutoGLM

…

无标题无名氏 2025-12-13(六)03:17:49 ID:Jg8y3hr (PO主) [举报] No.67630080

AutoGLM 开源：解锁AI手机，人人可用

2025年12月8日

一、我们到底在追求什么？

长期以来，我们一直在执着地思考一个问题：
如果AI真是个“助手”，那它能不能像真人一样拿起手机，从头到尾搞定一整件事？

在我们的愿景里，AI不该只待在聊天框里。它得走出来，走进你每天用的App里：

它能帮你搞定外卖App，从选餐到结账一气呵成；
它能管理你的云端手机，批量处理通知、点赞和评论；
它能自动处理销售、客服和考勤这些重复得让人头疼的流程。

这正是AutoGLM的核心——教AI掌握“设备代理”的真本事。

二、32个月：从混沌到掌控

说白了，我们想要的不只是让AI“说”话，而是让它“动手”。
从2023年4月开始，当大家还对大语言模型闻所未闻时，我们从头干起，花了32个月，把每个细节都啃了个遍。

从“随机点按”到“精准操控”
最早的版本里，AI只懂点“点击”或“滑动”这类基础操作，偶尔能完成简单任务，但更多时候会卡在无意义的步骤里，甚至掉进无限循环。
为了修好这个毛病，我们花了一年多，把所有可能的坑都踩了一遍：
搭建了一套完整的“手机操作”能力框架；
抽象出最核心的动作：点击、滚动、输入、截图和界面理解；
训练AI把自然语言指令拆解成稳定、可复现的操作序列；
教它应付现实中的“环境摩擦”：网络波动、弹窗广告、页面乱跳。
2024年10月25日，我们推出了第一个能稳定跑通真实设备全流程的AutoGLM，行业都把它称为全球首个真正具备“手机操作”能力的AI Agent。

AI送出了第一份“数字红包”
2024年11月，AutoGLM创了个里程碑：它发出了史上第一个AI自动化“红包”（数字现金礼）。
这不是脚本，也不是内部API调用——AI是“看”屏幕、“理解”场景，一步步点进银行界面完成的。
对我们来说，这意味：今后手机上的很多互动，终于能完全交给AI处理了。

搬进云端：更安全的沙盒
2025年，我们发布了AutoGLM 2.0。通过验证强化学习的 scaling laws，我们推出了MobileRL、ComputerRL和AgentRL算法，让AI能在数千个虚拟环境里同步学习，大大提升了它的准确性和泛化能力。
更重要的是，我们不想让AI在用户的真实手机或私人微信里瞎折腾。于是把它塞进了云端的虚拟手机：
这台手机跑在云端；
每一步操作都能回放、审计和手动干预；
所有敏感数据都严格隔离。
这个设计很简单：AI用手机之前，得先确保它别碰到不该碰的地方。

三、为什么开源？我们真正关心的是什么？

从产品角度看，AutoGLM已经落地很多真实场景；从工程角度看，我们的技术积累足够写满一摞报告。
可为什么选在这个时间点开源？我们想清楚了三点：

单打独斗撑不起AI手机时代
“AI手机”确实是趋势，但如果“手机操作”能力只捏在少数厂商手里，就等于在说：
开发者创新空间，得看平台开不开API；
你日常用的最核心设备，会越来越变成别人控制的“围墙花园”。
开源AutoGLM的初衷，就是把它变成行业共用的基础设施，让大家一起打磨。
你可以把它当积木，往自己系统里塞，拆开重写，甚至彻底改造——从那一刻起，它就不再是“Z.AI的AutoGLM”，而是你亲手造的东西。

把隐私和控制还给用户
我们清楚，一旦手机操作能力普及，就会碰上最敏感的东西：私人聊天、支付记录、相册，甚至企业内部系统。
这些，我们不能碰，也不该碰。
通过开源和私有化部署，开发者和企业能在合规环境中完全掌控数据、日志和权限，让手机变成真正属于你自己的AI手机。
一句话：技术向生态开放，数据与隐私永远留在用户手里。

给“智能体时代”当起点
AutoGLM这条路走得很陡峭：我们啃过技术难题，踩过坑，重写过框架。这些经验能用在很多地方，但“一枝独放不是春”。智能体要爆发，得靠大家一起参与。
我们期待：
团队用AutoGLM做出真正的AI原生手机；
研究者拆出模块，写论文或开发新算法；
独立开发者把Demo变成热爱的项目，在小众场景里跑得溜溜的。
希望今天起，每个人都能拥有自己的移动智能体。

四、现在就能得到什么？

我们开源的不是概念，而是“即拿即用”的能力。具体包括：

预训练核心模型及推理代码；
“手机操作”能力框架与工具链；
覆盖50+高频中文App的可运行演示；
Android适配层与示例项目；
文档和快速入门指南。

模型按MIT协议开放，代码用Apache-2.0协议托管在GitHub上。
你可以当现成基础设施用，拆解部分模块，或者改得面目全非——只要能帮你更靠近心中的“AI原生手机”。

五、接下来呢？

现在的AutoGLM还远没到完美。它还没见过所有真实手机和App，未来AI手机生态肯定比我们想象的更惊人。
我们做的是：诚实而真实地，把“AI能不能用手机”这个答案交到你手里。
现在，2025年末，正如安德烈·卡帕西最近说的，我们正站在“智能体之年”，甚至是“智能体之十年”的门口。
接下来，AutoGLM还会继续冲刺。让我们一起驱动开源和研究，把梦想中的“贾维斯”真正送到每个人身边。

…

无标题无名氏 2025-12-13(六)03:18:30 ID:Jg8y3hr (PO主) [举报] No.67630082

>>No.67630080
https://autoglm.z.ai/blog/

…

无标题无名氏 2025-12-14(日)20:06:23 ID:bRRnPeX [举报] No.67641200

最近的豆包手机和这个其实是同一类型的吧 ( ﾟ∀。)

…

无标题无名氏 2025-12-18(四)02:43:20 ID:63fWF7I [举报] No.67671408

这种东西早就没有技术障碍了，最大的障碍是微信不愿意，一开就给你封了

X岛 - Ver 1.0 beta by 酱酱酱
联系：help@nmbxd.com
免责声明：本站无法保证用户张贴内容的可靠性，投资有风险，健康问题请遵医嘱。