2026年I/O大会上,谷歌描绘了一幅宏大的AI蓝图,核心是**信任**与**个人数据**的深度绑定。新推出的**Gemini Spark**始终在线,能帮你组织活动;**Daily Brief**则提供每日简报;Gmail的AI收件箱甚至能自动生成待办清单并草拟回复。这些功能看似便捷,但背后是AI对个人信息的全面调用——而谷歌的优势恰恰在于,它只需一个简单的“同意”菜单,就能触及你存储在Gmail、Google Photos、Drive、YouTube等跨服务的数据。 早在2024年,谷歌就已将Gemini集成到Workspace应用中,让AI能检索文件、撰写邮件。今年1月推出的“**Personal Intelligence**”功能更进一步,允许Gemini在无提示状态下跨Gmail、Google Photos、搜索和YouTube历史进行推理,从而自动提供个性化推荐。谷歌产品管理总监Josh Woodward透露,已有数百万人每天使用该功能,用于获取产品推荐、旅行建议,甚至作为人生重大决策的“思考伙伴”。 然而,这种便利的代价是用户必须交出大量隐私。与OpenAI、微软、Anthropic等竞品相比,谷歌拥有得天独厚的数据金矿:搜索记录、邮件内容、照片位置、视频喜好……当这些数据被AI串联起来,它能比你自己更了解你。但这也引发了质疑:用户是否真的愿意让一个“永不遗忘”的AI代理读取所有私人信息?谷歌强调所有功能都需用户主动开启,且数据仅用于AI个性化,但过去的数据泄露史让许多人保持警惕。 AI行业的竞争已从模型能力转向数据生态。谷歌的“全家桶”策略正在构建一个护城河:对手可以复制算法,却无法复制用户多年积累的数据网络。但这也意味着,一旦信任崩塌,谷歌的AI帝国将失去根基。在便利与隐私的天平上,谷歌选择了前者——而用户的选择,将决定这场赌局的最终走向。
2026年5月19日,在ATxSummit峰会上,OpenAI宣布启动“OpenAI for Singapore”计划,与新加坡数字发展及信息部(MDDI)合作,支持其国家AI战略。该计划获得超过**3亿新元**(约合人民币16亿元)的承诺资金,聚焦三大领域:帮助本地组织部署前沿AI并解决最棘手问题;培养本地下一代AI人才;让更多新加坡个人和企业受益于AI。 作为核心举措,OpenAI将在新加坡设立其**首个海外“应用AI实验室”(Applied AI Lab)**,未来几年内创造超过200个技术岗位,并将新加坡打造为全球**前向部署工程师**(Forward-Deployed Engineer)枢纽之一。这些工程师将直接与企业合作,将前沿研究转化为实际应用,重点覆盖**公共服务、金融、医疗和数字基础设施**等国家AI使命优先领域。 OpenAI首席营收官Denise Dresser表示:“新加坡拥有优秀的技术人才、值得信赖的机构以及利用AI推动长期增长的明确雄心。通过这一伙伴关系,我们希望帮助更多组织受益于前沿AI,支持本地AI人才成长,并扩大全国范围内对这些工具的获取。” 此举标志着OpenAI首次在海外建立深度本地化研发与部署能力,也凸显新加坡作为全球AI领导者的吸引力。随着团队扩张,OpenAI还计划逐步扩大在当地办公室的规模。
**马斯克诉OpenAI案以败诉告终,但这场庭审揭示了AI行业最隐秘的权力博弈。** MIT Technology Review的AI记者兼律师Michelle Kim与主编Mat Honan在一场圆桌讨论中,深度剖析了案件背后的关键细节与行业影响。 ## 案件核心:非营利承诺的“欺骗”之争 马斯克指控OpenAI CEO Sam Altman和总裁Greg Brockman在2015年共同创立时,以“非营利”承诺诱导其出资,但后来公司转向营利模式,违背初衷。然而,法庭最终驳回了马斯克的诉求。Kim指出,关键问题在于:**非营利地位是否构成具有法律约束力的合同?** 法庭认为,OpenAI早期的非营利承诺更多是愿景陈述,而非可执行的协议。 ## 庭审三周:从“被欺骗”到“模型蒸馏” 庭审过程充满戏剧性。第一周,马斯克声称自己被“欺骗”,并警告AI可能毁灭人类,同时承认其公司xAI在“蒸馏”OpenAI的模型。第二周,OpenAI反击,并曝出马斯克曾试图挖角Altman。第三周,双方围绕可信度互相攻击,最终由陪审团裁决。 ## 行业影响:AI竞赛的规则模糊 Kim认为,此案暴露了AI行业在**非营利与营利边界**上的法律真空。许多AI初创公司最初都打着“造福人类”的旗号,但后续商业化路径往往引发争议。此外,马斯克在庭审中承认xAI使用OpenAI模型进行蒸馏,这引发了关于**知识产权与竞争伦理**的新讨论。 ## 未来展望:监管与信任危机 尽管马斯克败诉,但案件可能推动立法者更严格地定义AI公司的非营利地位。同时,公众对AI领导者的信任度可能下降——当创始人从“拯救世界”转向“争夺市场份额”,行业需要更透明的治理机制。 > 相关阅读: > - Elon Musk and Sam Altman are going to court over OpenAI’s future > - Musk v. Altman week 1: … > - Here’s why Elon Musk lost his suit against OpenAI
陪审团迅速驳回埃隆·马斯克对OpenAI联合创始人萨姆·奥特曼、格雷格·布罗克曼以及微软的诉讼,这一决定证实了法庭上的直观感受:马斯克的案件本身薄弱,部分原因在于他拖延太久才提起诉讼。上周的结案陈词中,OpenAI的律师逐点详述法律如何有利于其客户,而原告团队则聚焦奥特曼的诚信问题,并对有人不同意马斯克的指控表示难以置信。最终结果令一些人难以相信马斯克会败诉——包括他自己。马斯克在随后删除的帖子中称法官为“可怕的激进奥克兰法官”,并宣布计划上诉,声称“任何关注案件细节的人都会毫无疑问地认为,奥特曼和布罗克曼确实通过窃取慈善机构中饱私囊”。 但庭审揭示,奥特曼和布罗克曼并非唯一从OpenAI非营利投资中获益的人。马斯克及其法律团队试图将审判焦点对准奥特曼,但过程同样暴露了马斯克自身的问题。法庭上披露的一件事显示,马斯克曾以令人不安的相似方式从OpenAI获益。布罗克曼作证称,2017年马斯克要求他带一组OpenAI研究员到特斯拉总部协助自动驾驶团队几周。布罗克曼表示:“很明显我们无法拒绝。”他描述带领包括安德烈·卡帕斯、伊利亚·苏茨克弗和斯科特·格雷在内的顶尖科学家,为“士气低落”的特斯拉员工提供咨询。他们帮助提出改进车辆自动驾驶技术的方案,苏茨克弗甚至告诉团队,如果找到10000个棘手边缘案例的图像,就能修复软件。马斯克还要求布罗克曼推荐解雇员工,但遭拒绝。另一位知情人士证实了这一说法,并称特斯拉未就员工的时间和努力向OpenAI提供补偿。 马斯克案件的核心是,奥特曼、布罗克曼和OpenAI违反了慈善信托——马斯克为特定慈善目的捐款,而联合创始人却将其挪作他用。他还指控他们因OpenAI营利部门的股票及其他福利而获得不当得利。然而,庭审证据表明,马斯克本人也曾试图将OpenAI的资源用于个人商业利益,这削弱了他的道德立场。法官最终裁定,马斯克未能证明存在不可弥补的损害,且其长期沉默导致诉讼时效已过。此案不仅关乎法律,更折射出AI行业巨头之间复杂的关系与利益纠葛。
Google is sprucing up its Gemini models, revamping search, and enabling AI agents in everything. There are also some spiffy new smart glasses coming this fall.
对于 Linux 新手或寻求高效桌面环境的用户来说,KDE Plasma 是一个热门选择,而 Kubuntu 和 Fedora KDE 则是两个最主流的发行版。虽然它们都搭载了 KDE Plasma 桌面,但在系统哲学、软件包管理、更新策略和开箱即用体验上存在显著差异。 ### 核心差异:稳定性 vs. 前沿 **Kubuntu** 基于 Ubuntu,每两年发布一个 LTS(长期支持)版本,期间有短期版本。它注重稳定性,软件包经过严格测试,适合生产环境或不喜欢频繁大版本升级的用户。默认软件源庞大,兼容 Debian 生态,且拥有庞大的社区支持和丰富的第三方仓库(如 PPA)。 **Fedora KDE** 则走在前沿,每 6 个月发布一个新版本,采用滚动式更新但非真正滚动发行。它优先采用最新软件版本,如内核、图形驱动和桌面组件,适合开发者、技术爱好者或需要最新硬件支持的用户。Fedora 采用 RPM 包管理,默认软件源较精简,但通过 Flatpak 和第三方仓库(如 RPM Fusion)可以扩展。 ### 用户界面与默认配置 两者都提供原生的 KDE Plasma 体验,但默认设置略有不同。Kubuntu 的默认主题和布局更接近 Windows 传统风格,开始菜单、任务栏和系统托盘配置较保守,适合从 Windows 迁移的用户。Fedora KDE 则更强调“干净”和现代化,默认采用更简洁的布局,并预装了一些 GNOME 风格的组件(如软件中心 GNOME Software 的 KDE 替代品 Discover)。 ### 软件管理与社区 **包管理器**:Kubuntu 使用 `apt` 和 `dpkg`,而 Fedora KDE 使用 `dnf`(基于 RPM)。后者在依赖解析和事务性更新上表现更出色,但 RPM 软件包数量不如 Debian/Ubuntu 丰富。 **更新频率**:Kubuntu LTS 版本只接收安全更新和 bug 修复,而短期版本提供 9 个月支持。Fedora KDE 每个版本支持约 13 个月,但升级过程更频繁,可能带来兼容性问题。 **社区**:Ubuntu 社区规模更大,中文资源丰富;Fedora 社区更偏向开发者,技术文档质量高,但中文支持稍弱。 ### 如何选择? - **推荐 Kubuntu 给**:Linux 新手、追求长期稳定、需要大量现成软件支持、或偏好 Debian 生态的用户。 - **推荐 Fedora KDE 给**:技术用户、希望第一时间体验新技术、愿意接受一定风险换取性能与功能领先的玩家。 总之,两者都是优秀的 KDE Plasma 发行版,选择取决于你对稳定性与前沿性的权衡。如果你不确定,可以先在虚拟机中尝试 Live 环境,感受默认配置的差异。
OpenAI 于 2026 年 5 月 19 日宣布,将通过多层次的溯源策略进一步加强 AI 生成内容的透明度和可信度。新举措包括:成为 C2PA 合规生成器产品,使平台能可靠读取和传递元数据;与 Google 合作在图像中嵌入 SynthID 水印,提供跨平台的持久标识;以及推出面向公众的早期验证工具,帮助用户检查图像是否来自 OpenAI。这些更新旨在构建一个更安全的 AI 生态系统,让用户能够识别和信任 AI 生成的内容。此前,OpenAI 已在 DALL·E 3、ImageGen 和 Sora 中加入了内容凭证。
在2026年Google I/O大会上,谷歌宣布与**Warby Parker**和**Gentle Monster**合作,推出新一代AI智能眼镜。这款设备被定位为“音频眼镜”,用户可通过语音指令调用谷歌生态内的应用和服务,包括**Gemini**助手。眼镜将与Android和iOS设备配对,由三星参与设计,预计今年晚些时候上市。 谷歌并非初次涉足智能眼镜领域。多年前推出的**Google Glass**曾因隐私争议和“玻璃孔”(glassholes)的贬称而备受诟病。但如今市场环境已大不相同——以**Meta**为首的大公司以及众多初创企业正积极布局。Meta的Ray-Ban Stories系列已取得一定成功,而谷歌此次选择音频交互而非显示功能,旨在规避隐私问题,同时发挥其在语音助手和AI生态上的优势。 ### 产品亮点 - **语音交互**:用户可与眼镜对话完成操作,例如通过Gemini直接下单咖啡。 - **跨平台支持**:兼容安卓和iOS,降低使用门槛。 - **设计合作**:Warby Parker和Gentle Monster提供时尚镜框,三星负责硬件工程。 ### 行业背景 智能眼镜市场正从“噱头”转向实用。Meta的音频眼镜已证明语音交互的可行性,而谷歌此次押注AI助手Gemini,意图将其打造成核心卖点。不过,与Meta的Ray-Ban合作类似,谷歌也需解决电池续航、长时间佩戴舒适度以及隐私问题。 ### 小结 谷歌的“音频眼镜”策略更务实:避开AR显示的复杂技术,专注语音这一成熟交互方式。若定价合理,它可能成为继Pixel Buds后谷歌又一款成功的可穿戴设备。但面对Meta和众多初创公司的竞争,谷歌需要确保Gemini的响应速度和生态整合能力足够出色。
在2026年Google I/O大会上,谷歌宣布重返智能眼镜赛道,推出名为“音频眼镜”的新产品。该设备与Warby Parker和Gentle Monster合作设计,并由三星参与制造,支持Android和iOS设备。用户可通过语音指令与眼镜交互,借助Gemini等谷歌生态系统完成操作,例如语音下单咖啡。谷歌此前曾推出Google Glass,但因隐私问题饱受争议。如今,智能眼镜市场已发生显著变化,Meta等巨头及众多初创公司纷纷布局。谷歌此次以音频交互为切入点,强调实用性与生态整合,试图在竞争中占据一席之地。产品预计今年晚些时候上市。
## 裁员前的“最后的狂欢” Meta 即将于本周三启动新一轮大规模裁员,约 **8000 名员工**(占员工总数约 10%)将收到离职通知。据 WIRED 报道,公司内部已弥漫着焦虑与不安,许多员工选择“摸鱼”、提前离场,甚至争分夺秒地消耗公司提供的各项福利。 ## 福利“抢购”潮 最引人注目的是,员工们正疯狂使用 **每年 2000 美元的弹性福利**,该福利可用于健康、健身等活动。同时,一项每三年发放的 **200 美元音频设备补贴** 也引发了抢购 AirPods 等耳机的热潮。一位员工形容:“办公室几乎空了,大家不是在改简历,就是在和朋友做最后的告别。” ## 矛盾的背景:盈利新高与 AI 焦虑 此次裁员发生在 Meta 利润创纪录之际,但 CEO 扎克伯格坚持认为,公司需要将资金投入 **AI 数据中心**,并相信 AI 技术能够替代部分人力,让公司以更少的员工维持同样效率。这轮裁员是自 2022 年以来 Meta 的第四轮大规模裁员,但因其发生在社会对 AI 取代工作的普遍焦虑背景下,格外引人关注。 ## 员工士气跌至谷底 除了裁员,员工还面临其他不满:部分人被强制调岗至 AI 团队、公司部署监控软件追踪员工电脑使用情况以训练 AI 模型。多位员工表示,当前士气已跌至“前所未有的低点”。
本周《自然》杂志发表了两篇论文,分别介绍了两款旨在帮助科学家提出和验证假设的人工智能系统。其中,谷歌的“Co-Scientist”被设计为“科学家在环”模式,即研究人员不断用其判断来指导系统。而来自非营利组织FutureHouse的系统则更进一步,能分析特定实验类型产生的生物学数据。尽管谷歌声称其系统也适用于物理学,但两篇论文均以生物学数据为主,且假设相对直接——某种药物对某疾病有效。这并非试图取代科学家或科学过程,而是利用AI最擅长的能力:处理人类难以驾驭的海量信息。 ## 系统差异与共同目标 两套系统均属于“代理型”AI,它们在后台运行,调用外部工具来完成任务(微软的AI科学助手也采取了类似策略;OpenAI似乎是个例外,它仅针对生物学微调了大语言模型)。尽管存在差异,但它们的共同目标是应对科学信息的泛滥:在线出版使得期刊数量激增,论文数量随之膨胀,研究人员很难跟上本领域进展,更不用说跨领域发现潜在关联。 FutureHouse团队指出:“通过专注于‘组合合成’(识别不同领域间的非明显联系),Robin系统有效瞄准了人类专家因知识分割而可能忽略的‘低垂果实’。”这正是AI的用武之地——在研究人员处理其他事务时,在后台消化同行评审文献。 ## 药物重定位的实际验证 两篇论文均聚焦于药物重定位任务,即寻找已有药物(如癌症治疗药物)的新用途。谷歌的Co-Scientist在多个任务上表现出色,其中一项涉及肝纤维化治疗。系统基于现有文献和数据库,提出了一种候选药物方案,而该方案随后在实验室测试中得到了验证。FutureHouse的Robin系统则展示了从假设生成到数据分析的完整流程:它能阅读论文、提取关键数据,并针对特定问题(如药物靶点)进行推理。在测试中,Robin成功识别出可用于治疗罕见病的已上市药物,其推测的准确性得到了后续实验支持。 ## 局限与展望 尽管结果令人鼓舞,但两篇论文也指出了当前AI系统的局限性。首先,它们高度依赖已有数据的质量——如果文献存在偏倚或实验设计有缺陷,AI的结论也会受影响。其次,AI目前仅能处理相对简单的假设(如“药物A对疾病B有效”),对于涉及复杂机制或因果关系的科学问题,仍需要人类科学家的深度参与。此外,系统的可靠性仍需更多独立验证:Nature论文中展示的成功案例数量有限,且多来自公开数据集,实际应用中的真实效果尚待评估。 总体而言,这些AI助手更像是“科学家的副驾驶”,而非“自动驾驶仪”。它们能加速文献综述、生成候选假设,但最终的设计、验证和解释仍需由人类主导。未来,随着AI系统能力的提升和数据源的扩展,这类工具或将成为科研基础设施的一部分,帮助科学家在信息爆炸的时代保持洞察力。
在 AI 内容真假难辨的时代,谷歌的 SynthID 水印技术正成为行业标准。谷歌宣布,其 SynthID 数字水印技术已被 OpenAI、英伟达等公司采用。自三年前首次亮相以来,SynthID 已标记了 1000 亿张图片和视频,以及相当于 6 万年的音频数据。 SynthID 与传统的元数据标注不同,它将水印直接嵌入内容的像素或波形中,使其更难被移除。谷歌 DeepMind 科学家 Pushmeet Kohli 表示,团队在提升水印鲁棒性上做了大量研究,即使经过压缩、裁剪或旋转,水印依然存在。尽管有研究者声称找到了移除方法,但谷歌坚称这些方法并未成功。 除了 SynthID,谷歌还支持 C2PA 标准。Pixel 10 手机拍摄的照片会包含元数据,描述图像的处理过程。如果高倍变焦照片包含生成式 AI 元素,也会被标记。谷歌还计划在未来几周内为 Pixel 8、9、10 的视频添加类似功能,并在 Gemini、Chrome 和搜索中集成 C2PA 扫描功能。 SynthID 的普及意味着更多 AI 内容将被可靠标记。谷歌在 Gemini 应用中已支持上传内容并询问是否由 AI 生成。随着 OpenAI 和英伟达的加入,SynthID 有望成为 AI 内容鉴伪的通用标准,帮助用户区分真实与虚构。
谷歌在今年的I/O大会上正式推出 **Gemini 3.5 Flash**,并宣称这款模型在保持前沿智能水平的同时,大幅提升了效率,有望让复杂的智能体(Agentic)任务真正实现规模化落地。 ## 速度与智能兼得 Gemini 3.5 Flash 的输出速度达到 **近300 tokens/秒**,而基准测试成绩与上一代旗舰模型 Gemini 3.1 Pro 相当——后者的输出速度仅为前者的四分之一。这意味着开发者可以用更低的成本、更短的时间获得同等质量的推理结果,尤其对需要长时间运行的智能体场景至关重要。 ## 效率突破:从“烧钱”到“划算” 生成式AI目前普遍面临成本高昂的困境,而智能体任务(如自动编程、多步骤工具调用)会进一步放大这一问题。Gemini 3.5 Flash 通过 **预训练和后训练的双重优化** 实现了效率飞跃。谷歌产品管理高级总监 Tulsee Doshi 透露,团队从开发者使用反馈中获得了关键洞察,特别是在代码生成和工具使用方面。 > “后训练阶段真正解锁了用户反馈的价值,比如来自 Antigravity 的反馈。你看到的代码性能和工具使用性能的提升,正是这些反馈的体现。” ## 代码能力跃升,对标GPT-5.5 谷歌此次重点强化了模型的代码生成能力,这是智能体方向的核心应用。在 **Terminal Bench** 和 **SWE-Bench Pro** 等专业基准测试中,Gemini 3.5 Flash 不仅大幅超越前代 Flash 模型,还小幅领先 Gemini 3.1 Pro,得分与 OpenAI 更大、更昂贵的 **GPT-5.5** 处于同一区间。 ## 产品落地:从今天开始 Gemini 3.5 Flash 即日起将陆续集成到谷歌的多个产品中。Doshi 强调,这只是开始,未来 3.5 Pro 将进一步提升性能,并延续“Flash 追上 Pro”的迭代节奏。 对于开发者而言,这一更新意味着:更快的响应、更低的推理成本,以及更可靠的智能体能力。如果效率优势能够持续,谷歌或许真的找到了让 AI 从“炫技”走向“实用”的关键路径。
在2026年Google I/O大会上,Google与沃尔沃宣布了一项重大合作:Gemini AI助手将能够接入沃尔沃即将推出的EX60 SUV的外部摄像头,实时解读停车标志等周边环境信息。这一功能依托于沃尔沃内置的Android Automotive操作系统,以及高通Snapdragon芯片提供的算力。 **核心功能与场景** Gemini不仅能翻译复杂的停车标志,还能识别车道标线、回答关于附近地标或餐厅的问题。例如,车主可以直接询问“这里能停多久?”“需要许可证吗?”等。Google表示,未来Gemini还能帮助用户更好地理解导航指令,提升驾驶体验。 **技术实现** 该功能并非仅靠云端AI,而是结合了车端实时计算:沃尔沃EX60搭载的高通Snapdragon系统级芯片负责处理摄像头数据,并通过OTA软件更新持续优化。Google Android Automotive副总裁Patrick Brady强调:“Gemini将使你的驾驶更智能,让你在途中随时了解周围环境。” **潜在风险与挑战** 尽管停车标志解读看似实用,但准确性至关重要。以纽约市为例,停车标志极其复杂,一旦Gemini误读,可能导致罚单甚至车辆被拖走。Google必须确保功能可靠,否则用户可能直接禁用。此外,隐私与数据安全也是用户关注的焦点。 **行业影响** 这是AI从“语音助手”向“视觉+移动”进化的关键一步。将大模型与车载摄像头结合,打开了车外环境交互的新维度。沃尔沃作为首批合作伙伴,未来可能将类似能力扩展到更多车型。Google Maps也将受益于“视觉能力”,提供更精准的导航。 **小结** Gemini上车,不只是语音问答,而是让汽车真正“看懂”世界。虽然目前仅限停车标志,但未来潜力巨大。Google和沃尔沃需要共同确保技术成熟,避免因误判而引发信任危机。
Google I/O 2026 主题演讲再次以 AI 为核心,发布了包括 **Gemini 3.5 Flash** 和 **Gemini 3.5 Pro** 在内的新一代模型,其中 Flash 版本即日起成为 Gemini 应用和 AI 模式搜索的默认模型,速度更快、代理能力更强,并改善了安全护栏。同时,Google 推出了全新的 **Gemini Omni** 模型家族,首个版本 **Omni Flash** 支持从文本、图片、视频、音频等多种输入生成视频片段,未来目标是从任意输入创建任意内容。此外,Google 还展示了 **Project Aura** 智能眼镜的新进展,以及 **Gemini Spark**——一款始终在线的 AI 代理,可自动撰写邮件、创建学习指南、监测隐藏信用卡费用等。Gmail、搜索等应用也获得了 AI 功能更新。以下是本次大会的 13 大亮点汇总。
Google DeepMind 在 Google I/O 大会上宣布,将 **街景(Street View)** 数据整合到 **Project Genie** 中,打造沉浸式、可交互的世界模拟器。用户不仅可以在熟悉的街道上漫步,还能调整天气、模拟罕见事件,为机器人训练、游戏开发、旅行规划等场景提供前所未有的真实感。 ## 从街景到“世界模拟器” Project Genie 是 Google 的通用世界模型,能够生成多样、交互的环境。过去,它通过文本或图像提示创建游戏世界;如今,结合 **20 年来积累的 2800 亿张街景图像**(覆盖 110 个国家),Genie 可以精确模拟现实街道的细节。DeepMind 研究员 Jack Parker-Holder 举例:一台即将在伦敦部署的机器人,很少见到阳光。Genie 可以模拟维多利亚式建筑上罕见的阳光反射,让机器人提前适应,避免被强光“惊吓”。 ## 场景:从旅行到灾难模拟 对于普通人,Genie 的街景模拟意味着更丰富的探索体验。你可以“走进”纽约的某个街区,将其切换为雪景,看看冬日的模样;或者模拟“后天”式的极端天气,感受环境变化。这种能力不仅用于娱乐,更在 **机器人训练** 和 **自动驾驶** 中发挥关键作用。Genie 3 此前已为 Waymo 提供模拟器,训练自动驾驶汽车应对“极罕见事件”,如龙卷风或偶遇大象。接入街景后,Waymo 可以针对更多城市的地理特征进行定制化训练。 ## 技术融合:现实与模拟的边界模糊 Google 将街景这一“真实世界的数据宝库”与 Genie 的生成能力结合,标志着世界模型从“虚构场景”迈向“现实镜像”。这不仅降低了机器人部署的成本(减少真实环境测试风险),也让用户能以前所未有的方式“预演”旅行或探索。不过,目前该功能仍处于研究预览阶段,仅面向部分 AI Ultra 订阅用户开放。未来,随着数据集的扩大和模型优化,我们或许很快就能在自己的手机上“穿越”到任何一条街,体验任意天气与事件。 ## 小结 Genie + Street View 的组合,让世界模型不再是科幻概念,而是触手可及的工具。无论是为机器人“预习”伦敦的阳光,还是为旅行者“预览”雪中的巴黎,这项技术都在重新定义我们与数字世界的互动方式。
谷歌在年度I/O开发者大会上发布了Gemini 3.5 Flash,这是其迄今为止最强大的编程和自主AI智能体模型。该模型能够独立执行复杂任务,甚至从零构建操作系统,标志着谷歌从对话式AI向智能体式AI的战略转变。 ## 性能飞跃:速度与质量兼得 **Gemini 3.5 Flash**在编码、智能体任务和多模态推理等几乎所有基准测试上超越了上一代旗舰模型**3.1 Pro**,同时延迟更低。DeepMind首席技术官Koray Kavukcuoglu透露,该模型速度比前沿模型快4倍,而经过优化的版本更是达到12倍提速,且质量不变。这种速度对于需要多智能体同时运行、处理长期任务的场景至关重要。 ## 从聊天到行动:智能体原生设计 谷歌不再将AI定位为“回答问题”的工具,而是转向能**自主规划、构建和迭代**的智能体。在I/O大会上,工程师Varun Mohan演示了多个智能体分工协作,在谷歌的智能体开发平台**Antigravity**中从零构建了一个完整操作系统。Kavukcuoglu表示,3.5 Flash与Antigravity协同开发,为智能体提供了原生的“工作环境”。同期发布的**Antigravity 2.0**是一款专为智能体优先开发设计的桌面应用。 ## 实际落地:银行与数据科学先行 谷歌称,3.5 Flash的智能体能力已在合作伙伴中产生实际影响。例如,银行和金融科技公司利用它自动化原本需要数周的工作流程,数据科学团队则在复杂数据环境中快速发现洞察。模型可自主运行数小时,但在遇到决策点或权限问题时,会暂停并请求用户输入,确保关键判断由人类掌控。 ## 未来蓝图:3.5 Pro协作模式 谷歌计划在后续发布**Gemini 3.5 Pro**,届时两者将形成分工:3.5 Pro负责全局规划与编排,而3.5 Flash则高效执行具体任务。这种“规划-执行”分离的架构,有望进一步释放智能体在复杂工作流中的潜力。 ## 小结 Gemini 3.5 Flash的发布,不仅是技术迭代,更代表了AI应用范式的转变。当模型能够自主执行任务、构建软件、管理项目时,AI的角色从“助手”升级为“协作者”。谷歌正用速度和智能体原生设计,抢占下一波AI落地的制高点。
在2026年Google I/O大会上,谷歌发布了全新的**AI信息代理(information agents)**功能,标志着搜索从被动响应向主动服务的重大转型。与传统的“一问一答”式搜索不同,信息代理能够在后台**7x24小时持续运行**,自动监控用户指定的主题,并在出现重要变化时主动推送通知。用户可以通过AI模式创建多个自定义代理,用于跟踪股价、航班价格、体育赛事、突发新闻、房价趋势等。代理不仅能汇总多源信息,还能解释事件的重要性、对比不同观点,并提供可操作的洞察。这一功能被视为**Google Alerts的进化版**,但远超简单的关键词提醒。信息代理将于今年夏天率先面向美国地区的**Google AI Pro和Ultra订阅用户**开放,后续扩展至更多市场。此外,谷歌还同期推出了搜索界面的大幅改版,包括更智能的搜索框和AI驱动的查询建议,以支持更长的对话式查询。
谷歌在2026年I/O大会上宣布,将扩大其AI安全工具 **CodeMender** 的对外测试范围,邀请更多专家团队试用其API。这款被称为“代码安全AI代理”的工具最早于去年10月亮相,如今谷歌正将其定位为“帮助保护全球代码库”的关键产品。此举紧随Anthropic发布 **Claude Mythos Preview** 之后,后者因宣称“过于强大不宜公开发布”而引发轰动,并吸引了美国联邦储备委员会主席及多家顶级银行的关注。 ### 安全赛道:AI巨头的新战场 Anthropic的Mythos不仅重振了其在政府中的声誉(此前曾因供应链风险认定和诉讼受挫),更开辟了一条高利润的商业路径——面向企业和政府提供早期接入服务。这迫使竞争对手加速行动:OpenAI迅速推出了类似产品,而谷歌现在也通过CodeMender正式入局。谷歌DeepMind CTO **Koray Kavukcuoglu** 在接受The Verge采访时证实,谷歌已与多个政府和企业就使用CodeMender审计系统展开讨论。 ### 从“修复漏洞”到“争夺客户” 与Mythos类似,CodeMender不仅能识别安全漏洞,还能直接修复它们。谷歌CEO **Sundar Pichai** 在周一的媒体简报会上坦言:“Mythos证明了超大规模模型在安全用例中的价值,我们对此表示认可。” 这暗示谷歌正将CodeMender定位为与Mythos直接竞争的产品,而非简单的内部工具。 ### 行业趋势:安全成为AI盈利的关键 随着OpenAI、Anthropic和谷歌等公司面临IPO或保持领先的压力,网络安全正成为AI实验室眼中的“现金牛”。CodeMender的对外扩展标志着谷歌从“技术展示”转向“商业落地”的重要一步。然而,Mythos的“过于强大”叙事是否只是营销策略?CodeMender在实际场景中能否达到同等效果?这些问题仍有待市场验证。 **小结**:AI安全竞赛已从概念验证进入客户争夺阶段。谷歌的入局使竞争更加激烈,但真正的赢家将由实际的安全成效和客户信任决定。
在今年的 **Google I/O** 大会上,谷歌宣布对搜索进行重大 AI 改造,标志着“十个蓝色链接”时代的终结。新的搜索体验不再以链接列表为核心,而是转变为由 AI 驱动的交互式体验,包括对话式回答、自主信息代理和个性化小工具。用户将能输入更长的自然语言查询,并获得 AI 生成的摘要及后续追问能力。此外,谷歌推出“信息代理”功能,可全天候监控网络变化并主动推送更新,这被视为 2003 年 **Google Alerts** 的进化版。这一转变将进一步减少用户对传统网页链接的点击,对依赖搜索流量的出版商构成新的挑战。