Meta 宣布将利用 AI 分析用户照片和视频中的视觉线索,如身高或骨骼结构,以判断用户是否未满 13 岁,并在确认后移除其 Facebook 和 Instagram 账号。该系统已在部分国家运行,Meta 计划推广至更多地区。 ## 技术细节:非面部识别,而是年龄估算 Meta 在官方博客中强调,这一技术并非面部识别。AI 系统通过分析图像中的**身高、骨骼结构**等一般性视觉特征,结合文本和互动行为分析,来估算用户的年龄。这种方法不会识别具体个人,而是专注于判断用户是否可能低于 13 岁。 ## 多维度年龄检测:从生日祝福到学校年级 除了视觉分析,Meta 还利用 AI 扫描整个用户资料,寻找与年龄相关的上下文线索,例如**生日庆祝活动、学校年级提及**等。这些信号来自帖子、评论、个人简介、标题等多种内容格式。未来,Meta 计划将这一技术扩展到 **Instagram Live 和 Facebook 群组**等更多功能中。 ## 执行流程:疑似未成年账号将被冻结 一旦 AI 判定用户可能未满 13 岁,Meta 将**停用该账号**,并要求用户通过公司的年龄验证流程证明年龄,否则账号将被删除。这一流程旨在确保未成年用户无法绕过限制。 ## 背景:儿童安全诉讼压力下的举措 此次发布正值 Meta 面临多起儿童安全相关诉讼。数周前,新墨西哥州陪审团裁定 Meta 需支付 **3.75 亿美元民事罚款**,原因是其在平台安全性上误导消费者,使儿童面临风险。法院还要求 Meta 对平台进行根本性改革。Meta 曾威胁关闭该州的服务,但最终选择加强年龄验证措施。 ## 行业影响与挑战 Meta 的 AI 年龄估算技术代表了科技巨头在儿童保护领域的新尝试,但**隐私和准确性**仍是关键挑战。视觉分析可能误判发育较早的青少年,而文本分析也可能因虚假信息失效。此外,如何在保护儿童的同时避免过度监控,是 Meta 需要平衡的问题。 这一举措也反映了全球监管对未成年人在线安全的日益关注。其他科技公司如 TikTok、YouTube 也已推出类似年龄验证措施,但 AI 视觉分析的应用仍属前沿。Meta 的广泛部署可能为行业树立新标准,但也可能引发更多关于数据使用的讨论。
语音 AI 公司 ElevenLabs 近日公布了其 5 亿美元 D 轮融资的新投资者名单,包括贝莱德、英伟达、Salesforce Ventures 等机构,以及演员杰米·福克斯、伊娃·朗格利亚和《鱿鱼游戏》创作者黄东赫等个人投资者。公司同时宣布年化经常性收入(ARR)已突破 5 亿美元,估值从去年 9 月的 66 亿美元飙升至今年 2 月的 110 亿美元。 ## 融资与增长亮点 - **新投资者阵容**:机构投资者包括贝莱德、惠灵顿、D.E. Shaw、施罗德;战略投资者有英伟达、Salesforce Ventures、桑坦德银行、荷兰皇家电信(KPN)、德国电信;个人投资者则涵盖好莱坞明星与影视创作者。 - **ARR 里程碑**:去年底 ARR 约为 3.5 亿美元,今年 Q1 净增 1 亿美元,目前已超过 5 亿美元。CEO Mati Staniszewski 上月曾透露 Q1 末 ARR 约为 4.5 亿美元,增长势头强劲。 - **估值跃升**:从去年 9 月的 66 亿美元增至今年 2 月的 110 亿美元,半年内估值近乎翻倍。 ## 企业合作与战略布局 在过去的季度中,ElevenLabs 与德国电信、Revolut、Klarna 等企业签署了企业合同。德国电信旗下 T.Capital 董事总经理 Karine Peters 表示:“语音是客户交互中风险最高的渠道,对质量、延迟和安全性要求极高。ElevenLabs 不仅是品类领导者,更正在成为德国电信工业 AI 愿景的基础赋能者——从语音即服务到多语言自动化再到网络内 AI 代理。” ## 资金用途与零售投资者计划 除 D 轮融资外,ElevenLabs 还完成了 1 亿美元的二次要约收购,这是继去年 9 月之后的第二次。Staniszewski 在博客中透露,公司将通过 Robinhood Ventures 向零售投资者开放投资机会,但未提供具体细节。他强调,消费者不会信任听起来机械或交互怪异的系统,构建人类级别的 AI 语音模型至关重要。 ## 团队与研发 上月,ElevenLabs 收购了波兰语音 AI 初创公司 Papla 的团队,以加强研究力量。这表明公司在技术深度上持续投入,以保持语音合成领域的领先地位。 ## 行业意义 ElevenLabs 的快速成长反映了语音 AI 作为关键交互界面的崛起。随着企业将语音助手、客服机器人等场景从实验推向生产,高质量、低延迟、高安全性的语音模型成为刚需。ElevenLabs 在融资、收入、估值上的表现,不仅证明其商业模式的可行性,也预示着语音 AI 将更深入地嵌入金融、电信、娱乐等行业的客户交互流程。
AI 代理的部署正在从简单的聊天机器人转向更深入的应用集成。总部位于西雅图的初创公司 **CopilotKit** 刚刚完成了 2700 万美元的 A 轮融资,由 Glilot Capital、NFX 和 SignalFire 联合领投。该公司致力于让开发者能够将 AI 代理嵌入应用内部,而非仅仅提供一个文本交互界面。 ## 解决聊天机器人的“笨拙”体验 当前许多企业将 AI 简单实现为应用内的聊天机器人:用户输入指令,AI 尝试执行。然而,这种基于文本的界面往往体验不佳。例如,在旅行应用中规划完整行程时,用户可能需要浏览大量文字。CopilotKit 联合创始人 Atai Barkai 和 Uli Barkai 认为,这并未充分发挥 AI 代理和大语言模型(LLM)的潜力。他们主张,AI 代理应嵌入应用内部,理解用户操作、采取行动,并展示有用的交互界面,而不是仅仅返回冗长的文本块。 ## 核心产品:AG-UI 协议与企业工具包 CopilotKit 的核心是 **AG-UI 协议**,这是一个广泛采用的开源标准,旨在规范 AI 代理与用户界面(如浏览器或应用)的连接与通信方式。它提供流式聊天、前端工具调用和状态共享等功能,支持“人在回路”机制。AG-UI 为开发者提供了在应用中部署 AI 代理所需的框架和工具。 在此基础上,CopilotKit 还构建了企业工具包,增加了技术支持、自托管部署等功能,以满足企业将 AI 代理集成到产品中的需求。动态用户界面是 CopilotKit 的一大卖点。Atai 表示,开发者可以利用该框架提供 UI 规范和构建块,AI 代理能根据上下文生成相应的界面。例如,用户请求按类别查看收入分解时,代理可以展示一个可交互的饼图,而不是一段难以阅读的文字。他强调,代理可以“用交互式 UI 回应你,这些 UI 由你自己的公司定义”。 ## 行业意义与展望 CopilotKit 的融资反映了 AI 行业的一个重要趋势:**从简单的对话式 AI 向更具上下文感知和操作能力的“应用原生”代理转变**。随着 LLM 能力的提升,开发者越来越希望 AI 能无缝融入现有工作流,而不是作为独立窗口存在。CopilotKit 的开源协议降低了这一门槛,而企业工具包则为商业化铺平了道路。这笔资金将用于扩大团队、完善产品并推动企业采用。 总体而言,CopilotKit 正在构建 AI 代理与应用之间的桥梁,让交互更自然、更高效。对于希望提升用户体验的开发者来说,这无疑是一个值得关注的工具。
**仅剩4天**,TechCrunch Disrupt 2026推出限时优惠:购买一张门票,第二张同类型门票即可享受**50%折扣**。优惠截止于**5月8日太平洋时间晚11:59**,之后价格将上涨。 对于创始人、投资者和运营商而言,这或许是今年最划算的投入。Disrupt 2026将于**10月13日至15日**在旧金山Moscone West举行,旨在解决创业融资中的核心痛点——**人脉与访问权**。 ### 为什么选择Disrupt? - **Startup Battlefield 200**:在顶级VC面前路演,争夺**10万美元无股权奖金**。 - **Deal Flow Café**:专设投资者-创始人对话空间。 - **精准匹配**:与对口的投资者进行一对一或小组会议。 - **展区互动**:将冷启动转化为现场演示和真实对话。 ### 已确认的部分演讲嘉宾 - Nina Achadjian, Index Ventures - Puneet Agarwal, True Ventures - Karl Alomar, M13 - Rajeev Dham, Sapphire Ventures - Aklil Ibssa, Coinbase - Mo Jomaa, CapitalG - Grant Lee, Gamma - Dean Leitersdorf, Decart - Lindsey Mignano, Mignano Law Group - Josh Reeves, Gusto - Shailendra Singh, Peak XV - Lotti Siniscalco, Emergence Capital - Arsalan Tavakoli-Shiraji, Databricks - Michel Tricot, Airbyte - Rob Toews, Radical Ventures ### 行动建议 立即注册,锁定优惠。带上合作伙伴或同事,以更低成本获取更多商业机会。
在AI引发就业焦虑的当下,英伟达CEO黄仁勋给出了截然不同的观点。他近日在米尔肯研究所的对话中明确表示,AI不仅不会消灭工作,反而正成为“创造大量就业机会”的引擎。 ## 核心观点:AI是再工业化的机遇 黄仁勋认为,AI并非导致大规模失业的元凶,而是美国实现再工业化的最大机遇。他指出,AI产业催生了一种新型工业工厂——生产硬件基础设施的工厂,这些工厂以及整个蓬勃发展的AI行业都需要大量工人。值得注意的是,英伟达正是这类硬件的核心供应商。 ## 任务自动化不等于岗位消失 针对“AI取代人类工作”的普遍担忧,黄仁勋提出了一个关键区分:**任务(task)与岗位(job)并非同一回事**。即使AI接管了某个岗位中的具体任务,但该岗位在组织中承担的更广泛职能依然存在。换言之,自动化改变的是工作方式,而非工作本身的存在价值。 ## 批评“末日论”影响公众认知 黄仁勋对AI“统治人类”或“摧毁经济部门”的耸人听闻言论持批评态度。他担忧这些“科幻故事”会让公众对AI产生恐惧,从而阻碍人们真正接触和使用AI技术。有趣的是,许多末日论调恰恰来自AI行业内部,批评者认为这是一种营销手段,旨在为能力远未达到宣传水平的产品制造热度。 ## 行业背景与现实挑战 黄仁勋的乐观表态与当前公众情绪形成鲜明对比。多项调查显示,多数员工对AI取代工作感到焦虑。然而,历史经验表明,技术革命往往会创造新岗位而非单纯消灭旧岗位——例如互联网时代催生了电商运营、社交媒体管理等全新职业。AI产业目前正面临人才短缺,尤其是硬件工程、数据科学和AI安全等领域。 ## 结语 黄仁勋的发言为AI就业辩论提供了另一种视角:与其担心被取代,不如关注如何利用AI提升生产力并创造新价值。但这一乐观预期能否实现,取决于企业、教育体系和政策制定者能否协同应对转型挑战。
AI芯片公司Cerebras Systems的IPO进程终于接近终点线。这家公司周一宣布,计划以每股115至125美元的价格发行2800万股股票。按发行价上限计算,此次IPO将筹集35亿美元,市值达到约266亿美元。这一估值相比今年2月其10亿美元H轮融资时的230亿美元估值,在短短几个月内实现了可观的增长。 ## OpenAI高管押注,Cerebras背景深厚 Cerebras的投资者名单星光熠熠,其中最为引人注目的当属OpenAI的核心团队。根据公司提交的SEC文件,其天使投资人包括OpenAI创始人兼CEO Sam Altman、联合创始人兼总裁Greg Brockman、前首席科学家Ilya Sutskever(现已离职创办自己的AI初创公司),以及OpenAI董事会成员、Quora CEO Adam D’Angelo。此外,Sun Microsystems和Arista联合创始人Andy Bechtolsheim、英特尔CEO Lip-Bu Tan等科技界名人也在其列。这种深厚的“OpenAI朋友圈”关系,为Cerebras的技术路线和商业前景增添了独特的背书。 ## 技术差异化:晶圆级引擎挑战GPU霸权 Cerebras的核心产品是**Wafer-Scale Engine 3(晶圆级引擎3)**,这是一款专为AI设计的芯片,直接挑战英伟达等厂商的GPU方案。公司声称,其芯片在推理任务上比竞品更快,同时功耗更低。推理是处理用户提示所需的计算环节,随着大模型应用普及,推理效率正成为关键竞争维度。Cerebras的晶圆级架构将整个晶圆制成单一芯片,避免了传统芯片间的通信瓶颈,这一技术路线在AI加速领域独树一帜。 ## 2026年最大科技IPO?市场信号积极 如果Cerebras的IPO顺利以区间上限完成,它将成为**2026年迄今为止最大的科技公司IPO**。这一成功可能为后续更大规模的上市铺平道路,例如SpaceX,以及可能紧随其后的OpenAI和Anthropic。市场对AI基础设施的热情持续高涨,Cerebras的上市将检验投资者对专用AI芯片赛道的信心。 ## 主要股东与投资机构 除上述天使投资人外,Cerebras的主要机构股东包括**Rick Gerson的Alpha Wave、Benchmark、Eclipse、Fidelity和Foundation Capital**,这些机构各持有超过5%的股份。投资者名单中还包括1789 Capital、阿布扎比增长基金、阿布扎比G42、Altimeter、AMD、Atreides Management、Coatue、Moore Strategic Ventures、Tiger Global、Valor Equity Partners和VY Capital等。 ## 行业影响与展望 Cerebras的IPO不仅是一次资本事件,更可能成为AI芯片产业格局变化的催化剂。随着大模型训练和推理需求爆炸式增长,专用AI芯片市场正从英伟达一家独大走向多元化。Cerebras的上市若能获得高估值,将激励更多资本涌入这一赛道,推动技术创新和竞争。对于OpenAI而言,其投资组合中Cerebras的成功上市,也将进一步巩固其生态影响力。 目前,Cerebras的IPO定价区间和最终估值仍有待市场确认,但毫无疑问,它已成为2026年最受瞩目的科技IPO之一。
移动应用情报公司 **Appfigures** 的最新报告揭示了一个显著趋势:**图像AI模型的发布为移动应用带来的下载量,是传统模型更新的6.5倍**。这一发现标志着AI应用增长动力的转变——从过去依赖对话体验和语音功能升级,转向视觉内容生成能力的竞争。 ## 数据对比:图像模型 vs. 聊天模型 报告以 **Google Gemini** 和 **ChatGPT** 为例进行了量化分析: - **Gemini** 在2025年8月推出图像模型 **Nano Banana**(基于Gemini 2.5 Flash)后的28天内,获得了 **超过2200万次额外下载**,是同期普通模型更新下载量的 **4倍以上**。 - **ChatGPT** 于2025年3月发布 **GPT-4o图像模型** 后,28天内新增 **超过1200万次安装**,约为其GPT-4o、GPT-4.5和GPT-5等纯文本/聊天模型发布所带来下载量的 **4.5倍**。 其他案例也印证了这一趋势。**Meta AI** 在2025年9月推出视频模型“Vibes”后,28天内获得了约 **260万次增量下载**。尽管这属于视频模型,但其本质仍是视觉内容驱动,而非文本。 ## 增长≠收入:下载量飙升背后的隐忧 然而,Appfigures同时发出警告:**下载量的激增并不必然转化为收入的增长**。图像模型的发布为用户提供了尝试新功能的理由,吸引他们安装应用并体验改进的图像生成能力,但这并不意味着他们会转化为付费订阅用户。 ## 行业背景与解读 这一趋势反映了AI应用市场的两个关键变化: 1. **用户偏好从“聊”转向“看”**:在ChatGPT等聊天机器人普及后,用户对纯文本交互的新鲜感下降,而图像、视频等视觉内容的生成更具吸引力和传播性,能快速激发下载冲动。 2. **变现挑战依然存在**:图像模型虽然能有效拉新,但用户付费意愿可能不如对核心对话功能的依赖度高。应用开发者需要在用户留存和订阅转化上投入更多精力,例如通过提供高质量、差异化的视觉生成服务,或结合其他付费功能。 ## 小结 **图像AI模型正成为移动应用增长的新抓手**,其下载拉动效应远超传统聊天模型升级。但开发者需警惕“叫好不叫座”的风险,将短期流量转化为长期商业价值才是关键。
在Elon Musk试图阻止OpenAI向营利性转型的庭审中,唯一一位直接针对AI技术作证的专家证人——加州大学伯克利分校计算机科学教授Stuart Russell——表达了对AGI军备竞赛的深切忧虑。 ## 庭审焦点:AI安全与营利动机的冲突 Musk的法律团队主张,OpenAI最初作为专注于AI安全的慈善机构成立,如今却因追逐利润而迷失方向。为佐证这一论点,他们引用了创始团队早期关于需要以公共利益制衡Google DeepMind的邮件和声明。而Russell作为资深AI研究者,他的证词旨在提供AI技术背景,并确立这项技术具有足够危险性,值得警惕。 Russell在2023年3月签署了一封呼吁暂停AI研究六个月的公开信。颇具讽刺意味的是,Musk本人也签署了同一封信,尽管他当时正在创办自己的营利性AI实验室xAI。 ## Russell的证词:风险与矛盾 Russell向陪审团和法官Yvonne Gonzalez Rogers指出,AI发展伴随多重风险,包括网络安全威胁、对齐问题,以及开发通用人工智能(AGI)时赢家通吃的特性。他最终表示,追求AGI与确保安全之间存在内在张力。 然而,在OpenAI律师的反对下,法官限制了Russell的证词范围,使他无法在公开法庭上详细阐述对无约束AI生存威胁的更大担忧。Russell长期以来一直批评前沿实验室在全球范围内竞相率先实现AGI所引发的军备竞赛动态,并呼吁政府加强对该领域的监管。 ## 交叉质询:证词的局限 OpenAI的律师在交叉质询中着力证明,Russell并未直接评估OpenAI的企业结构或其具体安全政策。这暗示了庭审的局限性:法律辩论聚焦于公司治理与合同义务,而非AI安全的深层技术问题。 ## 行业背景:AI安全争论持续升温 此次庭审折射出AI行业的核心矛盾:那些曾呼吁谨慎发展的声音,如今却身处营利性AI竞赛的最前沿。Musk一边签署暂停研究的公开信,一边加速推进xAI,这种双重立场让他的诉讼动机备受质疑。而Russell的证词虽被限制,却再次将AGI军备竞赛的风险置于聚光灯下。 随着OpenAI、Google、Anthropic等实验室持续突破能力边界,如何平衡创新速度与安全约束,已成为悬在整个行业头顶的达摩克利斯之剑。
由 Bret Taylor 创立的 AI 初创公司 Sierra 于周一宣布完成 9.5 亿美元融资,由 Tiger Global 和 GV 领投,投后估值超过 150 亿美元。此轮融资使 Sierra 持有资金超过 10 亿美元,公司称将用于打造“AI 驱动客户体验的全球标准”。 在竞争激烈的 AI 市场中,Sierra 积极展示增长:从两年前的 4 个设计合作伙伴,到如今声称拥有超过 40% 的财富 50 强企业客户,其平台上的 AI 代理处理着数十亿次交互,涵盖抵押贷款再融资、保险理赔、退货管理及非营利筹款等场景。 Sierra 的营收增长尤为迅猛:去年 11 月首次达到 1 亿美元年度经常性收入(ARR),今年 2 月初又宣布 ARR 达 1.5 亿美元。这一节奏既反映了企业部署 AI 的紧迫性,也体现了高昂的投入成本。Taylor 亦担任 OpenAI 董事长,他认为 AI 代理的最佳前景是为客户降低成本、增加收入,但前期投入巨大。 类似情况在 Uber 身上得到印证。Uber CTO Praveen Neppalli Naga 在 TechCrunch 的 StrictlyVC 活动中透露,公司去年底开放 AI 代理工具后很快超支,但已看到显著成效:在约 8000 名工程师中,10% 的代码由 AI 自主生成;一个酒店预订集成项目,原本需一年,使用代理工作流仅六个月完成。 Sierra 也在扩展平台能力,今年 4 月推出 Ghostwriter——一种“代理即服务”工具,用户用自然语言描述需求,Ghostwriter 即可自主创建并部署专用 AI 代理。 ### 行业视角 这轮融资标志着企业级 AI 代理赛道的竞争进入新阶段。Sierra 的高估值和快速增长的 ARR 表明,大型企业正积极拥抱 AI 代理来优化客户体验。然而,高投入与高回报并存,企业需在前期成本与长期收益间权衡。随着 Sierra 等玩家不断推陈出新,AI 代理有望从实验性工具转变为业务核心。
在 OpenAI 诉马斯克案开庭前夕,一段私人短信交流被公之于众,揭示了这位科技亿万富翁在寻求和解未果后的激烈反应。据 OpenAI 律师在周日提交的新法庭文件显示,马斯克在庭审开始前两天向 OpenAI 总裁兼联合创始人 Greg Brockman 发送了一条短信,建议 OpenAI 和解此案。Brockman 回复提议双方各自撤诉,但这一建议迅速激怒了马斯克。 马斯克随后回复称:“到本周末,你和 Sam 将成为全美最令人憎恨的人。如果你们坚持,那就这样吧。”这封短信内容虽未作为证据被法官采纳,但 OpenAI 方面意图借此证明马斯克的诉讼并非出于对 AI 安全的真诚关切,而是试图通过法律手段从其成功中牟利,同时打击竞争对手。 **案件背景与核心诉求** 马斯克于去年对 OpenAI 提起诉讼,指控其背离了非营利的初始使命,要求法院强制 OpenAI 拆解其营利性架构、公开其技术、终止与微软的授权协议,并支付包括惩罚性赔偿在内的巨额赔偿金。OpenAI 则提起反诉,称马斯克的诉讼本质是“勒索式的商业攻击”。 **短信事件的法律意义** 尽管主审法官最终裁定该短信内容不可作为证据,但 OpenAI 律师在公开文件中披露这一细节,已成功将舆论焦点引向马斯克动机的争议。法律观察人士指出,这类“和解或毁灭”式的威胁在商业诉讼中并不罕见,但由马斯克这样具有巨大公众影响力的人物发出,其冲击力远超普通案件。 **庭审进展与行业影响** 目前庭审仍在进行中。马斯克一方的专家证人阵容备受关注,但其唯一一位 AI 专家证人的资质已受到质疑。这场诉讼不仅关乎 OpenAI 的未来治理结构,更可能对整个 AI 行业的开源与商业化路径产生深远影响。若马斯克胜诉,OpenAI 的营利模式将被颠覆,微软等合作伙伴的权益也将受损。 值得注意的是,马斯克本人并未出庭作证,其法律团队试图将案件聚焦于 OpenAI 是否违背了创建时的非营利承诺。而 OpenAI 则强调,其转型为“有限营利”公司是为了吸引必要资本以推动 AGI 研发,且始终在使命框架内运作。 随着庭审深入,更多内部文件与证词可能浮出水面。这场 AI 领域最具标志性的法律对决,正在从技术理念之争演变为关于权力、金钱与 AI 治理的全面博弈。
两大 AI 头部公司 Anthropic 和 OpenAI 近期不约而同地选择了与资产管理公司合作,以更积极地推广其企业级 AI 产品。 Anthropic 与资产管理公司 BlackRock 合作,通过其 Aladdin 平台向机构客户提供 Claude 模型,帮助金融机构优化风险管理、投资分析和合规审查。OpenAI 则与 Fidelity Investments 达成合作,将 GPT-4 集成至 Fidelity 的客户服务平台,提升投顾效率和客户体验。 这种“AI+资管”的联合模式,反映出生成式 AI 正从技术验证走向行业落地。对于 AI 公司而言,与资管巨头合作能快速触达高价值企业客户,同时借助合作伙伴的行业信誉降低市场拓展阻力。对于资管公司来说,引入前沿 AI 能力则是保持竞争力的必要举措。 不过,企业级 AI 服务仍面临数据安全、合规性和模型可靠性等挑战。双方的合作协议中均明确了对客户数据的保护措施,包括私有化部署和联邦学习等方案。 随着 AI 竞争进入下半场,生态合作将成为关键策略。Anthropic 和 OpenAI 的这一步棋,或将加速企业 AI 市场的洗牌。
TechCrunch Disrupt 2026 推出限时买一赠一(BOGO)优惠活动,即日起至本周五(5月8日)结束。活动期间,购买一张同类型全价门票即可享受第二张 **50% 折扣**。该优惠仅持续5天,适合与合作伙伴或同事一同前往。 TechCrunch Disrupt 是科技界年度盛会,汇聚初创企业、投资人与行业领袖。此次促销旨在鼓励团队参与,降低结伴参会的成本。门票数量有限,建议尽早锁定折扣。
DoorDash 于本周一发布了一系列 AI 赋能的新工具,旨在帮助商家更高效地入驻平台、优化菜品图片,并基于现有内容快速搭建独立网站。这些工具覆盖了从入驻到营销的多个环节,体现了 DoorDash 通过技术降低商家运营摩擦的战略意图。 ## 智能入驻:从网站到 App 一键迁移 新推出的入驻工具与亚马逊在 2024 年上线的功能类似:商家只需提供自己的网站链接,系统便会自动抓取照片、营业时间、菜单等信息,生成 App 上的店铺页面。商家在上线前可以预览并编辑所有内容,确保信息准确无误。这一功能有望将过去繁琐的手动录入流程缩短至几分钟。 ## 图片编辑:AI 让菜品“看起来更好吃” DoorDash 为商家提供了两款 AI 图片编辑工具:**AI Retouch** 可替换背景、锐化图像并优化光线,但不改变菜品本身;**AI Replate** 则能调整照片的灯光和色彩,让菜品看起来像专业摆盘后的效果。商家还可以上传参考图片,将特定风格应用到现有菜品图上。这些工具降低了商家拍摄专业美食照片的门槛,有助于提升菜品在平台上的视觉吸引力。 ## 视频库升级:可标记菜品并追踪销售效果 DoorDash 还对商家视频库进行了重大改版。现在,商家可以在视频中标记具体菜品,用户点击标记即可直接下单。同时,视频库新增了数据看板,显示总观看次数、视频带来的销售额以及新客户销售额等关键指标。这使得视频从单纯的展示工具转变为可量化的营销渠道。 ## 建站与营销:从平台内拓展到平台外 DoorDash 的商务平台新增了**一键建站**功能:商家可以基于 App 中的菜单和图片,自动生成一个独立网站。在测试阶段,该功能帮助商家实现了接近 **10% 的平均订单转化率**。此外,新的营销活动构建器允许商家自动化内容创作、邮件推送和排期,进一步降低多渠道运营的复杂度。 DoorDash 商家产品负责人 Brian Tolkin 在声明中表示:“我们坚信,正确的技术应该消除摩擦,而不是增加它。这些新工具让商家能够专注于做好食物和提供卓越的客户体验。” ## 行业视角 DoorDash 此次的 AI 工具包,本质上是对平台生态的一次“供给侧赋能”。通过降低入驻和内容制作的门槛,DoorDash 有望吸引更多中小型餐厅加入平台,同时提升现有商家的运营效率。与亚马逊的入驻工具对标,也显示出 DoorDash 在商家服务上向电商巨头看齐的野心。视频标记和转化追踪功能,则顺应了短视频和直播带货的消费趋势。不过,这些工具的实际效果还需时间检验——尤其是 AI 图片编辑是否会导致“买家秀”与“卖家秀”不符,值得关注。
## 事件概述 一张“狗坐在火中淡定说‘This is fine’”的漫画,堪称过去十年最经典的网络迷因之一。如今,AI初创公司 **Artisan** 被指未经授权使用该漫画制作广告,引发原作者 **KC Green** 的强烈不满。 ## 争议始末 据Bluesky上曝光的照片显示,Artisan在一处地铁站投放的广告中,直接使用了Green的漫画形象,只是将台词改为“我的销售管道着火了”,并附上“雇佣AI销售代表Ava”的标语。Green在转发该帖时表示,自己“不断收到朋友告知此事”,并强调“这绝不是经过我同意的”。他直言广告“就像AI偷东西一样被偷了”,甚至号召粉丝“如果看到这幅广告,请随手涂掉”。 ## 公司回应 TechCrunch就此事联系Artisan,公司最初回应称“非常尊重KC Green及其作品,正在直接联系他”。随后又补充已安排时间与Green沟通。值得注意的是,这并非Artisan首次因广告引发争议——此前该公司曾投放“停止雇佣人类”的户外广告,创始人 **Jaspar Carmichael-Jack** 辩称那只是针对“某一类工作”,而非“人类整体”。 ## 迷因的失控与创作者的困境 “This is fine”最早出自Green 2013年的网络漫画《Gunshow》。尽管他本人并未完全放弃这个角色(甚至将其改编成游戏),但显然这个形象早已脱离他的控制。Green的遭遇并非孤例:从明星被AI“复活”演唱,到画师作品被用于训练模型,AI时代下,创作者对自身作品的控制权正面临前所未有的挑战。 ## 行业反思 这起事件再次将 **AI版权** 问题推向台前。当AI公司为推广自身服务而直接挪用他人作品时,其行为与它们标榜的“创新”形成鲜明反差。正如Green所言,这种“像AI一样偷窃”的做法,恰恰揭示了当前部分AI企业在数据使用和版权合规上的漠视。随着类似争议增多,行业或许需要更清晰的伦理准则和法律框架。
一项由哈佛医学院和贝斯以色列女执事医疗中心主导的新研究显示,在急诊室场景下,OpenAI的o1模型在诊断准确率上超越了人类医生。研究发表于《Science》期刊,通过多项实验对比了AI模型与内科医生的诊断能力。 ### 实验设计:真实急诊病例的盲测 研究团队选取了**76名**进入贝斯以色列急诊室的患者,由两位内科主治医生和OpenAI的o1、4o模型分别提供诊断。随后,另外两位不知情的主治医生对诊断结果进行评估。关键点在于,AI模型接收的信息**未经任何预处理**,与医生当时从电子病历中获取的数据完全一致。 ### 关键结果:AI在分诊阶段优势显著 在急诊分诊这一信息最不充分、决策最紧迫的环节,o1模型的表现尤为突出: - **o1模型**:在67%的分诊案例中给出了“完全正确或非常接近”的诊断; - **人类医生A**:准确率为55%; - **人类医生B**:准确率为50%。 研究指出:“在每个诊断节点上,o1的表现要么优于、要么持平于两位主治医生,且差异在初始分诊阶段最为明显。” ### 行业意义:AI辅助医疗的潜力与边界 该研究并非首次证明AI在特定医疗任务上的能力,但其**真实世界数据**和**零预处理**的设计更具说服力。哈佛医学院AI实验室负责人Arjun Manrai表示:“我们几乎测试了所有基准,AI模型超越了以往模型和医生基线。” 然而,研究者也强调,这并不意味着AI可以取代医生。在复杂病例、患者沟通和综合决策方面,人类医生仍不可替代。AI更适合作为辅助工具,在信息有限时提供快速、准确的参考,帮助医生减少误诊和延误。 ### 展望:从实验室到临床的挑战 尽管结果令人振奋,但将AI真正融入急诊流程仍面临挑战:数据隐私、模型泛化能力、医生信任度以及监管审批等。不过,随着o1等模型在推理能力上的进步,AI在医疗领域的应用正从“概念验证”走向“临床辅助”。
美国电影艺术与科学学院(奥斯卡主办方)于2026年5月2日发布新规,明确禁止AI生成的表演和剧本参与奥斯卡奖项角逐。根据规定,只有“在影片法律署名中明确列出、且由人类在知情同意下实际完成”的表演才有资格参评;剧本则必须由“人类创作”方可入围。学院同时保留要求片方提供AI使用情况及“人类创作成分”证明的权利。 这一规则调整正值AI在影视行业引发广泛争议之际。独立电影《Val》正计划使用AI生成的**瓦尔·基尔默**形象,而AI“演员”**蒂莉·诺伍德**持续占据头条。新一代视频生成模型更让部分电影人公开表达忧虑。AI问题曾是2023年演员与编剧罢工的核心争议点之一。在文学界,已有小说因疑似使用AI被出版商下架,多个作家组织也宣布AI生成作品不得参与文学奖项评选。 新规传递出明确信号:尽管AI工具在影视制作中日益普及,但**奥斯卡坚持“人类创作”的核心价值**。学院表示,未来可能进一步细化AI使用场景的界定标准,例如区分AI辅助(如特效、修图)与完全AI生成的内容。这一举措或将对好莱坞乃至全球影视产业的创作与评奖体系产生深远影响。
AI语音听写应用在短时间内取得了长足进步。过去,它们速度慢且不准确——除非你带有特定口音且发音清晰。大型语言模型(LLM)和语音转文本模型的进步改变了这一局面,这些系统能更准确地解析语音,同时保留足够的上下文以正确格式化文本。开发者还内置了自动去除填充词、修正口误以及处理标点符号的功能,输出的文本几乎无需额外编辑。目前市场上有数十款此类应用,我们精选了其中最好用、最实用的几款。 ## Wispr Flow **Wispr Flow** 是一款资金充足的AI听写应用,允许你添加自定义词汇和指令。它提供macOS、Windows和iOS原生应用,Android版本正在开发中。该应用让你通过选择**正式、随意和非常随意**三种风格来定制转录文本,适用于个人消息、工作和邮件等不同场景。如果你使用Cursor等“氛围编码”工具,还可以开启功能自动识别变量或标记聊天文件。桌面端免费版每周可转录**2000个单词**,iOS每月**1000个单词**。付费订阅计划起价**每月15美元**,提供无限转录。 ## Willow **Willow** 自称是那些不喜欢打字的人的时间节省利器。除了自动编辑和格式化等常见功能外,该应用利用大型语言模型,仅凭几个口述单词就能生成一整段文本。Willow采取更注重隐私的方式,将所有转录内容**本地存储**在设备上,并允许你完全退出模型训练。它还支持添加自定义词汇,以适应你的行业术语或地方方言。桌面应用免费版每月可转录**2000个单词**。个人订阅计划起价**每月15美元**,解锁无限转录并让应用记住你的写作风格。 ## Monologue 如果隐私是你的首要考虑,**Monologue** 允许你将AI模型直接**下载到设备**上进行转录,使数据完全脱离云端。此外,该应用可根据你使用的应用自定义语气。免费版每月可转录**1000个单词**;订阅费用为**每月10美元**或**每年100美元**。 ## 总结 这三款应用各有侧重:Wispr Flow 功能丰富且跨平台支持好;Willow 在隐私和智能生成方面表现突出;Monologue 则提供完全的本地隐私保护。用户可根据自身需求——如使用平台、隐私偏好和预算——选择最合适的一款。随着AI技术的持续发展,这些应用的准确性和智能化程度还将进一步提升。
在 TechCrunch 于旧金山举办的 StrictlyVC 活动上,Replit 创始人兼 CEO Amjad Masad 就 AI 编程助手领域的竞争格局、公司独立发展策略以及与苹果的法律纠纷等话题发表了看法。 ## Cursor 收购案:Replit 为何选择独立? 当被问及竞争对手 Cursor 据传将被 SpaceX 以 600 亿美元收购时,Masad 表示,对于依赖基础模型的小型 AI 公司来说,保持独立非常困难,尤其是当它们现金流为负时。据报道,Cursor 的毛利率为 **-23%**,如果还要投资训练模型,独立运营几乎不可能。 相比之下,Replit 选择了不同的路径。Masad 强调,Replit 已经保持 **超过一年的正毛利率**,并且净收入留存率高达 **300%**。他解释说:“我们目标客户不同,业务运营更理性。我们价格稍高,但提供端到端平台——从提示词到可扩展的部署应用,包括安全、数据库和迁移等所有功能。” ## 与苹果的法律纠纷:指控“彻头彻尾的谎言” Masad 还谈到了 Replit 与苹果在 App Store 上的冲突,他直言苹果的说法是“彻头彻尾的谎言”。Replit 曾因允许用户编写代码而面临苹果的审查,Masad 表示愿意将苹果告上法庭,以维护开发者的权益。他指出,苹果的规则对 Replit 这样的平台构成了不公平限制。 ## 亿级营收与未来展望 Masad 透露,Replit 在 2024 年全年收入仅为 **280 万美元**,但如今已朝着 **10 亿美元年化经常性收入** 的目标迈进。这一爆发式增长主要得益于非技术用户群体的需求——他们之前无法创建软件,而 Replit 降低了编程门槛。 关于未来,Masad 不排除收购的可能性,但他强调,Replit 的经济状况使其有能力保持独立,甚至可能开始投资自己的客户。
Meta 近日宣布收购人形机器人初创公司 Assured Robot Intelligence (ARI),交易金额未公开。ARI 专注于为机器人构建基础模型,使其能在复杂动态环境中理解、预测并适应人类行为。该公司团队将加入 Meta 的 AI 部门——超级智能实验室(Superintelligence Labs)的研究分部。 ARI 联合创始人 Xiaolong Wang 曾是英伟达研究员、加州大学圣迭戈分校副教授;另一位联合创始人 Lerrel Pinto 曾在纽约大学任教,并联合创办了儿童尺寸人形机器人公司 Fauna Robotics(上个月被亚马逊收购)。两人均获得过多项权威奖项。Meta 发言人表示,该团队将帮助 Meta 设计机器人控制和全身人形自学习的模型与前沿能力。 Meta 在人形机器人领域已有多年的研究积累。去年的一份内部备忘录曾透露 Meta 有意开发面向消费者的机器人产品,涵盖 AI 模型和硬件。即便 Meta 最终不推出消费级人形机器人,许多 AI 专家认为,实现通用人工智能(AGI)需要在物理世界中训练 AI 模型,让机器人通过直接交互而非仅靠数据来学习。 此次收购表明 Meta 正加速其在人形 AI 领域的布局,与特斯拉 Optimus、Figure AI 等公司展开竞争。尽管 ARI 此前仅完成一轮未披露金额的种子轮融资(来自 AIX Ventures),但其团队在机器人智能方面的专长可能为 Meta 的 AGI 愿景提供关键支撑。
本周,埃隆·马斯克在针对OpenAI的诉讼中,连续三天出庭作证,这场围绕AI公司“初心”与“变轨”的法律较量已进入白热化阶段。法庭上曝光的邮件、短信甚至马斯克本人的推文,让这场原本属于商业领域的纠纷,演变成一场关于**AI行业伦理与治理**的公开辩论。 ## 核心争议:非营利承诺是否被背叛? 马斯克的诉讼核心指控是:OpenAI CEO萨姆·奥尔特曼(Sam Altman)违背了公司最初“为人类福祉而开发AI”的非营利使命,通过转向**营利性模式**(for-profit model)背叛了创始初心。马斯克作为OpenAI的联合创始人之一,曾为该项目投入大量资金与精力,但后来因理念分歧离开。他认为,OpenAI如今与微软的深度合作以及商业化路径,彻底背离了其“非营利慈善”的原始定位。 ## 法庭交锋:证据与反击 在庭审中,马斯克的律师团队出示了多份关键证据,包括早期创始成员间的电子邮件、内部讨论文本,以及马斯克本人关于AI风险的公开推文。这些材料试图证明:OpenAI的转型并非渐进式调整,而是一次有预谋的“背叛”。 然而,OpenAI的辩护团队则强调,**非营利向营利的转变是生存与发展的必然选择**——AI研发需要巨额资金,仅靠捐赠无法支撑前沿模型的训练与迭代。他们指出,马斯克离开后,OpenAI才不得不寻求外部投资,而这一决策得到了多数董事会的支持。 ## 行业影响:AI治理的“罗塞塔石碑” 这起案件之所以引发广泛关注,不仅因为马斯克与奥尔特曼的个人恩怨,更因为它触及了**AI行业最敏感的神经**:当一家以“造福人类”为使命的非营利组织,最终演变为估值数百亿美元的营利巨头,其间的伦理边界该如何界定? 法律专家分析,此案的判决可能为AI公司的治理结构树立先例。如果法院认定OpenAI的转型构成违约或欺诈,那么其他打着“公益”旗号的AI项目将面临更严格的监管;反之,若判决支持OpenAI,则可能鼓励更多非营利实验室向商业化转型。 ## 未完待续:更多证人即将登场 目前,庭审仍在进行中,预计后续将有更多关键证人出庭,包括OpenAI现任董事会成员、早期投资者以及参与模型研发的核心工程师。马斯克的团队已表示,将传唤奥尔特曼本人接受交叉质询。 无论最终判决如何,这场诉讼都已成功将**AI伦理、企业治理与公共利益**的讨论推至公众视野。正如一位观察者所言:“我们正在见证的,不仅是两个科技巨头的角力,更是整个AI行业在商业化浪潮中寻找道德锚点的过程。”