SheepNav
新上线今天0 投票

更快、更便宜、更懂文化:Avataar 视频 AI 专为印度规模打造

印度 AI 模型产出相较于美国、欧洲和中国一直较为缓慢。为促进发展,印度政府启动了价值约 12 亿美元的 India AI Mission 计划,为入选初创公司提供补贴 GPU 算力,换取其模型公开发布。入选该计划的 12 家初创公司之一 Avataar AI 推出了名为 Varya 的新视频模型,该模型专为理解本地文化背景而设计——例如识别不同的节日、食物和服饰。

这家由 Peak XV 支持的初创公司专注于为电商创建视频工具。Varya 并非从零构建,而是基于阿里巴巴开源的视频生成模型 Wan 2.2,通过 蒸馏技术 将其压缩为更精简、更快的版本。结果,Varya 仅需 4 步推理即可生成视频,而 Wan 2.2 需要 50 步,速度提升 10 倍,成本大幅降低。具体而言,使用 NVIDIA H200 GPU,Varya 生成一段 5 秒 720p 视频仅需 45 秒,而 Wan 2.2 需要 1230 秒。

Varya 最引人注目的是其价格。托管服务每秒钟视频收费 ₹0.48(约 $0.005),远低于 Veo、Kling、Luma、Runway 等模型(通常每秒 $0.10 或更多),价格差距约 20 倍。Peak XV 董事总经理 Rajan Anandan 指出:“印度是一个视频优先的市场……如果视频 AI 要惠及学生、教师、中小微企业、创作者、企业和公共服务,成本必须大幅下降。成本是印度采用 AI 的最大解锁因素。”

此外,图像和视频生成模型常常忽略文化细微差别,产生刻板或通用输出。Avataar AI 表示已使用精选数据训练 Varya,使其能够识别包括食物、服饰、建筑和节日在内的文化元素。Varya 将以开放权重形式发布在印度政府的 AI Kosh 门户上。

延伸阅读

  1. Siri 不会成为你的 AI 女友:苹果明确划清界限
  2. Few-Shot重采样:让数据挖掘的统计显著性检验快两个数量级
  3. ProHiFlo:层级流匹配框架实现从头蛋白质生成,功能性引导成亮点
查看原文