Avataar Varya：专为印度打造的廉价文化感知视频AI

印度 AI 模型产出相较于美国、欧洲和中国一直较为缓慢。为促进发展，印度政府启动了价值约 12 亿美元的 India AI Mission 计划，为入选初创公司提供补贴 GPU 算力，换取其模型公开发布。入选该计划的 12 家初创公司之一 Avataar AI 推出了名为 Varya 的新视频模型，该模型专为理解本地文化背景而设计——例如识别不同的节日、食物和服饰。

这家由 Peak XV 支持的初创公司专注于为电商创建视频工具。Varya 并非从零构建，而是基于阿里巴巴开源的视频生成模型 Wan 2.2，通过 蒸馏技术 将其压缩为更精简、更快的版本。结果，Varya 仅需 4 步推理即可生成视频，而 Wan 2.2 需要 50 步，速度提升 10 倍，成本大幅降低。具体而言，使用 NVIDIA H200 GPU，Varya 生成一段 5 秒 720p 视频仅需 45 秒，而 Wan 2.2 需要 1230 秒。

Varya 最引人注目的是其价格。托管服务每秒钟视频收费 ₹0.48（约 $0.005），远低于 Veo、Kling、Luma、Runway 等模型（通常每秒 $0.10 或更多），价格差距约 20 倍。Peak XV 董事总经理 Rajan Anandan 指出：“印度是一个视频优先的市场……如果视频 AI 要惠及学生、教师、中小微企业、创作者、企业和公共服务，成本必须大幅下降。成本是印度采用 AI 的最大解锁因素。”

此外，图像和视频生成模型常常忽略文化细微差别，产生刻板或通用输出。Avataar AI 表示已使用精选数据训练 Varya，使其能够识别包括食物、服饰、建筑和节日在内的文化元素。Varya 将以开放权重形式发布在印度政府的 AI Kosh 门户上。

更快、更便宜、更懂文化：Avataar 视频 AI 专为印度规模打造

延伸阅读

相关资讯