印主权大语言模型评价两极分化,“印度AI使命”进展如何?
主权大语言模型评价两极分化情况
近期,印度主权大语言模型Sarvam - M的发布在该国引发广泛争议,评价褒贬不一。一方面,该模型因其对印度语言、数学和编程任务的关注而受到称赞,有人认为它是“印度在实现其AI雄心过程中里程碑式的一步”;另一方面,在开发人员可下载和测试AI模型的平台“拥抱脸”上,Sarvam - M在发布头两天的下载量仅为334次,与之对比,美国门罗风险投资公司的投资者达斯将两名韩国大学生搭建的另一模型发布到“拥抱脸”上,后者很快获得了近20万次下载,因此Sarvam - M被一些人批评是“过度炒作的产品”。此外,5月早些时候印度政府支持的基础大语言模型Param - 1,截至5月25日下载量仅有12次。
“印度AI使命”进展
取得的成果
开源社区影响力提升:2024年,印度成为全球知名开源代码托管平台GitHub相关AI项目的第二大贡献者,占全球贡献的19.9%,仅次于美国的23.4%,略高于欧洲的19.5%,标志着印度在开源AI社区中的影响力日益增强。
AI技能普及率较高:从2015年到2024年,印度在AI技能普及率方面排名全球第二,得分为2.5,仅次于美国(2.6),意味着印度专业人士的AI技能集中度是全球平均水平的两倍多。微软近期的全球在线安全调查显示,65%的印度人使用过AI工具,是全球平均水平31%的两倍多。有研究显示,印度学生和专业人士使用生成式AI技术的可能性比亚太同龄人高出30%,印度有超过40万IT专业人士使用AI工具为多国客户服务。
部分领域表现亮眼:印度凭借庞大的人口基数、巨大的移动数据市场、海量的数据生成能力以及技术人才储备等优势,近年来在AI发展领域呈现较快增长的态势,在多语言模型开发、医疗与健康、初创企业生态等多个领域表现亮眼。例如在多语言模型开发领域,印度语言众多,除英语和印地语两种联邦官方语言外,还有22种地方官方语言,一些本土企业通过训练适应多语言环境的大模型,已成功在东南亚和南亚市场赢得订单。
存在的不足
私人投资落后:斯坦福大学的《2025年AI指数报告》显示,就2013年以来的私人领域AI投资而言,印度吸引了112.9亿美元,落后于美国(4709亿美元)、中国(1193亿美元)和英国(282亿美元)等国。
研究论文引用较少:2023年,印度占全球AI研究出版物的9.2%,而中国和欧洲分别占23.2%和15.2%。在有关“负责任AI”的研究中,印度在2024年仅发表了42篇论文,少于美国(669篇)和中国(268篇)。
专利产出不足:据《德干先驱报》报道,2010年至2022年期间,中国和美国分别获得了全球60%和20%的AI专利,而印度仅占其中0.5%。不过,印度观察家研究基金会(ORF)去年5月发表的文章称,印度是十大AI专利产生国之一,根据2021年的一份报告,印度在个人设备和计算、商业、电信等AI领域获得不少专利