索尼研究公司与新加坡全国人工智能核心签署备忘录合作研究东南亚大语言模型
东京和新加坡——2024 年 9 月 10 日,索尼研究公司(Sony Research)和新加坡全国人工智能核心(AI Singapore,简称AISG)项目宣布签署谅解备忘录(MOU),合作研究 SEA-LION(东南亚语言一体化网络)系列大语言模型(LLM),该模型专门针对东南亚地区进行了预训练和指导调整。通过这项共同的研究工作,索尼研究公司和AISG旨在解决东南亚语言在全球大语言模型中的空白,并努力确保大语言模型在全球范围内可覆盖到所有语言和人群。这项工作将通过索尼研究公司的索尼AI(Sony AI)部门进行。
根据协议,索尼研究公司和AISG将探索 SEA-LION 模型的测试和反馈,特别是针对泰米尔语和其他东南亚语言的测试和反馈,并分享大语言模型开发和研究方法方面的最佳实践。凭借索尼研究公司在印度的雄厚实力,双方将共同探讨索尼研究公司在印度语言(包括泰米尔语)大语言模型开发方面的专业知识,以及索尼研究公司近期在语音生成、内容分析和识别领域的研究成果的适用性。据估计,全世界有 6,000-8,500 万人讲泰米尔语,其中许多人生活在印度和东南亚地区。
“能否实现解决全球语言和文化问题的大语言模型一直是推动研究和开发新技术的障碍,而这些新技术对于我们所服务的全球人群来说具有代表性和公平性,”索尼研究公司总裁北野宏明(Hiroaki Kitano)表示,“作为一家全球性公司,多元化和本地化是至关重要的力量。特别是在东南亚,该地区的居民使用一千多种不同的语言。这种语言多样性凸显了确保AI模型和工具的设计能够支持全球所有人群需求的重要性。我们期待着与AISG的合作,期待AI能够造福所有人。”
“AISG很高兴能与索尼研究公司建立这一开创性的合作关系。SEA-LION模型具有泰米尔语功能,与之整合后,将极有可能提升新解决方案的性能。我们特别希望能够为泰米尔语和其他东南亚语言的 SEA-LION 模型的测试和完善做出贡献,同时分享我们在大语言模型开发方面的专业知识和最佳实践,我们期待看到这一合作将如何推动多语言AI技术的创新。”AISG的AI产品部门高级总监 Leslie Teo 表示。
索尼研究公司的北野先生一直活跃于新加坡科技界,与该国的许多组织和举措都有联系,促成了此次合作。他目前是新加坡人工智能及数据道德咨询委员会、信息通信媒体发展管理局(IMDA)、新加坡经济发展局(EDB)和新加坡国立研究基金会(NRF)的成员。