韩国人工智能(AI)创业公司“十二实验室”(12 Labs)昨天公开了“视频语言基础模型”,试图在超大规模大型语言模型市场占据领先地位。
据Twelve Labs称,这个名为Pegasus-1的模型可以准确地将长视频总结为文本,并与用户就视频进行聊天,与现有最先进的视频语言模型相比,它的性能提高了61%。
该公司表示,Pegasus-1已经接受了超过10亿对图像文本和3500万对视频文本的训练,这大约是该公司收集的3亿对不同视频文本的10%。
该公司表示,Pegasus-1可以立即实现商业化,特别是在体育、媒体、娱乐、教育和人身安全等领域。
成立于2021年的Twelve Labs上个月吸引了美国芯片设计公司英伟达(Nvidia Corp.)、美国芯片制造商英特尔(Intel Corp.)和另外两家公司总计1,000万美元的投资。(联合通讯社)