这个头戴摄像头的婴儿帮助人工智能学习儿童如何学习语言

   日期:2025-06-28     来源:本站    作者:admin    浏览:78    
核心提示:      在这个实验中,研究人员依靠一个住在澳大利亚阿德莱德附近的孩子戴的头盔摄像头拍摄的61小时的视频。那个叫山姆的孩

  

  

  在这个实验中,研究人员依靠一个住在澳大利亚阿德莱德附近的孩子戴的头盔摄像头拍摄的61小时的视频。那个叫山姆的孩子,从他六个月大到刚过两岁生日,断断续续地戴着相机已经有一年半了。相机记录了山姆在醒着的大约1%的时间里观察和关注的事物。它记录了山姆的两只猫、他的父母、他的婴儿床和玩具、他的房子、他的饭菜等等。“这个数据集是完全独特的,”莱克说。“这是我们了解一个孩子能接触到什么的最好窗口。”

  为了训练这个模型,莱克和他的同事们使用了60万帧视频帧,这些视频帧与萨姆的父母或房间里其他人在拍摄图像时所说的短语配对,总共有37,500个“话语”。有时单词和物体是匹配的。有时他们没有。例如,在一个场景中,Sam看着一个形状分类器,一个家长说:“你喜欢这个字符串。”在另一个场景中,一个成年人的手盖住了一些积木,一位家长说:“你也想要积木。”

  萨姆的爸爸送的

  研究小组给了模型两个线索。当物体和单词一起出现时,这是它们可能有联系的迹象。但当一个物体和一个单词没有同时出现时,这就表明它们可能不匹配。纽约大学的计算认知科学家、该研究的作者之一王伟(Wai Keen Vong)说:“所以我们在模型中有这种拉在一起、推在一起的现象。”他说:“我们希望在数据中有足够的例子,当父母说‘球’这个词时,孩子看到的是一个球。”

  将单词与其所代表的对象相匹配似乎是一项简单的任务,但事实并非如此。为了让你了解这个问题的范围,想象一下有小孩的家庭的客厅。它有所有正常的客厅家具,但也有孩子们的杂物。地板上到处都是玩具。蜡笔散落在咖啡桌上。窗台上有一个零食杯,椅子上有要洗的衣服。如果一个蹒跚学步的孩子听到“球”这个词,它可能指的是一个球。但它也可以指任何其他的玩具,或者沙发,或者一条裤子,或者一个物体的形状,或者它的颜色,或者一天中的时间。莱克说:“任何一个词都有无限种可能的含义。

  这个问题是如此棘手,以至于一些发展心理学家认为,孩子们之所以能够如此迅速地学习语言,一定是天生就对语言的运作方式有一种理解。斯基德莫尔大学(Skidmore University)的发展心理学家杰斯·沙利文(Jess Sullivan)是收集山姆头盔摄像头数据的团队的一员,但他没有参与这项新研究。他说,但这项研究表明,即使没有这种天生的能力,语言的某些部分也可以从一小部分经验中习得。“对我来说,这确实动摇了我的世界观。”

  但沙利文指出,将单词与它们所代表的物体相匹配的能力,虽然是一个很难学习的问题,但只是构成语言的一部分。单词串在一起也有规则。你的狗可能知道“ball”或“walk”这两个词,但这并不意味着它能听懂英语。婴儿天生的语言能力可能不仅仅局限于词汇。它可能会影响他们在世界上的行动方式,或者他们的注意力,或者他们对语言的反应。她说:“我认为,如果婴儿没有创造神经网络正在学习的数据集,这项研究就不会成功。”

  BRENDEN湖

  雷克和他的同事们的下一步是试图弄清楚他们需要什么来使模型的学习更接近地复制儿童的早期语言学习。他说:“要想让一个模型拥有完全像两岁孩子一样的能力,还有很多工作要做。”这可能意味着提供更多的数据。雷克的孩子现在18个月大,是下一批提供这些数据的孩子中的一员。她每周戴几个小时的头盔摄像头。或者,模型需要注意父母的目光,或者需要对物体的坚固性有某种感觉——这是孩子们凭直觉就能掌握的。创建能够像儿童一样学习的模型将有助于研究人员更好地理解人类的学习和发展。

  能够学习人类学习语言的一些方式的人工智能模型可能会更有效地学习;它们的行为可能更像人类,而不是像语言学家诺姆·乔姆斯基(Noam Chomsky)和他的同事曾经描述的那样,像ChatGPT这样的大型语言模型,是“用于模式匹配的笨重的统计引擎”。“人工智能系统仍然很脆弱,缺乏常识,”霍华德·施罗布(Howard Shrobe)说,他是美国政府国防高级研究计划局(Defense Advanced Research Projects Agency)项目的负责人,该项目为莱克的团队提供了资金。但是,像孩子一样学习的人工智能可能能够理解意义,对新情况做出反应,并从新的经历中学习。其目标是使人工智能更接近人类智能。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行