字符串世界中的元认知,德州仪器TI视觉情境人工智能系统

来源:时间: 2024-04-03

字符串世界中的元认知,德州仪器TI视觉情境人工智能系统

字符串世界中的元认知,人类智能的一个必不可少的方面,是感知并反思自己的思维能力,这也是人工智能领域近来很少讨论的一点,在心理学中,这被称作“元认知”。你是否曾经苦苦挣扎着想要解决一个问题但并未成功,最后却发现自己一直在重复同样的无效思维过程?这种情况经常发生在我身上,然而,一旦我认识到自己处于这种模式,我有时就能打破常规。Copycat与我在本书中讨论的其他所有人工智能程序一样,没有自我感知的机制,而这会影响它的性能表现。该程序有时会陷入一种困境:一次又一次地尝试使用错误的方式解决问题,并且永远无法意识到它之前已经走过了一条类似的无法通往成功的道路。詹姆斯·马歇尔(James Marshall)当时是侯世达研究团队的一名研究生,承担了一个让Copycat“反思”自己的思维过程的项目。他创建了一个名为“Metacat”的程序,Metacat不仅解决了Copycat字符串领域中的类比问题,还试图让Copycat感知其自身的行为。当程序运行时,它会对自己在解决问题的过程中识别到的概念生成一条运行注解。和Copycat一样,Metacat虽然展示了一些令人欣喜的行为,但也仅触及了人类自我反思能力的表象。识别整个情境比识别单个物体要困难得多我目前的研究方向是研发一个使用类比来灵活地识别“视觉情境”(visual situations)的人工智能系统,视觉情境是一种涉及多个实体及其之间关系的视觉概念。4幅图像,我们都可称之为“遛狗”这一视觉情境的实例。人类很容易就能看出来,但是对于人工智能系统来说,即便是识别简单视觉情境中的实例,也非常具有挑战性,识别整个情境比识别单个物体要困难得多。我和我的同事正在开发一个名为“Situate”的程序,它将DNN的目标识别能力与Copycat的活跃符号结构相结合,通过做类比来识别某些特定情境。我们希望它不仅能够识别简单明了的情境,而且能够识别需要进行概念滑移的非常规的情境。我们可以看到:“遛狗”情境的原型包括一个人、一条狗和一条狗绳,遛狗者牵着狗绳,狗绳系在狗身上,并且遛狗者和狗都在行走。理解“遛狗”这一概念的人也会将图15-5中的每幅图像看作是这个概念的示例,并且还能意识到每幅图像从原型版本上“拓展”了多少。Situate目前仍处于研发的早期阶段,其目的是探究隐藏在人类类比能力背后的一般机制,并证明隐藏在Copycat程序背后的机制也可以在字符串类比这个微观世界之外成功地运行。Copycat、Metacat和Situate仅仅是基于侯世达的活跃符号结构构建的类比程序中的3个示例。此外,活跃符号结构只是人工智能领域中创建的能够做类比的程序的众多方法之一。尽管类比对人类认知的任何层次来说都是基础性的,但目前为止还没有人工智能程序能具有人类的类比能力——哪怕一点点。“我们真的,真的相距甚远”现代人工智能以深度学习为主导,以DNN、大数据和超高速计算机为三驾马车,然而,在追求稳健和通用的智能的过程中,深度学习可能会碰壁——重中之重的“意义的障碍”。在本章中,我展示了人工智能为打破这一障碍所做的一些努力,我们可以看到研究人员(包括我自己)是如何为计算机灌输常识,并尝试赋予它们类似于人类的抽象和类比能力的。


电话

185 0303 2423

微信

咨询

置顶