信息学院人工智能专业方向 脑与认知科学
知觉 知觉包括视觉 听觉 触觉 嗅觉和味觉五种感觉 正常人的知觉中, 多模态感觉信息的融合非常重要 汽车驾驶中涉及哪几种感觉? 物体 / 人的识别中涉及哪几种感觉? 吃东西的过程中涉及哪几种感觉?
视觉功能异常的例子 患者 P.T 在第二次脑卒中后, 便不再认识周围的人包括他的妻子 视觉功能异常症状 : 他知道她的各部分 - 身体 胳膊 腿和头等 - 组成了一个人, 也可以描述她的行为, 但是看不出来这些部分属于一个特定的个体 其他感觉的补偿机制 : 当他的妻子说话以后, 他立刻认出她的声音, 而且对她的视觉感知会 变得鲜活起来, 立刻认出了她
嗅觉 感受器直接暴露于外界, 而且嗅神经不经过下丘脑直接到达初级嗅皮质 嗅上皮中有超过 1000 种的感受器, 与嗅小体相连 嗅小体轴突离开嗅球后, 形成嗅神经直接到达初级嗅皮层
基于功能磁共振 (fmri) 的嗅觉实验 初级嗅皮质可能与探测气味变化相关, 而次级嗅皮质可能与分辨气味相关
嗅觉的不对称表征机制 高 - 低流量的嗅觉感受系统是进化产物, 使鼻子在感知同时含有高低吸收率的分子时具有最大的准确性 不对称表征是人类认知的规则, 为复杂信息加工提供有效的方式
气味和记忆 气味与个人记忆存在密切联系, 其原因在于嗅皮质与边缘系统的直接连接, 后者是记忆和情绪主要涉及的一个区域 海马损伤的病人气味识别能力也严重受损
味知觉 口腔中有 ~10000 个味觉细胞, 大部分位于舌头上 食物分子导致味觉细胞去极化, 从而感受咸 酸 苦 甜和鲜 咸 : 矿物质 / 电解质与水的平衡信息 酸 / 苦 : 进化产生的警告信号 甜 : 碳水化合物 鲜 : 蛋白质 相关皮质区域 : 初级味觉皮质位于脑岛和脑盖中, 与眶额皮质 (orbitofrontal cortex) 的次级加工区域相连
躯体感觉 躯体感受器 / 微小体 一般触觉信息 : 梅克尔小体 轻微触觉信息 : 迈斯纳小体 深部压力信息 : 环层小体 温度信息 : 鲁菲尼小体 痛觉信息 : 痛觉感受器 有髓鞘细胞 : 条件反射 无髓鞘细胞 : 疼痛反馈 本体感受器 肌肉 - 肌腱连接处的特化神经细胞
躯体感觉加工 通路 : 脊髓 对侧丘脑 初级躯体感觉皮质 (S1) 次级躯体感觉皮质 (S2)/ 小脑
听觉 听觉感受器 : 内耳耳蜗中基底膜上的毛细胞 毛细胞编码声音频率的感受野 :20Hz-20000Hz, 但对 1000Hz-4000Hz( 日常交流关键频率范围 ) 最敏感
听觉的编码特性 1) 听觉通路神经元的频率感受野较宽, 因此听觉依赖很多神经元活动的整合 2) 听觉区具有频率拓扑地形图, 有助于神经元的信息整合 3) 听觉感受野的频率特异性在听觉加工过程中逐渐增强
听觉的计算目标 听觉的功能 :1) 确定声音内容及对象,2) 对声源进行定位 声音定位的原理 : 耳间时差和强度差
听觉定位的神经编码 -Konishi 模型 耳间时差检测 : 丘系核前部神经元 - 同步神经编码
听觉定位的神经编码 -Konishi 模型 耳间强度检测 : 丘系核后部神经元 - 频率神经编码 声音强度由输入神经元的发放频率进行编码, 输入信号越强细胞放电频率越高 神经元结合双耳信号发放频率的差异, 确定声源的竖直位置
听觉定位的神经编码 -Konishi 模型 特点总结 : 听觉的空间信息编码机制 : 水平方向为双耳时差神经编码, 而垂直方向为频率神经编码 时间和强度信息独立加工 针对脑干的模型, 仅解决了 在哪里 的问题 对于 是什么 该如何反应 等问题, 需要在皮质区域进行更高水平的信息加工
视觉 视网膜感光细胞将光信号转化为动作电位, 并逐层传递到大脑 视杆细胞 : 低强度刺激, 主要在夜间工作, 无法区分颜色 视锥细胞 : 强烈光线敏感, 主要在白天工作, 对不同颜色敏感 视锥细胞在视网膜中央凹分布集中, 而在视网膜外周几乎无分布 视杆细胞分布在整个视网膜上
视觉信息传递和加工 左视野传递右侧半球, 右视野传递左侧半球 颞侧分支沿同侧传递, 鼻侧分支交叉到对侧 ( 视交叉 ) 视网膜 丘脑的外侧膝状体 初级视皮质通路, 包含 ~90% 的视神经轴突 视网膜 皮质下结构 ( 丘脑枕核 中脑上丘等 ) 通路, 包含 ~10% 的视神经轴突
视皮质研究中的发现 Hubel 和 Wiesel 在 50 年代的研究中发现, 猫的初级视皮层神经元的感受野对边缘敏感 外侧膝状体与视网膜神经节细胞类似, 均对小光点敏感, 表现为中心兴奋 - 周围抑制 提示神经系统对变化敏感性
初级视觉皮层的信息加工 通过接受多个外侧膝状体的输出, 初级视觉皮层中的简单细胞可以提取形状知觉中的基本特征 : 物体边缘 更复杂的初级视觉皮层神经元细胞可以提取形状知觉中的拐角 边缘终端等特征
初级视觉皮层的信息加工 初级皮质中的神经元具有朝向选择性 朝向皮质柱和眼优势柱交叉, 形成用以表征外部空间可见边缘的皮质模块
皮质视觉区 视觉信息的皮质加工通路 分为背侧和腹侧两条通路 均起始于初级视觉皮层 ( V1 区 / 纹状区 ) 通过次级视觉皮层 (V2- V4/ 纹外区域 ) 最终分别到达顶叶皮质 ( where pathway) 和颞下皮质 (what pathway) 视觉细胞仅对有限空间区域中的刺激产生反应, 这一空间区域被称为感受野
皮质视觉区的细胞特异性 视觉信息加工的层级假说 每个区域都对较早区域生成的信号做进一步的精细加工, 并通过特殊的方式表征刺激 初级视觉皮层中的简单细胞负责检测边缘 复杂细胞负责表征拐角和边缘终端 ; 高级视觉皮层中更高级的视觉神经元整合来自复杂细胞的信息以表征形状, 并对记忆进行搜索匹配
皮质视觉区的细胞特异性 视觉信息加工的分工假说 每个视觉区负责表征不同的视觉信息, 如颜色 运动等 信息加工是分布式 专门化的, 每个区域都对 V1 区的原始信息进行加工, 并将不同维度的信息整合形成可辨认的对象
灵长类视觉神经元的特异性 中颞 (MT, 也称为 V5) 区神经元特点 对运动和运动方向敏感, 但对颜色不敏感 刺激位于感受野时, 细胞才会活动 刺激朝向某个特定方向运动时, 细胞的反应最强
人类视觉区的特异性 通过包含控制条件的脑区功能成像实验, 确定被物体颜色和运动所激活的脑区分别为 V4 区和 MT 区, 表明人脑对视觉信息的加工符合分工假说
人类的视觉缺陷现象 与普通色盲不同, 全色盲是由中枢神经系统 (V4 区为主 ) 受损引起的, 症状为对所有颜色均无法识别 但由于全色盲患者对深度和物体纹理识别能力完好, 因此仍可识别物体
人类的视觉缺陷现象 V4 区域不光与颜色信息加工密切相关, 而且是参与形状知觉的次级视觉区 颜色可以提供物体形状的重要信息, 因此 V4 区可能也使用颜色信息作为定义视觉环境中物体边界的线索
人类的视觉缺陷现象 毕加索作品的特点是画面中遍布断续的线条, 象征着无意识的断裂, 但同时断裂的部分又融合在一起, 从而构造出人物形象
人类的视觉缺陷现象 莫奈是印象派代表人物和创始人之一, 他最重要的风格是改变了阴影和轮廓线的画法, 在莫奈的画作中看不到非常明确的阴影, 也看不到突显或平涂式的轮廓线
人类的视觉缺陷现象 患者 P.T. 相关脑区的损伤导致其无法辨别颜色上的细微差别, 以及和形状感知相关的对比度或轮廓感知 但患者通过行为 动作可以正常识别他人, 表明其与运动通路相关的脑区不存在异常
运动知觉功能异常的例子 病因 : 双侧 V5 区损伤导致运动知觉丧失 V5 区感受野范围很大, 并且含有被左右任意视野内刺激激活的细胞, 因此单侧损伤对运动知觉影响较小
视知觉其他方面的缺陷 深度知觉的产生 双眼视差 运动遮挡 物体大小 形状知觉 : 可以从多种视觉信息 ( 颜色 运动等 ) 中提取物体的形状信息 因此现实中并没有深度和形状知觉障碍的报道
多通道知觉 大脑中多个脑区均涉及多种感觉信息的联合加工, 如颞上沟 顶叶 额叶 海马和上丘等
多模态感觉整合 联合视觉 听觉和躯体感觉的刺激反应大于单独的刺激出现 通过不同刺激的时空同步性提高信噪比 人声嘈杂的环境中交流 实验表明, 视觉和声音匹配时可以显著激活颞上沟
作业 你认为在目前的人工智能研究中, 对哪些 ( 不少于 2 种 ) 人类感觉的模仿是最为重要的? 请给出自己的理由