库逸轩：记忆解码与未来教育-知识分子的财新博客-财新网

演讲 | 库逸轩

责编 | 陈晓雪

●　●　●

教育的目标究竟是什么？我想很多人可能有一个共识，那就是教育实际上是“授人以鱼，不如授人以渔”。AlphaGo之所以引起人们的关注，很大程度上在于它通过深度学习能够实现真正的有目标性的学习。学习的目标又是什么呢？很大程度上，在于记忆。我这里想结合我们之前的一些记忆解码的工作谈一点对教育的想法。

奇点迫近？

整个社会有很多职业，比如金融、医生、律师、教师等等，是很容易被取代的，原因在于它们极大程度上依赖于经验，也就是依赖于记忆。对于计算机来讲，记忆是一件非常容易的事，它可以检索非常海量的信息。

在教育的过程中，我们如何去体现人与计算机所拥有的不同？

“奇点迫近”是未来学家雷蒙德·库茨维尔（Ray Kurzweil）在2005年写的一本书中提到的，它的核心问题在于指数的增长。有这样一个传说，一位国王想要奖励发明国际象棋的人，问他想要什么？这个人说：您能不能把我这个棋盘第一个棋格摆一粒麦子，第二个棋格摆二粒，第三个摆四粒，依此类推将64格全部摆满。国王想这很简单，但是真正一摆发现根本实现不了，因为总共需要1844亿亿多粒麦子，全世界也没办法满足这个数字。这是一个指数级的增长，当基数足够大的时候，指数级的增长也会急速上升，呈现陡峭的方式。

大家非常熟悉摩尔定律，我们所有的计算成本实际上是随着时间的推进逐渐呈指数型下降的。也就是说，我们单位成本能够购买到的计算力，实际上是呈指数上升的。库茨维尔进一步推广了这个理论，认为技术发展积累到一定程度的时候，增长速度本身也将呈指数上升。也就是说，它是呈指数的指数的增长，这就是所谓的“奇点”。这个时候，技术的发展已经超越了我们的想象，就到了一个“奇点爆发”的阶段。

库茨维尔在书中对于未来做了一些预测，有些预测现在来看是非常准确的，比如，他在2005年的时候讲，2010年有越来越多的电脑会作为网络服务器，可以做云计算；2018年1000美元能够购买到的电脑存储量能够达到10T，这也是现在能够实现的。他还预测，2020年的时候，个人电脑将会拥有和人脑相同的信息处理能力；2030年心智上传具有可行性。现在很多时候大家从媒体报道上看到，纳米机械将可以直接注入到脑部并且和脑细胞互相沟通。纳米机械读取我们的大脑，这个时候我们的所谓人工智能跟人的智能很有可能就混而为一了。

库茨维尔预测的内容还有，到2040年人们将把大部分的时间花在完全的沉浸式的虚拟实境，就像是电影《黑客帝国》（Matrix）所描述的科技；2045年是奇点爆发的时候，一千美元可以买到的电脑将拥有十亿颗人脑的计算力。人工智能这个时候实际上已经跟人类的智能合二为一了，人类智能借助人工智能已经可以向宇宙进行发布，甚至可以传遍整个宇宙。在很多科幻的电影里面也出现类似的场景，比如，2014年的《超越骇客》（Transcendence）也描述了科学家在临死前将思想上传到云端服务器的场景。

马斯克（Elon Musk）今年3月份成立了一个新的公司，叫做Neuralink，致力于将人脑和计算机融合到一起。马斯克是一个看上去很疯狂的人，他第一个实现了电动汽车真正在地球上跑，他还成立了SpaceX，进行可回收火箭的发射，让人类可以永久的移居火星。他的很多想法虽然看似疯狂，但是却真的实现了。他这个新的梦想是不是能实现，我们还是拭目以待。马斯克所构想的一种方式，是2015年已经出来的一个技术，通过一个非常细的电子网的发射——电子网发射之前缩在一起非常小，但是到了大脑里面可以展开——可以记录很多神经元的活动，读取大脑的思维。

现实与理想还存在距离

一切似乎像库兹维尔的预期那样发展，但我今天还要再泼一点冷水，我们的理想和现实其实还存在很大的距离。

首先，我们对于仅仅三磅的人脑的了解并没有比浩瀚的宇宙更多。此外，对于部分的理解不等于整体。早在1986年，对于线虫这种简单的模式生物，我们就已经可以把它仅有的302个神经细胞之间的连接图全部都画出来，但是直到今天还是很难准确预测线虫每一个准确的运动。大脑有890亿神经细胞，每一个细胞平均有大约1000个突触连接，这是个非常复杂的网络。我们是不是能够把mind（思维）真正能够读出来？这也是一个问题。

第二，关于计算机的架构，显然是需要突破的。传统的冯诺依曼结构是串行的，虽然快，但是容错性低。我们通过深度学习的人工智能，已经能够在人脸识别很多方面超越人类，但是如果在输入端给出一些小小的扰动，也有可能产生很大的分类的错误，比如，把一个狗的脸识别成人脸。相反，我们人脑虽然很慢，但是并行加工，容错性非常好，所以这是我们所特有的地方。

研究者们也在很多方面做出努力。比如，2014年的一篇《科学》（Science）封面文章，通过类似于神经元网络的并行结构的搭建，已经可以实现比传统计算机好很多的复杂分类。但是，现在只能达到一百万个神经元系统的搭建，离我们大脑的890亿还非常远，而且每一个神经元与其它的神经元平均只有256个突触连接。另外一个是材料方面的进步。2016年《自然-纳米技术》（Nature Nanotechnology）的封面文章发现一个新的相变材料，叫做锗锑镝，这种合金材料通过加电压，可以从晶体变成无定形，实现模拟的信号变化。我们知道传统计算机晶体管是数字的输出，而它可以实现模拟的输入和输出，我们将更加接近于神经元的一些反应模式。

第三个局限，在于从长时记忆到短时记忆或工作记忆的问题。接触过心理学的人都知道，所谓的“一般智力”可以分为“流体智力”和“晶体智力”。晶体智力更多与长时记忆相联系，随经验增加而增加；流体智力更多与工作记忆相联系，不太随经验改变，在二三十岁达到巅峰。

工作记忆大家也比较熟悉，它是短时间操纵信息的能力，实际上与很多认知功能，如语言，理解、计算、思维都有极密切的关系，跟流体智力的相关度可能达到60%以上，所以它能很好地预测我们的一般智力，但是它的容量却非常有限。1956年，George Miller发现我们对于数字的记忆只有区区的5-9个，少的可怜，而对于物体的记忆，通常是2-4个。我们大脑虽然没有计算机储存着那么多的信息，但我们的硬盘也是非常大的。为什么我们的CPU和内存（工作记忆）却如此之低，现在还没有答案。我们的思考在于，对于一个完全并行的系统来讲，它有可能是涌现的特性。而且这样的方式可以限制表征之间的竞争，在很多情况下存在一定的优势。比如，在很多表征同时出现的时候，你的决策就会出现问题，所以这可能是一种进化的优势，或者是涌现的一个特性。

工作记忆与因材施教

我们的工作记忆到底在大脑里面怎么样去动态地去表征的？更进一步问，表征为什么很重要？学习人工智能的都非常熟悉David Marr，他是个英年早逝的天才，曾提出认知的三层次模型，包括计算层，算法和表征层，以及实现层。对于神经网络的计算层的模拟，我们已经在深度学习网络取得了非常瞩目的突破。在实现层，像鲁白老师这样的神经科学家也已经在不断地往前推进。表征层可能是连接计算层和实现层一个非常好的切入点。

我们的研究发现，工作记忆不仅仅是你记多少，而且对于每个东西记的精确度也有限。我们的额叶会对枕叶皮层有自上而下的控制。正是这个控制力，是我们的真正瓶颈所在。控制力导致容量相对比较低。同时我们通过利用人工智能里面的机器学习的一些方法，来试图去解析这些表征，我们到底记住的是什么。我们通过一些机器学习的方法，利用功能磁共振的数据可以看到，对于表征的解码可以达到80%以上的准确率，而且可以看到这个过程中有动态的变化，在编码的时候记忆的准确性会非常高，然后会逐渐降低，当你需要提取这个记忆的时候，又变得很高。非常有趣的是，我们采用更简单的无线脑电的记录，也可以解码记忆变化的过程，达到70%以上的准确率。而且我们可以看到每个人到达记忆的准确度最顶峰的时间是不一样的，每个人能够达到的最高值也是不一样，每个人记忆下降的趋势是不一样的。正因为每个人动态的变化曲线是不同的，我们在未来也可以针对这个曲线采用一些干预的手段，这就是教育里所谓的“因材施教”。

另外，我们还会做一些更细致的研究，看这些记忆的表征到底在什么位置。我们可以通过简单的视觉刺激方法，把大脑视觉皮层做很多层级的划分，清楚地看到这个表征到底存在哪里，也就是我们记忆的痕迹到底在什么地方。在这个过程中，我们可以利用人工智能的发展，更好地实时监控这些记忆表征的动态变化。在这个基础上，我们可以通过一些干预的手段或训练的手段，或者电刺激、磁刺激的方法等来增强表征。实际上我们已经有一些初步的结果，非常振奋人心。

未来的教育中，我认为我们应该能够实现人工智能与人类智能的合作并存。无论是1999年超级电脑深蓝（Deep Blue）击败国际象棋冠军卡斯帕罗夫（Gary Kasparov）还是2016年AlphaGo击败李世石，我们应该以更积极的态度看待这些结果，更好地利用人工智能揭示教育的过程。

回到今天上午的最后一个问题：现在有没有人工智能的方法在课堂里面监控教学？答案是肯定的，不仅仅是人工智能，而且是通过神经科学的方法来监控大脑的动态变化，今年最新一期《当代生物学》（Current Biology）杂志的一篇论文已经谈论了这一点：课堂上老师与学生全部戴上简易的无线脑电电极帽，研究者观察人与人之间脑电的同步性变化，发现不管是教育者和被教育者之间的脑电同步性，还是被教育者之间相互讨论的同步性，都可以来预测最终学习效果的好坏。当然，这还是初步的一个探索。

在未来教育的实践中，大家不妨更多地运用脑科学的成果和技术来研究更多的教育问题。谢谢大家！

话题：