
2012年,多伦多大学的研究生亚历克斯·克里泽夫斯基带着他的团队,用一种叫“卷积神经网络”(CNN)的新方法参加了ImageNet图像识别大赛。他们的模型AlexNet,把错误率从上一年的26%直接砍到15%——相当于比传统方法少认错近1/3的图片!更惊人的是,这个网络的结构灵感来自人类视觉皮层:它通过多层“卷积层”自动提取图像特征(比如边缘、纹理),再层层抽象出更高阶信息(比如猫耳朵、眼睛)。赛前没人看好这个“非主流”方案(评委甚至担心它跑不完数据),但结果一出,整个AI圈沸腾了。
AlexNet的成功证明了两件事:一是大数据(ImageNet有120万张标注图片)能让机器学到更丰富的模式;二是深度神经网络(多层结构)比浅层模型强得多。从此,AI从“小步慢走”变成了“狂飙突进”——自动驾驶、人脸识别、医疗影像分析……所有需要“看懂世界”的领域都被彻底改变。