一种基于近似计算的可在线学习神经形态处理器-凯云集团官网

一种基于近似计算的可在线学习神经形态处理器

栏目：行业动态发布时间：2026-01-28

　　　本发明涉及神经形态处理器设计，特别是涉及一种基于近似计算的可在线学习神经形态处理器。　　1、基于脉冲神经网络(spiking neural networ

一种基于近似计算的可在线学习神经形态处理器(图1)

　　本发明涉及神经形态处理器设计，特别是涉及一种基于近似计算的可在线学习神经形态处理器。

　　1、基于脉冲神经网络(spiking neural network，简称snn)的神经形态处理器旨在通过仿生学原理和硬件设计来模拟大脑神经网络的功能，实现高效的计算和任务处理，特别是具备在线学习和事件驱动的特性。神经形态处理器是神经形态计算领域的重要研究方向，广泛应用如医疗影像处理、自动驾驶、智能监控系统和智慧交通领域。与传统的基于人工神经网络(artificial neural network)的电路不同，例如，卷积神经网络(cnn)使用连续的信号处理和固定的训练模型，这些方法在处理动态和稀疏数据时效率较低。同时由于基于cnn设计的硬件电路无法充分模拟大脑的生物特性和动态学习能力，基于cnn的电路依赖于离线训练，对于实时应用和资源有限的环境，其适应性和能效较差。

　　2、当前的数字脉冲神经形态处理器存在硬件资源开销高、神经元计算效率低、在线学习方法的局限性、芯片间通信灵活性低等关键问题，阻碍了它们在实际场景下落地应用。其中，脉冲神经元是神经形态芯片中的计算核心，但是当前的脉冲神经元的资源开销大，计算效率不高。脉冲神经元是神经形态芯片中的计算核心。例如，基于电流的数字漏电整合发放(leaky integrate-and-fire，简称lif)模型，使得神经元行为具有可配置的优势，但是其复杂的膜电位转换带来了额外的开销。odin同时采用了lif神经元和生物精度更高的izhikevich(izh)神经元模型，其中lif神经元模型没有得到硬件上的优化，导致计算效率不高，izh神经元模型虽然实现了多达几十种的神经元行为模拟，但是却带来了非常复杂的控制逻辑和额外的资源消耗。由于神经网络中复杂的神经元计算，已经有很多研究工作将近似计算技术如权重量化和剪枝应用于神经元电路当中，但是存在影响神经网络模型精度(大幅下降)等问题。其次，现有技术中的snn处理器通常不具备在线学习能力或优化不足。基于计算复杂度和成本考量，很多现有的snn处理器，例如现有的truenorth、清华tianjic和spinnaker处理器都不具备片上学习能力，只能离线部署权重的特性导致无法适应多变的现实情景。另一些具有在线学习能力的神经形态芯片，如对于脉冲时序依赖可塑性(spiking-timing-dependent plasticity，简称stdp)的在线学习方法，可以用微码的格式设计不同的学习规则，然而这种学习规则较为复杂，在进行硬件实现时占用了大量的硬件资源。odin使用了基于stdp简化而来的尖峰驱动的突触可塑性(spike-driven synapticplasticity，简称sdsp)学习规则，但是过于简单的学习规则容易让神经网络出现过拟合的问题，导致识别精度下降。此外，现有技术所提出的硬件实现方案硬件缺乏灵活的片上路由控制。神经形态芯片主要是根据脉冲信息，对神经元状态和突触权重进行实时更新，为了能够适应不同的时间窗口和多尺度的输入图像，这需要一定的路由调度去控制脉冲神经网络运行的正确性和灵活性。现有技术通常需要定制的神经元存储空间，同时对神经元状态进行行和列的存储访问，但是固定的存储空间缺限制了处理器对 Kaiyun科技有限公司于大型神经网络的适用性。另一种常用解决方案是固定输入相同的时间窗口，因为如果每一层的时间窗口大小不同，那么每一层的处理时间就会发生不同，由于该核心完成了该层的操作，但是在前一层完成计算之前，它必须等待，这导致了计算资源的浪费。然而，在日益复杂的计算需求下，设计片上路由来解决大型网络的计算和支持处理不同时间窗口是一个必然的趋势。

　　1、本发明的目的是为解决现存神经形态处理器中存在硬件资源开销大、计算效率低、在线学习能力有限、路由调度不足等技术问题，进而实现更高效的神经形态计算效果，面向将神经形态处理器技术应用于实时智能计算的目标，提出一种基于近似计算的可在线学习的神经形态处理器架构，以实现处理器在识别精度、响应速度和硬件资源消耗三者之间的高度权衡，准确、实时、高效地实现动态和复杂的图像目标识别任务的处理。

　　2、本发明通过结合生物启发的计算模型和硬件设计，提出了一种能够动态更新和高效处理复杂任务的处理器设计系统，一种基于脉冲神经网络的低功耗、高精度、可在线学习的处理器，能够高效模拟生物神经系统的复杂计算功能。该设计系统不仅能够显著提高计算速度和能效，还能减少处理器设计的硬件资源消耗。该系统适用于各个需要进行神经网络计算的行业领域，如医疗影像处理、自动驾驶、智能监控系统和智慧交通等。以解决上述现有技术存在的问题。

　　4、一种基于近似计算的可在线学习神经形态处理器，包括：推理子系统、训练子系统和通信子系统；

　　5、所述推理子系统，包括输入层、隐藏层和输出层，所述隐藏层包括多个并行处理的脉冲处理核，所述输出层包括至少一个脉冲处理核；每个脉冲处理核中包括多个通过预设的神经元模型建立的物理神经元；

　　6、所述推理子系统，用于根据预存的突触权重和激活阈值，通过所述隐藏层和所述输出层中的脉冲处理核，对编码后接入至所述输入层的多尺度输入图像进行近似计算，统计一个时间窗口内多个时间步长的计算结果，生成所述多尺度输入图像的识别结果；

　　7、所述训练子系统，用于利用所述输入层接入多个图像至所述隐藏层和所述输出层，采用基于历史权重的随机在线学习方法对所述突触权重和所述激活阈值进行更新；

　　8、所述推理子系统，还用于基于训练更新后的突触权重和激活阈值，通过所述隐藏层和所述输出层中的脉冲处理核进行近似计算，对所述多尺度输入图像的识别结果进行更新；

　　9、所述通信子系统，用于通过分层路由架构，对所述推理子系统和训练子系统的数据传输进行多层级路由控制。

　　10、可选地，所述输入层包括多个虚拟神经元，所述虚拟神经元的数量与输入图像的尺度相匹配，用于接入对输入图像进行速率编码后的二值化图像的脉冲序列；

　　11、所述隐藏层和所述输出层中的脉冲处理核均内置有突触核和神经元计算核；所述突触核预存有通过预训练获得的突触权重；所述神经元计算核预存有通过预训练获得的激活阈值；所述神经元计算核内置有多个物理神经元；所述多个物理神经元形成流水线结构，将所接入的二值化图像的脉冲序列依次传递。

　　12、可选地，每个所述物理神经元包括：由多个近似计算单元构成的pe阵列、近似加法树和脉冲发放决策单元；所述近似计算单元内置有累加控制逻辑电路和至少一个近似加法器；所述近似加法树由多个近似加法器两两相加分级构成；

　　13、所述pe阵列，用于分批次时刻接入二值化图像的局部脉冲序列，并将所述局部脉冲序列的各个脉冲分别发放至对应的近似计算单元中进行独立并行求和；并通过时分复用所述多个近似计算单元，分批次时刻执行所述二值化图像的多个局部脉冲序列的累加计算，获得各个近似计算单元所累计的膜电位增量；

　　14、每个所述近似计算单元，还用于分别根据预设的神经元模型，利用各批次时刻所累计的膜电位增量更新物理神经元在当前时刻分布在当前近似计算单元的局部膜电位；

　　15、所述近似加法树，用于将每个近似计算单元输出的局部膜电位进行求和，获得物理神经元与接入的二值化图像相对应的膜电位；

　　16、所述脉冲发放决策单元，用于将所述近似加法树所汇总的膜电位与所述激活阈值进行比较，决定是否对当前物理神经元进行激活；若当前物理神经元没有被激活，则根据预设的神经元模型对当前物理神经元的膜电位进行衰减；若当前物理神经元被激活，则发放新脉冲至下一层神经元，并在物理神经元被激活发放脉冲之后，根据预设的神经元模型对当前神经元的膜电位执行重置。

　　17、可选地，所述神经元模型包括神经元充电模型，所述神经元充电模型的数学模型为：

　　23、其中，v(t)为神经元在当前时刻的膜电位，v(t-1)为神经元在上一时刻的膜电位，x(t)为当前时刻输入脉冲所形成的膜电位增量，为预设的膜电位衰减因子；vrst为神经元的重置基准电位。

　　28、其中，所述v(t+)为神经元在当前时刻的重置后膜电位，v(t-)为神经元在当前时刻的重置前膜电位；vrst为预设的重置基准电位；为预设的膜电位衰减因子；vth为当前神经元的激活阈值。

　　29、可选地，所述训练子系统包括：控制器、神经元比较器、更新仲裁器、随机数生成器和参数更新器；

　　30、所述控制器，用于控制神经元所接收的输入脉冲序列的时间长度，对所述训练子系统的正确时序和功能运行进行控制；

　　31、所述神经元比较器，用于比较获得不同物理神经元的激活状态，基于脉冲发放速率选出最活跃的物理神经元；

　　32、所述更新仲裁器，用于接收所述神经元比较器的输出结果，将最活跃的物理神经元输送至所述参数更新器；

　　33、所述随机数生成器，用于基于线性反馈移位寄存器，采用移位操作生成伪随机数；

　　34、所述参数更新器，用于基于历史权重的随机在线学习策略，利用所述伪随机数和神经元当前存储的突触权重，对所述最活跃的物理神经元的突触权重和激活阈值进行更新。

　　36、若物理神经元的当前时刻膜电位与当前时刻激活阈值的差值大于所述伪随机数，则按照以下数学模型更新当前物理神经元的突触权重和激活阈值：

　　38、其中，w(t)表示更新后的突触权重，w(t-1)表示更新前的突触权重，vth(t)表示更新后的激活阈值，vth(t-1)表示更新前的激活阈值，δt表示前神经元与后神经元释放脉冲的时间差，a和b表示两种不同的权重更新幅度；c表示激活阈值的更新幅度；

　　40、可选地，所述神经元比较器基于脉冲发放速率选出最活跃的物理神经元，具体为：

　　41、将输入脉冲序列中的各个脉冲信号与当前物理神经元对应的突触权重执行加权求和，获得输入脉冲序列的累计膜电位；

　　43、为所述输入脉冲序列中的各个脉冲信号按照顺序分配触发时序；并将带有触发时序的各个脉冲信号与当前物理神经元对应的突触权重执行加权求和，获得所述输入脉冲序列的时序加权膜电位；

　　44、将所述时序加权膜电位与所述累计差值的比值作为当前物理神经元的归一化脉冲发放时长；

　　45、将隐藏层的所有物理神经元的归一化脉冲发放时长进行逐一比较，选出与最小值相对应的神经元为隐藏层的最活跃物理神经元；

　　46、将输出层的所有物理神经元的归一化脉冲发放时长进行逐一比较，获得与最小值相对应的神经元为输出层的最活跃物理神经元。

　　48、可选地，所述通信子系统为三级路由系统，包括：零级路由器、一级路由器、二级路由器；

　　49、所述零级路由器设置在每个脉冲处理核内部，用于将所述一级路由器的封装信号输送至对应的脉冲处理核，并将所述脉冲处理核的计算结果重新封装为数据包后发送至所述一级路由器；

　　50、所述一级路由器，用于按照预设的通信协议将所述零级路由器的数据进行汇集与封装，实现数据在各个脉冲处理核之间的通信传输；

　　51、所述二级路由器，用于按照预设的通信协议将所述一级路由器的输出数据进行汇集，实现多个由脉冲处理核集群组成的神经形态处理器之间的数据通信，或者，神经形态处理器与外部电路之间的数据通信。

　　53、本发明提出了一种结构优化的可在线学习的神经形态处理器，通过设计硬件友好的神经元结构、高精度近似计算电路、改进的在线学习方法和灵活的三级Kaiyun科技有限公司片上通信路由，结合脉冲神经网络的计算特性，获得一种功耗低、计算效率高、识别准确度高的神经形态处理器。

　　技术研发人员：骆爱文,叶俊伟,刘伟平,易清明,石敏,练显聪,杨庆宽,张子恒

　　1.计算机网络安全 2.计算机仿线.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

上一篇：又一国产AI芯片将迎来IPO

下一篇：成立仅两月估值飙至40亿！Ricursive用AI造芯片获3亿美元A轮融资