乐趣区

一种CortexM内核中的精确延时方法

本文介绍一种 Cortex- M 内核中的精确延时方法

前言

为什么要学习这种延时的方法?

  1. 很多时候我们跑操作系统,就一般会占用一个硬件定时器——SysTick,而我们一般操作系统的时钟节拍一般是设置 100-1000HZ,也就是 1ms——10ms 产生一次中断。很多裸机教程使用延时函数又是基于 SysTick 的,这样一来又难免产生冲突。
  2. 很多人会说,不是还有定时器吗,定时器的计时是超级精确的。这点我不否认,但是假设,如果一个系统,总是进入定时器中断(10us 一次 /1us 一次 /0.5us 一次),那整个系统就会经常被打断,线程的进行就没办法很好运行啊。此外还消耗一个硬件定时器资源,一个硬件定时器可能做其他事情呢!
  3. 对应 ST HAL 库的修改,其实杰杰个人觉得吧,ST 的东西什么都好,就是出的 HAL 库太恶心了,没办法,而 HAL 库中有一个 HAL_Delay(),他也是采用 SysTick 延时的,在移植操作系统的时候,会有诸多不便,不过好在,HAL_Delay()是一个弱定义的,我们可以重写这个函数的实现,那么,采用内核延时当然是最好的办法啦(个人是这么觉得的)当然你有能力完全用 for 循环写个简单的延时还是可以的。
  4. 可能我说的话没啥权威,那我就引用 Cortex-M3 权威指南中的一句话——“DWT 中有剩余的计数器,它们典型地用于程序代码的“性能速写”(profiling)。通过编程它们,就可以让它们在计数器溢出时发出事件(以跟踪数据包的形式)。最典型地,就是使用 CYCCNT 寄存器来测量执行某个任务所花的周期数,这也可以用作时间基准相关的目的(操作系统中统计 CPU 使用率可以用到它)。”

Cortex- M 中的 DWT

在 Cortex- M 里面有一个外设叫 DWT(Data Watchpoint and Trace),是用于系统调试及跟踪,
它有一个 32 位的寄存器叫 CYCCNT,它是一个向上的计数器,记录的是内核时钟运行的个数,内核时钟跳动一次,该计数器就加 1,精度非常高,决定内核的频率是多少,如果是 F103 系列,内核时钟是 72M,那精度就是 1 /72M = 14ns,而程序的运行时间都是微秒级别的,所以 14ns 的精度是远远够的。最长能记录的时间为:60s= 2 的 32 次方 /72000000(假设内核频率为 72M,内核跳一次的时间大概为 1 /72M=14ns),而如果是 H7 这种 400M 主频的芯片,那它的计时精度高达 2.5ns(1/400000000 = 2.5),而如果是 i.MX RT1052 这种比较牛逼的处理器,最长能记录的时间为:8.13s= 2 的 32 次方 /528000000 (假设内核频率为 528M,内核跳一次的时间大概为 1 /528M=1.9ns)。当 CYCCNT 溢出之后,会清 0 重新开始向上计数。

m3、m4、m7 杰杰实测可用(m0 不可用)。
精度:1/ 内核频率(s)。

要实现延时的功能,总共涉及到三个寄存器:DEMCR、DWT_CTRL、DWT_CYCCNT,分别用于开启 DWT 功能、开启 CYCCNT 及获得系统时钟计数值。

DEMCR

想要使能 DWT 外设,需要由另外的内核调试寄存器 DEMCR 的位 24 控制,写 1 使能(划重点啦,要考试!!)。
DEMCR 的地址是0xE000 EDFC

关于 DWT_CYCCNT

使能 DWT_CYCCNT 寄存器之前,先清 0。
让我们看看 DWT_CYCCNT 的基地址,从 ARM-Cortex- M 手册中可以看到其基地址是 0xE000 1004,复位默认值是 0,而且它的类型是可读可写的,我们往0xE000 1004 这个地址写 0 就将 DWT_CYCCNT 清 0 了。

关于 CYCCNTENA

CYCCNTENA Enable the CYCCNT counter. If not enabled, the counter does not count and no event is
generated for PS sampling or CYCCNTENA. In normal use, the debugger must initialize
the CYCCNT counter to 0.
它是 DWT 控制寄存器的第一位,写 1 使能,则启用 CYCCNT 计数器,否则 CYCCNT 计数器将不会工作。

综上所述

想要使用 DWT 的 CYCCNT 步骤:

  1. 先使能 DWT 外设,这个由另外内核调试寄存器 DEMCR 的位 24 控制,写 1 使能
  2. 使能 CYCCNT 寄存器之前,先清 0。
  3. 使能 CYCCNT 寄存器,这个由 DWT 的 CYCCNTENA 控制,也就是 DWT 控制寄存器的位 0 控制,写 1 使能

代码实现

/**
  ******************************************************************
  * @file    core_delay.c
  * @author  fire
  * @version V1.0
  * @date    2018-xx-xx
  * @brief   使用内核寄存器精确延时
  ******************************************************************
  * @attention
  *
  * 实验平台: 野火 STM32 开发板  
  * 论坛    :http://www.firebbs.cn
  * 淘宝    :https://fire-stm32.taobao.com
  *
  ******************************************************************
  */
  
#include "./delay/core_delay.h"   

/*
**********************************************************************
*         时间戳相关寄存器定义
**********************************************************************
*/
/*
 在 Cortex- M 里面有一个外设叫 DWT(Data Watchpoint and Trace),该外设有一个 32 位的寄存器叫 CYCCNT,它是一个向上的计数器,记录的是内核时钟运行的个数,最长能记录的时间为:10.74s= 2 的 32 次方 /400000000
 (假设内核频率为 400M,内核跳一次的时间大概为 1 /400M=2.5ns)
 当 CYCCNT 溢出之后,会清 0 重新开始向上计数。使能 CYCCNT 计数的操作步骤:1、先使能 DWT 外设,这个由另外内核调试寄存器 DEMCR 的位 24 控制,写 1 使能
 2、使能 CYCCNT 寄存器之前,先清 0
 3、使能 CYCCNT 寄存器,这个由 DWT_CTRL(代码上宏定义为 DWT_CR)的位 0 控制,写 1 使能
 */


#define  DWT_CR      *(__IO uint32_t *)0xE0001000
#define  DWT_CYCCNT  *(__IO uint32_t *)0xE0001004
#define  DEM_CR      *(__IO uint32_t *)0xE000EDFC


#define  DEM_CR_TRCENA                   (1 << 24)
#define  DWT_CR_CYCCNTENA                (1 <<  0)


/**
  * @brief  初始化时间戳
  * @param  无
  * @retval 无
  * @note   使用延时函数前,必须调用本函数
  */
HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority)
{
    /* 使能 DWT 外设 */
    DEM_CR |= (uint32_t)DEM_CR_TRCENA;                

    /* DWT CYCCNT 寄存器计数清 0 */
    DWT_CYCCNT = (uint32_t)0u;

    /* 使能 Cortex-M DWT CYCCNT 寄存器 */
    DWT_CR |= (uint32_t)DWT_CR_CYCCNTENA;
  
    return HAL_OK;
}

/**
  * @brief  读取当前时间戳
  * @param  无
  * @retval 当前时间戳,即 DWT_CYCCNT 寄存器的值
  */
uint32_t CPU_TS_TmrRd(void)
{return ((uint32_t)DWT_CYCCNT);
}

/**
  * @brief  读取当前时间戳
  * @param  无
  * @retval 当前时间戳,即 DWT_CYCCNT 寄存器的值
  */
uint32_t HAL_GetTick(void)
{return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);
}


/**
  * @brief  采用 CPU 的内部计数实现精确延时,32 位计数器
  * @param  us : 延迟长度,单位 1 us
  * @retval 无
  * @note   使用本函数前必须先调用 CPU_TS_TmrInit 函数使能计数器,或使能宏 CPU_TS_INIT_IN_DELAY_FUNCTION
            最大延时值为 8 秒,即 8 *1000*1000
  */
void CPU_TS_Tmr_Delay_US(uint32_t us)
{
  uint32_t ticks;
  uint32_t told,tnow,tcnt=0;

  /* 在函数内部初始化时间戳寄存器,*/  
#if (CPU_TS_INIT_IN_DELAY_FUNCTION)  
  /* 初始化时间戳并清零 */
  HAL_InitTick(5);
#endif
  
  ticks = us * (GET_CPU_ClkFreq() / 1000000);  /* 需要的节拍数 */      
  tcnt = 0;
  told = (uint32_t)CPU_TS_TmrRd();         /* 刚进入时的计数器值 */

  while(1)
  {tnow = (uint32_t)CPU_TS_TmrRd();  
    if(tnow != told)
    { 
        /* 32 位计数器是递增计数器 */    
      if(tnow > told)
      {tcnt += tnow - told;}
      /* 重新装载 */
      else 
      {tcnt += UINT32_MAX - told + tnow;} 
      
      told = tnow;

      /* 时间超过 / 等于要延迟的时间, 则退出 */
      if(tcnt >= ticks)break;
    }  
  }
}

/*********************************************END OF FILE**********************/
#ifndef __CORE_DELAY_H
#define __CORE_DELAY_H

#include "stm32h7xx.h"

/* 获取内核时钟频率 */
#define GET_CPU_ClkFreq()       HAL_RCC_GetSysClockFreq()
#define SysClockFreq            (218000000)
/* 为方便使用,在延时函数内部调用 CPU_TS_TmrInit 函数初始化时间戳寄存器,这样每次调用函数都会初始化一遍。把本宏值设置为 0,然后在 main 函数刚运行时调用 CPU_TS_TmrInit 可避免每次都初始化 */  

#define CPU_TS_INIT_IN_DELAY_FUNCTION   0  


/*******************************************************************************
 * 函数声明
 ******************************************************************************/
uint32_t CPU_TS_TmrRd(void);
HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority);

// 使用以下函数前必须先调用 CPU_TS_TmrInit 函数使能计数器,或使能宏 CPU_TS_INIT_IN_DELAY_FUNCTION
// 最大延时值为 8 秒
void CPU_TS_Tmr_Delay_US(uint32_t us);
#define HAL_Delay(ms)     CPU_TS_Tmr_Delay_US(ms*1000)
#define CPU_TS_Tmr_Delay_S(s)       CPU_TS_Tmr_Delay_MS(s*1000)


#endif /* __CORE_DELAY_H */

注意事项:

使用者如果不是在 HAL 库中使用,注释掉:

uint32_t HAL_GetTick(void)
{return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);
}

同时建议重新命名 HAL_InitTick() 函数。

按照自己的平台重写以下宏定义:

/* 获取内核时钟频率 */
#define GET_CPU_ClkFreq()       HAL_RCC_GetSysClockFreq()
#define SysClockFreq            (218000000)

后记

其实在 ucos-iii 源码中,有一个功能是测量关中断时间的功能,就是使用 STM32 的时间戳,即记录程序运行的某个时刻,如果记录下程序前后的两个时刻点,即可以算出这段程序的运行时间。
但是有关内核寄存器的描述的资料非常少,还好找到一个(arm 手册),里面有这些内核寄存器的详细描述,其中时间戳相关的寄存器在第 10 章和 11 章有详细的描述。关于资料想看的可以后台找我拿。

喜欢就关注我吧!

相关代码可以在公众号后台回复“DWT”获取。

欢迎关注“物联网 IoT 开发”公众号

退出移动版