- 一.過程
- 二.思考
一.過程
關鍵代碼如下
通過串口驅動接口,注冊串口接收回調函數,uart_rx_callback
該回調函數中如果收到串口數據,長度非0,則更新全局變量uart_rx_len
主循環中再檢查全局變量uart_rx_len
,如果大于0說明收到了串口數據,將收到的數據再發送出去,實現簡單的串口回環測試。
static int uart_rx_len = 0;
void uart_rx_callback(const void *buffer, uint32_t length)
{
if(length >0)
{
uart_rx_len = length;
}
}
int main(void)
{
......
debug_uart_init(IOT_UART_PORT_1);
uint8_t buffer[64];
iot_uart_register_rx_callback(IOT_UART_PORT_1,buffer,sizeof(buffer),uart_rx_callback);
while(1)
{
if(uart_rx_len > 0)
{
iot_uart_write_buffer(IOT_UART_PORT_1,buffer,uart_rx_len);
uart_rx_len=0;
}
}
}
現象是并沒有實現上述回環測試的功能。
于是進行調試,先確認是否進入了接收處理,
b uart_rx_callback
發現可以進入該回調函數,說明收到了數據。
step
單步運行到執行完uart_rx_len = length;
,再查看該變量的值
(gdb) p uart_rx_len
$2 = 1
也確實收到了一個字節。
然后繼續往下看,看如下條件是否進入
if(uart_rx_len > 0)
{
iot_uart_write_buffer(IOT_UART_PORT_1,buffer,uart_rx_len);
uart_rx_len=0;
}
b main.c:146
在iot_uart_write_buffer(IOT_UART_PORT_1,buffer,uart_rx_len
所在行146行,打斷點。
發現進不了該斷點。
這里就比較奇怪了,前面uart_rx_len
確實是1,了但是這里條件卻進不去,其他地方也沒有寫uart_rx_len
的地方。
那么只有繼續看該處代碼對應的匯編代碼
先在uart_rx_callback
前打斷點,串口接收一個字節觸發該回調執行。再在 if(uart_rx_len > 0)
所在的行144行前打斷點,b main.c:144
,c
運行到該處。
此時看到uart_ex_len
的值是1正確的。
(gdb) p uart_rx_len
$2 = 1
layout split
打開匯編和C對照窗口。
查看變量uart_rx_len
的地址,為0x20300c8
(gdb) p &uart_rx_len
$4 = (int *) 0x20300c8 < uart_rx_len >
(gdb) info reg s1
s1 0x2030000 33751040
S1
寄存器的值設置為0x2030000, lui s1,0x2030
lui的u表示up(高20位),加載0x2030到S1的高20位。
lw a2,200(S1)
即將S1對應的地址偏移200(0xC8)地址處的值加載到a2寄存器。
正好是獲取0x2030C8(uart_rx_len)的值到A2,
然后再執行
blez a2,0x20001ba進行判斷uart_rx_len和0的值比較,判斷是否往下執行還是在此死循環。
初看沒問題,一細看就有端倪了。
假設一開始uart_rx_len=0,
那么后面始終執行的是一條語句,blez a2,0x20001ba,a2寄存器的值不再更新了,這就有問題了,內存中0x2030C8(uart_rx_len)的值變了,但是寄存器a2的值不再變化。
這就是編譯器自作主張優化,生成的代碼沒有繼續去從內存0x2030C8(uart_rx_len)處更新值到a2寄存器了。理論上是需要再次執行上述lw a2,200(S1)
指令的。這就編譯器優化導致的問題。
我們修改
static int uart_rx_len = 0;
改為
`static volatile int uart_rx_len = 0;``
再來看匯編代碼。
可以看到如果a5小于0,會跳轉到addi s1,s2,200處執行再繼續lw a5,0(S1)處加載uart_rx_len的值到a5,會不斷從內存處更新值到寄存器。
這就是volatile的作用,加了volatile后編譯器始終,會從內存中更新值到寄存器,而不會自作主張使用寄存器中緩存的值。
默認SCons/riscv_tools.py中是Os優化,
CCFLAGS = common_flags + [
"-Os",
]
不加volatile且優化改為
-O3,-O2,-O1,-O0分別看一下。
可以看到-O1優化編譯就進行了優化,后面-O2,-O3就不用看了。
-O0
-O1
二.思考
這里函數uart_rx_callback寫了變量uart_rx_len
void uart_rx_callback(const void *buffer, uint32_t length)
{
if(length >0)
{
uart_rx_len = length;
}
}
且uart_rx_callback函數也作為回調函數使用了,理論上編譯器應該指導uart_rx_len會被改寫,不應該作此優化。
手動調用以下uart_rx_callback
uart_rx_callback(0, 0);
debug_uart_init(IOT_UART_PORT_1);
還是一樣的優化了
看來編譯器還是聰明過頭了。
這里主要是
while(1)后面第一條語句就是判斷uart_rx_len,如果之前還有其他語句,則編譯器可能不會優化了。
while(1)
{
if(uart_rx_len > 0)
{
iot_uart_write_buffer(IOT_UART_PORT_1,buffer,uart_rx_len);
uart_rx_len=0;
}
}
審核編輯:湯梓紅
-
嵌入式
+關注
關注
5082文章
19104瀏覽量
304798 -
串口
+關注
關注
14文章
1551瀏覽量
76421 -
優化
+關注
關注
0文章
220瀏覽量
23890 -
函數
+關注
關注
3文章
4327瀏覽量
62569 -
RISC-V
+關注
關注
45文章
2270瀏覽量
46129
發布評論請先 登錄
相關推薦
評論