Python在嵌入式應用程序開發中變得越來越普遍,特別是對于在網絡邊緣運行的機器學習框架。但是,這種高級通用編程語言抽象出代碼中的許多細節,這些細節可能會以開發人員可能沒有意識到的方式影響實現的性能。
讓我們舉一個明顯的例子:計算斐波那契數列。至少有兩種不同的方法可以執行此操作,遞歸算法和標準迭代算法,其性能級別差異很大。
可以使用名為跟蹤測試器的工具評估不同實現或算法的性能。這是Percepio的可視化跟蹤診斷工具,使嵌入式軟件開發人員能夠在運行時深入了解代碼,以便更輕松地調試系統級問題,并幫助他們改進軟件的設計和性能。
Tracealyzer 可以與開源 Eclipse 工具等傳統調試器并排使用,并通過系統級的幾個附加視圖補充詳細的調試器視圖。這有助于了解經典調試器不足的實時問題。
結合 Linux 操作系統發行版中的 LTTng 開源跟蹤包,跟蹤測試程序可以顯示不同級別的性能。這與處理器無關,并且是所選算法的結果。
對于評估,斐波那契數列的每個實現都在單個模塊中執行:
def recur_fibo(n):
if n <=1 n:
return n
else:
return(recur_fibo(n-1) + recur_fibo(n-2))
def non_recur_fibo(n):
result = []
a,b = 0,1
while a < n:
result.append(a)
a,b = b, a+b
return result
有單獨的Python源文件調用上面的兩個函數:
import lttngust
import logging
import fib
def example():
logging.basicConfig()
logger = logging.getLogger(‘my-logger’)
logger.info(‘Start’)
fib.recur_fibo(10)
logger.info(‘Stop’)
logger.info(‘Start’)
fib.non_recur_fibo(10)
logger.info(‘Stop’)
if __name__ == ‘__main__’:
example()
以下命令在 LTTng 中捕獲跟蹤,然后可以在跟蹤測試器中對其進行檢查:
$> lttng create
$> lttng enable-event --kernel sched_switch
$> lttng enable-event --python my-logger
$> lttng start
$> python3 .py
$> lttng stop
$> lttng destroy
將標準的 Python 記錄器替換為稱為“我的記錄器”,允許跟蹤測試程序在工具的跟蹤視圖中顯示事件。由于 Tracealyzer 在此特定示例中未捕獲任何應用程序數據,因此無需將軟件配置為讀取數據值。相反,所需要的只是一個自定義間隔,用于標記兩個函數的進入和退出。
雖然在上面的跟蹤視圖中可以看到巨大的性能差異,但 Tracealyzer 還可以提供更多有形的性能指標。這可以通過轉到視圖并單擊“間隔”和“狀態機”來完成,并使用代碼中隨 logger.info()調用一起插入的“開始”和“停止”字符串創建自定義間隔,這些字符串標記候選函數的進入和退出。
區間圖顯示遞歸算法(首先執行)和迭代算法(第二次執行)之間存在 20 倍的差異。
在這個例子中,我們用每個算法只計算10個斐波那契數列。如果沒有 Tracealyzer,可能需要進行更多的迭代才能獲得一些有意義的見解,但由于兩個原因,這是有問題的。首先,當將遞歸斐波那契算法運行到1000(甚至100)時,Python將簡單地坐在那里。這將是令人擔憂的,因為不清楚這種無響應是由于實現中的錯誤還是其他原因造成的。在這種情況下,我們可能可以猜測為什么會發生這種情況,但是對于更復雜的問題,需要大量的日志記錄才能了解瓶頸的位置。
其次,如果嵌入式系統上運行多個應用程序,則這些其他應用程序可能會破壞目標應用程序,這也會增加算法或函數完成執行的時間。沒有痕跡,就沒有簡單的方法來找出是否是這種情況。
相反,Python和跟蹤測試器中LTTng的組合突出了所選擇算法的基本特征才是問題所在。在開發更復雜的算法時,這是非常寶貴的。此示例實現可作為有關如何評估未來算法實現性能的參考。一般來說,在單獨的Python模塊中實現核心功能是良好的編程實踐,這也簡化了特定功能的跟蹤。
由于跟蹤開銷幾乎可以忽略不計,因此跟蹤點可以保留在應用程序中,因為它在目標嵌入式系統上甚至在生產中進行測試,從而允許 Tracealyzer 工具在生產代碼庫中生成性能指標。這對于常規系統測試非常有用,并且允許使用相同的代碼庫來確保應用程序在功能上正確且性能良好,只需進行最少的更改。
結論
使用跟蹤測試程序和 LTTng 在 Python 應用程序中捕獲性能指標,可以對算法的實現進行寶貴的分析。
這種方法的開銷最小,這意味著可以保留代碼的檢測,以便在目標嵌入式系統上使用。這樣可以對目標應用程序進行更多監視,并增強與其他應用程序和操作系統的交互分析。例如,可能有另一個進程或線程搶占目標應用程序并影響性能。跟蹤測試程序和 LTTng 的組合可以識別此類異常的原因,這使開發人員能夠優化實現以防止進一步的問題。
雖然斐波那契數列的示例實現相對無害,但它突出了Python語言的一個關鍵特征,可以為開發更復雜的實現提供信息。
此示例還顯示了在設計中使用單獨模塊的價值。使用 trace,開發人員可以在擴展到完整的系統實現之前,在這些模塊中測量和驗證關鍵核心功能的性能,而不會產生顯著的開銷。這有助于證明應用程序在功能上是正確的,并且在目標環境中進行最小的更改時性能良好。
審核編輯:郭婷
-
嵌入式
+關注
關注
5089文章
19170瀏覽量
306812 -
python
+關注
關注
56文章
4807瀏覽量
84935
發布評論請先 登錄
相關推薦
評論