TOP1 語音識別控制家用電器系統電路
語音識別技術是近年來十分活躍的研究領域。語音識別系統的實用化研究是語音識別研究的一個主要方向。以玩具市場為例,具有高科技含量的電子玩具、智能玩具發展迅猛,電子互動式、智能化玩具已經成為玩具行業發展的主流。我國是玩具生產和出口大國,但在高科技玩具的發展方面和國外的差距很大,因此,及時投入精力廣泛開展這方面的研究,無論對技術創新應用,還是社會經濟發展,都有巨大的現實意義。與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。語音識別功能大大增加了玩具使用的樂趣,并使玩具體現出一定的智能性,因此成為大部分電子玩具、智能玩具設計中使用的關鍵技術。
語音模塊
語音輸出電路如圖所示,其中VDDH為參考電壓,VSS是系統的模擬地。音頻信號由SPCE061A 的DAC引腳輸出送到電路的J4端,通過音量電位器R9的調節端送到集成音頻功率放大器SPY0030,經音頻放大后,音頻信號從SPY0030輸出經 J2 端口外接揚聲器播放聲音。 SPCE061A內置2路10位精度的DAC,只需要外接功放電路即可完成語音的播放。圖中的SPY0030是凌陽的一款音頻放大芯片,可以工作在 2.4~6V范圍內,最大輸出功率可達700mW。 J5 都是語音輸出接口,;是兩針的插針外接喇叭,由DAC 輸出引腳經語音集成。
放大器SPY0030 放大,然后輸出。SPY0030 是音頻功率放大器。因為聲音是不同振幅和不同頻率的波,即交流信號電流,三極管的集電極電流永遠是基極電流的β倍,β是三極管的交流放大倍數,應用這一點,若將小信號注入基極,則集電極流過的電流會等于基極電流的β倍,然后將這個信號用隔直電容隔離出來,就得到了電流(或電壓)是原先的β倍的大信號,這現象稱為三極管的放大作用。經過電流與電壓的共同放大,就完成了功率放大。R14為可調電阻,當調節阻值大小事,即調節了基極的輸入信號,最終影響的就是輸出信號即語音輸出音量的大小。SPY0030的放大倍數固定為20倍。
語音輸入電路如圖所示,其中VMC提供傳聲器的電源,AVSS1是系統的模擬地,VCM為參考電壓,1腳和2腳分別是傳聲器X1的正極、負極的輸入引腳,連接SPCE061A的MICP、NICN管腳上。當對著傳聲器講話時,1腳和2腳將隨著傳聲器輸入的聲音產生變化的波形,并在SPCE061A的兩個端口處形成兩路反相的波形,送到SPCE061A 控制器內部的運算放大器進行音頻放大,經過放大的音頻信號,通過ADC轉化器轉化為數字量,保存到相應的寄存器中。 SPCE061A的A/D轉換器有8個通道,其中有1個通道是MIC-NI輸入,它專門用于對語音信號進行采樣。語音信號經過MCI轉換成電信號,然后輸入至SPCE061A內部前置放大器。由于人們說話時,麥克風距離嘴邊的距離不同,語音信號的能量將會有很大的差異,此時,如果芯片的的輸入信號太大或是太小都將影響識別的精度。而SPCE06lA內部就帶有自動增益控制電路AGC能隨時跟蹤、監視前置放大器輸出的音頻信號電平,當輸入信號增大時AGC電路自動減小放大器的增益;當輸入信號減小時,AGC電路自動增大放大器的增益,從而以補償太小或是太大的信號,以便使進入戶A/D的信號保持在最佳電平,又可使削波減至最小。 SPCE061A芯片中已經集成了音頻輸入專用ADC以及AGC放大電路,因為此芯片外部的電路比較簡單。
MICP和MICN將隨著MIC產生的波形變化,并在兩個端口處形成兩路反相波形,在經過兩級運放放大,把放大的語音信號交給ADC轉換為數字量,這時就可以通過單片機編程對這些數據進行處理,進行語音處理識別等功能。 正如我們在前面介紹的61 板具有強大的語音處理功能,如圖3-8所示,X1 是語音的MIC 輸入端,帶自動增益(AGC)控制。
SPR4096外擴Flash模塊
在本系統中,當我們對系統進行訓練、識別、操作時,有一些語音提示,由于SPCE061A內部只有32k字的flash空間,除了一部分空間作為程序的存儲之后,剩下的用來存儲語音數據時遠遠不夠的,于是系統外擴了flash。SPR4096與SPCE061A的連接方式為:SCK與SPCE061A的 IOB0接,SDA與SPCE061A的IOB1口接。SPR4096按串行接口模式工作,要把CF2~CF0均接高電平。CF7為低電平時選中 FLASH,高電平時選中SRAM。 SPR4096是一個高性能的4M-bit(512×8-bit)FLASH,分為256個扇區。每個扇區2Kbyte。SPR4096還內置了以個 4K×8bit的SRAM。在進行FLASH的編程/擦除時,可以并發執行SRAM的讀/寫。SPR4096內置了一個總線存儲器接口和一個串行接口,它允許單片機通過8-bit并行模式或者1-bit的串行模式訪問FLASH/SRAM存儲區。 SPR4096串行接口的工作頻率可達到5MHz。SPR4096有兩個電源輸入端VDDI和VDDQ。VDDI是給內部FLASH和控制邏輯供電的;VDDQ是專門為I/O供電的。
供電電壓VDDQ:2.25V~3.6V。SPR4096最大讀電流為2mA,最大編程/擦除電流為6 mA 。SPR4096模塊包括總線存儲接口,串行接口,SRAM,編程與擦除控制器和一個4M的FLASH。選擇串行接口時,SCLK作為時鐘信號線,SDA 作為1-bit的數據線。如果接收到FLASH的讀指令或者SRAM的讀/寫指令,串口會把這些指令傳給編程和擦除控制器,讓編程和擦除控制器去完成相應操作。 串行接口模式的選中是通過CF2~CF0來實現的。當CF2~CF0均接高電平時,選中的就是串行接口模式,在串行接口模式下,CF7為低電平時選中 FLASH,高電平時選中SRAM。該芯片有SIF(Serial Interface)和BMI(Busmenory Interface)兩種工作方式,但DIP24只支持SIF方式。
全球電子測量技術與市場領導者——是德科技(原安捷倫電子測量事業部)UXM新品體驗會將于近期拉開帷幕,歡迎各位業內人士踴躍參加,您的到來,將是KEYSIGHT的最大榮幸!報名地址請點擊以下圖片進入:
TOP2 語音識別機器人系統電路
系統電源電路設計
SPCE061A采用低電壓供電方式,這可以大大降低芯片的功率損耗。其中,SPCE06lA的電源分兩種,即內核電源(VDD)和I/O口電源(VDDH)。I/O口電源采用5V電壓,而內核電源則為3.3V或者更低。降低芯片內核電壓的目的主要還是降低芯片的功耗,同時也可以降低芯片的工作溫度,延長芯片使用壽命。盡管這種語音芯片的工作電壓范圍很大,但是為了使芯片內核運行更加穩定,同時又保證I/O口及外部擴展部件的工作電壓要求,電源電路采用芯片7805和SPY0029分別提供5V和3.3V電壓完成對整個系統供電。 7805芯片電路中正常工作是,輸入、輸出電壓差為2~3V。電路中靠近引腳處接入電容C40、C41用來實現頻率補償,防止穩壓器產生高頻自激震蕩和抑制電路引入的高頻干擾,C39是電解電容,以減小穩壓電源輸出端由輸入電源引入的低頻干擾。
6是保護二級管,當輸入端短路時,給輸出電容器C39一個放電通路,防止C39兩端電壓作用于調整管的be結,造成調整管be結擊穿而損壞。
控制與結果顯示電路
鍵盤模組可直接用排線與61單片機I/O口相連。1*8KEY 的8 列分別定義為COL1~COL8,1 行定義為ROW1。如圖3-11所示。 按鍵分別和SPCE061A的IOA0~IOA7相連,他們的作用分別為1個系統開關鍵,1個系統復位鍵,1個單個命令訓練按鍵,1個所有語句循環訓練按鍵,剩余4個初步設定為LCD功能控制按鍵。每個按鍵的按下與抬起都會送給IOA口一個電壓值,當按鍵按下使相應的IOA口得到一個高電壓。相反,則為低電壓。單片機則根據IO口的電壓值進行相應的操作。
LED模組
利用LED顯示來測試是否達到控制電器目標。利用數碼管顯示數字的不同來模擬驗證是否能達到對家用電器的控制。 LED和LCD電路作為系統的顯示部分,以顯示當前的系統狀況及識別結果以便檢驗實驗結果和提示用戶進行下一步操作。LCD部分在實驗階段可不接入。 計劃采用內置SPLC0501點陣式圖形液晶顯示模塊由液晶驅動控制器SPLC501、LCD顯示器和外部設備的接口等幾部分組成,液晶驅動控制器 SPLC501集行、列驅動器、顯示數據存儲器(DDRAM,Display Data RAM)和控制器與一體,廣泛用于小規模液晶顯示模塊。內置SPLC501點陣式圖形液晶顯示模塊的管腳排列和SPEC061A接線方法如圖所示。
雖然實現了語音控制家用電器,但是總的來說系統界面不是很友好。為此,我們可以充分利用計算機和通信技術,并用VB等軟件開發友好的管理界面,將數據和其他信息通過計算機統一進行管理和控制。
語音識別機器人系統電路設計
目前制造業市場上,工業機器人具有相當大的市場潛力,要使工業機器人真正應用于生產線上的各個方面,滿足人們日益增長的需求,就離不開高性能的語音識別控制系統。隨著計算機軟硬件技術、半導體技術、電子技術、通訊技術等的飛速發展人類已經進入后PC時代。語音識別技術得到了迅猛發展, 支持語音識別的各種產品紛紛面世。人類實現了語音命令控制空調、電視、燈光、自動窗簾等的使用,讓人們的生活“隨音所欲”,更加舒適,更加便捷。基于凌陽 16位SPCE061A單片機設計了一個具有語音識別功能的機器人。在經過訓練后使機器人對訓練人的命令做出應答,完成跳兩首舞曲、走步、轉向、轉頭、發射飛盤等動作。
語音識別可劃分為訓練和識別兩個過程。在第一階段,語音識別系統對人類的 語言進行學習,把學習內容組成語音庫存儲起來,在第二階段就可以把當前輸入的語音在語音庫中查找相應的詞義或語義。凌陽16位SPCE061A單片機內嵌 32K字閃存,2K字SRAM,內置10位ADC、DAC,有多達14個的中斷源。它的CPU內核采用16位具有DSP功能的微處理器芯片, 而且CPU可最高工作在49MHz的主頻下,能夠非常容易地、快速地處理復雜的數字信號,因此與其他類型的單片機相比,在數字語音處理方面 SPCE061A更具有優勢。基于SPCE061A設計了一個具有語音識別功能的機器人。經過訓練,訓練人可使用各種命令讓機器人完成許多有趣的動作,使得人機交互更具智能化。
SPCE061A最小系統
SPCE061A最小系統中,含有SPCE061A芯片外圍的基本模塊,其主要由晶體輸入模塊(OSC)、鎖相環外圍電路(PLL)、復位電路(RESET)、指示燈(LED)等組成,參看圖 4-1。在OSC32O、OSC32I端口接上晶體振蕩器和諧振電容,在VCOIN端口接上相對應的電容和電阻后即可工作。在其他不用的VDD端口和 GND端口也不能懸空應該接上0.1uF的耦合電容以提高抗干擾能力。 圖 4-1 SPCE061A最小系統。
TOP3 機器人硬件驅動電路
電源輸入端口是61板的能源供應中心,整塊板子的電源都是由此提供進去,可采用電池或穩壓電源提供5V輸入,并且必須至少保證電流在50mA以上,否則會造成系統無法倍頻和下載出錯。SPCE061A的內核供電為3.3V,由于I/O端口可接3.3V也可以接5V,所以在電源模塊中有一個端口電平選擇跳線J5用于選擇端口電壓,電源模塊參看圖,如下:
由于此系統需要的端口高電平為5V,所以圖當中的J5跳線需要跳到1和2上。
放音電路設計
將HM628128A中存儲的語音數據順序取出,解碼后,以8kHz的速率進行D/A轉換輸出,語音數據經電容濾波恢復成原始語音波形,最后用三極管驅動揚聲器放音。SPCE061A音頻輸出共有兩個DAC通道,DAC1和DAC2輸出的模擬電信號通過DAC1和DAC2引腳輸出。DAC的輸出范圍是 0x0000~0xFFFF。DAC1和DAC2的輸出數據應寫入P_DAC1和P_DAC2單元。上電復位以后,兩個DAC均被自動打開,此時會消耗少量的電流(幾個毫安)。如若不需要,盡量關閉DAC輸出(將P_DAC_Ctrl單元的第一位置為1)。而且DAC的直流電壓必須保持平穩地變化,否則可能由于電壓的突變引起揚聲器產生雜音。為減緩電壓的變化幅度,從而輸出高質量的音頻數據可以采用ramp up/down技術。其應用條件是:被喚醒/上電復位后首次使用DAC時,上電復位功能應在被關閉/進入睡眠狀態之前。 放音利用的是SPCE061A內部的DAC,電路參看圖 4-8。圖中的SPY0030是凌陽公司的產品。和LM386相比,在工作電壓上,LM386需在4V以上,而SPY0030僅需2.4V(兩節電池)即可工作;在輸出功率上,LM386僅在100mW以上,而SPY0030可達700mW。
機器人硬件驅動電路
機器人驅動電路采用功率較大的三極管搭成H橋來驅動電機從而實現電機的正向旋轉與電機的反向旋轉,本系統中使用H橋驅動的電機包括兩個用于走路的電機與一個頭部轉向的電機。同時用了一個三極管驅動單向旋轉的電機,如加速電機與發射電機。語音處理技術本身就是一門理論性強、實用面廣而且難度較大的綜合學科。而開發出具有語音功能的單片機也是相當困難的。凌陽unsp系列16位單片機,就是適應這種需求而設計的。凌陽SPCE061A實現語音識別其獨特之處在于:硬件電路簡單,因為SPCE061A是一款專門為語音信號處理設計的單片機,麥克風和喇叭可以直接接入,接放大電路可不用外接。具有一套高效的指令系統,軟件編程容易,有相應的API函數,可直接調用。
TOP4 SPCE061A智能小車語音識別電路
本文利用凌陽單片機設計一個具有語音識別功能的智能遙控小車。該設計將遙控車由傳統的手動遙控改成了語音識別遙控,集成了先進的語音識別技術,加上小車的機動靈活的特點,使控制者可以通過語音控制小車實現預設動作,從而釋放控制者的雙手,而且小車和控制者之間還具有一定的交互功能。所以此次研究具有較強的實用性和發展前景。
繼電器驅動電路的設計
由于單片機I/O口提供的電流太小,不能直接驅動繼電器工作。在這里采用8050NPN管來提供一個開關電壓,實現I/O口對繼電器的驅動;用IN4007去掉繼電器斷開時線圈產生的反向電流,保護8050NPN管不被損壞。繼電器驅動電路如圖所示。
行駛狀態控制電路設計
如圖所示為行使狀態控制電路,整個小車的行駛狀態由兩個電機MOTOR A和MOTOR B來控制;MOTOR A控制小車的左邊兩個輪子,MOTOR B控制小車右邊兩個輪子。具體控制如所示。
麥克錄音輸入及AGC電路
麥克風電路如圖所示。凌陽的SPCE061A是16位單片機,具有DSP功能,有很強的信息處理能力,最高時鐘可達到49M,具備運算速度高的優勢等等,這為語音的播放、錄放、合成及辨識提供了條件。本系統接入MIC電路如下圖所示,MIC為錄制語音辨識命令服務。麥克錄音輸入及AGC電路。
語音播報電路
音頻部分的原理圖如下所示,在下圖中可以看到兩個跳線,其作用在于可以測量DAC的輸出波形;另外拔掉跳線,可以斷開DAC到喇 叭放大的通路,使得DAC通道處于開路狀態。這樣便于用DAC做其他用途,用戶可以用過這個跳線來加入自己的外圍電路。
本設計綜合應用了SPCE061A豐富的硬件資源,成功的實現了語音控制功能。下面簡單的介紹一下實際應用中的一些資源優勢:在硬件方面,較高的執行速度、內置的硬件乘法器、ADC和DAC功能、內置的AGC自動增益環節,這些為語音處理提供了強大基礎。在軟件方面,標準的C語言編程,豐富的語音資源函數為編程提供了很大的方便。 該設計方案結構簡單,以單芯片實現了語音播放與識別以及電機控制功能,相當于“語音識別芯片+普通單片機”的功能。但是比“語音識別芯片+普通單片機”方案實現起來要簡單很多,而且成本也會降低很多。
TOP5 AVR單片機語音識別電路模塊
基于AVR單片機的語音識別系統設計,系統以AVR單片機為控制核心,實現對人的語音的識別控制。系統采用的主控芯片為Atreel公司的 ATMEGAl28,語音識別功能采用ICR oute公司的單芯片LD3320。LD3320內部集成語音識別算法,無需外部FLASH,RAM資源,可以很好地完成非特定人的語音識別任務。同時該芯片內部集成了MP3播放功能,支持MPEG等格式,可實現語音提示或MP3歌曲的播放功能。由于內部含有16位A/D、D/A轉換器和功放電路,所以不需要外接功放電路就可以產生清晰的聲音。該系統已經預留好各種接口,具有良好的擴展性。
LD3320語音識別電路
LD3320芯片是一款“語音識別”專用芯片。該芯片集成了語音識別處理器和一些外部電路,包括A/D、D/A轉換器、麥克風接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,RAM等,直接集成到產品中即可以實現語音識別、聲控、人機對話功能。圖3為LD3320電路原理圖,與MCU通信采用SPI總線方式,時鐘不能超過1.5MHz。
麥克風工作電路如圖所示,音頻輸出只需將揚聲器連接到SPOP和SPON即可。使用SPI總線方式時,LD3320的MD要設為高電平,SPIS設為低電平。SPI總線的引腳有SDI,SDO,SDCK以及SCS。INTB為中斷端口,當有識別結果或MP3數據不足時,會觸發中斷,通知MCU處理。 RSTB引腳是LD3320復位端,低電平有效。LED1,LED2作為上電指示燈。
嵌入式語音識別處理ISD-SR3000應用電路
由ISD-SR3000構成的語音識別系統由電路如圖2所示。以下分別介紹電路中各部分的功能。
時鐘電路
SR3000內含片內振蕩器,但應用時也可通過X1和X2/CLKIN端的外接晶振或外部時鐘源來產生時鐘信號。外部時鐘源信號應通過X2/CLKIN端輸入。要注意的是,外部時鐘源電平與CLKIN的輸入電平要相符(3.3V或5V)。
外接晶振可通過X1和X2/CLKIN端與芯片內的振蕩電路相連。為減少寄生電容和電感對振蕩頻率的影響,外接的晶振和電容應盡量靠近X1和X2 /CLKIN端。ISD-SR3000可工作在3.3V±10%和5V±10%兩種電壓,不同電壓的接線方式不同。圖3是采用3.3V電源時的接線圖,圖 4為采用5V電源時的接線圖。SD-SR3000具有低功耗模式,在低功耗模式時的電流消耗僅12mA,此時芯片中的一些功能模塊處于未激活狀態,因而不能進行語音識別。低功耗模式時的引腳CS0和CS1必須置1,這時,MWCLK、MWDIN信號將保持在Vss+0.5V,而RESET、MWCS信號則將保持在Vcc- 0.5V。
TOP6 揭秘DSP和HMM的語音識別系統電路
存儲器接口
ISD-SR3000利用擴展的Flash(閃存)和RO來存儲聲音標簽、詞匯、提示符和音質模型。建議選用16M以上存儲容量的擴展Flash存儲器,如Am29LA160D等。外接64kB的SRAM可實現HMM算法。表2給出了擴展地址線的接口信號。
ISD-SR3000可為模擬和數字電話提供一個支持主和從CODEC接口模式的CODEC接口,該接口具有8位和16位的信道寬度,能支持可變和固定格式的通信協議。在主模式下,可利用SR3000來控制CODEC的運行以滿足模擬電話和獨立標準的應用;在從模式下,CODEC接口由外接信號控制,此模式可用于數字電話,如ISDN或DECT線等。CODEC接口使用的5個信號分別為CDIN、CODUT、CCLK、CFS0和CSF1。其中 CDIN、CDOUT、CCLK和CFS0被連接到第一個CODEC。CDIN、CDOUT、CCLK和CFS1被連接到第二個CODEC接口。數據通過 CDOUT輸出端傳送給CODEC接口,并通過CDIN輸入端從CODEC讀出。CCLK和CFS0端在主模式下為輸出狀態,而在從模式下為輸入狀態。 CFS1是一個輸出端。
揭秘DSP和HMM的語音識別系統電路模塊設計
語音信號采集模塊主要包括語音信號的輸入輸出模擬通道、DSP和AD50的連接、DSP和AD50的周邊設備連接等。其中,DSP和AD50的周邊設備連接包括電源電路、時鐘電路、復位電路、存儲器擴展電路和去耦電路等,這些電路的連接可查看相關芯片資料。語音信號的前后端處理主要由輸入輸出模擬通道組成。這兩個電路的主要作用是將信號進行處理,盡量減少輸入輸出引入的噪聲。同時,還可以調整輸入輸出的放大系數,使語音信號適合各種不同的功放,得到最佳的語音效果。為了達到更好的效果,AD50的模擬信號輸入采用差分輸入方式,即使用兩個運算放大器,將單端輸入信號轉換成差分輸入信號,電路連接如圖3.5所示。使用差分信號,信號一J下一負同時進入采集系統,如果此時有隨機噪聲出現,通過『F負信號的加減,可以有效消除部分噪聲。
AD50差分輸入電路
AD50的D/A輸出為差分信號,可以直接驅動600歐姆的負載。
差分輸出電路
要使TLC320AD50正常工作,還需要進行電源供電及去耦電路以及一些功能引腳包括幀同步延遲輸出、電壓下拉、輸出監控、參考電壓過濾輸出等的連接,具體連接如圖3.7所示。
TLC320AD50外圍電路
DSP通過多通道緩沖串口連接AD50。DSP最多可以使一個緩沖串口與3個AD50芯片連接。本系統采用DSP為主設備、AD50為從設備的連接方法。如圖3.8所示,AD50的時鐘信號MCLK由DSP的定時器0的輸出TOUT0提供,時鐘頻率可以通過設置定時器0來改變。AD50的移位時鐘輸出 SCLK連接到DSP的緩沖串口0的接收時鐘引腳CLKR0,幀同步信號FS連接到DSP緩沖串口0的FRXO。AD50的FC引腳連接到DSP的通用 I/O引腳XF,用于控制二次串行通信。圖3.8中DSP的DR0為輸入,其余均為輸出。
TOP7 程序存儲器電路
程序存儲器主要用于系統運行時,將采集的數字語音信號暫時存儲在RAM中以備后續的處理。由于采集的數據不是太大,擴展32k的程序存儲器即可滿足要求。因此本系統只用到CY7C1021的低32k字空間,將DSP的地址線的低15位與CY7C1021的地址線引腳相連,而地址線的1卜18位通過一個數字邏輯電路后用于尋址CY7C1021的低32k字空間。電路原理圖如圖3.9所示。
Y7C1021主要電路原理圖
圖3.10是CY7C1021讀和寫信號數字邏輯電路。圖中,DSP的DSP—R/W和DSP—MSTRB引腳通過或門后的輸出作為SRAM的寫信號,DSP—R/W的非和DSP—MSTRB引腳通過或門后輸出作為SRAM的讀信號。
圖3.1l是CY7C1021的第16位地址引腳數字邏輯電路。圖中,DSP A15經過一個非門作為二四譯碼器SN74LSl39AD的使能信號,DSP A16和DSP A17經過譯碼器后輸出端Yl與Y2的非通過一個與門后的輸出作為SRAM的第16位地址線。因此,低32k的SRAM映射到DSP程序空間的0X1 8000__oXlFFFF。
數據存儲器電路
數據存儲器主要用于存儲編譯后的系統軟件的數據,用于語音識別系統板上電自舉。選用flash芯片,是因為flash芯片是電可擦可寫芯片,可以在線對flash進行操作,修改應用程序方便。地址緩沖器和數據緩沖器電路連接分別如圖3.12和3.13所示:
SN74LVTHl6244外圍電路
SN74LVTHl6245外圍電路原理圖
TOP8 LED顯示電路與外圍電路設計
SST39VFl60有1M*16bit的容量,但擴展數據存儲器只需64K空間足以,所以電路SST39VFl60的地址線的高4位接地。電路原理圖如圖3.14所示:
SST39VFl60外圍電路
LED顯示電路
LED顯示電路在此系統中用于顯示語音識別的結果,與輸入的語音比較可知系統識別率的高低。電路中用SN74LS373作為暫存器,通過DSP的I/O 端口選擇引腳IS和DSP的第17個地址引腳來控制SN74LS373的輸出使能端,用一個共陰極七段數碼管來顯示識別結果【241。電路圖如圖3.15 所示:
LED顯示電路原理圖
J-TAG電路
JTAG標準是IEEEl990年公布的1 149.1標準的又一稱呼,是針對現代超大規模集成電路測試、檢驗困難而提出的、基于邊界掃描機制和標準測試存儲口的國際標準。JTAG標準公布以后,TI公司為其以后的DSP器件均設置符合國際標準的JTAG邏輯測試口,通過JTAG測試口訪問和調試TI DSP芯片。電路設計中需要注意的問題:當仿真器與DSP距離大于15.24cm時,JTAG仿真頭與DSP之間的EMUO、EMUl、TMS、TDI引腳互聯時應通過上拉電阻接高電平,而TMS、TDI、TDO、TCK之問互聯時還要加緩沖器,只在距離小于15.24cm時它們之間不用通過緩沖器連接。
JTAG在線仿真電路原理圖
電源電路
此系統中,有兩類電壓,一類是DSP芯片的內核電壓,為1.8V,另一類是DSP的外圍電路供電電壓,為3.3V。為了能夠滿足雙電壓供電,本系統選用TPS767D318電源芯片供電。根據芯片推薦電路搭建電路原理圖如圖3.17所示:
系統電源供電電路原理圖
簡述了與硬件相關的驅動程序的設計,將硬件驅動程序與語音識別程序綜合,編譯通過后載入目標板即對語音信號進行識別。介紹了一個基于DSP的非特定人漢語孤立數字語音識別系統的設計過程,系統通過AD50芯片將模擬語音信號采集到DSP芯片中,再采用語音識別算法對采集到的信號進行處理,并將識別的結果用LED輸出完成了整個系統設計。
TOP9 語音識別系統在家庭監護機器人應用電路
語音是人類最常用的交流方式,也是人類和計算機交流最渴望的方式。因此用語音同計算機交流也成為了最近研究的熱點,計算機對語音的理解是計算機科學中的一個引人人勝的、富有挑戰性的課題。我國語音識別研究工作開始的較晚,但近年來發展得很快,一直緊跟國際水平,國家也很重視,中科院自動化所研制的非特定人、連續語音聽寫系統和漢語語音人機對話系統,其字準確率或系統響應率可達90%以上。鑒于中國未來龐大的市場,國外也非常重視漢語語音識別的研究。
STM32嵌入式語音識別電路模塊設計
介紹了一種以ARM為核心的嵌入式語音識別模塊的設計與實現。模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心,通過以LD3320芯片為核心的硬件單元實現語音識別功能,采用嵌入式操作系統μC/OS-II來實現統一的任務調度和外圍設備管理。經過大量的實驗數據驗證,本文設計的語音識別模塊具有高實時性、高識別率、高穩定性的優點。
語音識別電路
圖3為語音識別部分原理圖,參照了ICRoute發布的LD3320數據手冊進行設計。LD3320的內部集成了快速穩定的優化算法,不需外接Fla-sh、RAM,不需要用戶事先訓練和錄音而完成非特定人語音識別,識別準確率高。
圖中,LD3320采用并行方式直接與STM32F103C8T6相接,均采用1kΩ電阻上拉,A0用于判斷是數據段還是地址段;控制信號,復位信號以及中斷返回信號INTB與STM32F103C8T6直接相連,采用10kΩ電阻上拉,輔助系統穩定工作;和STM32F103C8T6采用同一個外部8 MHz時鐘;發光二極管D1、D2用于復位后的上電指示;MBS(引腳12)作為麥克風偏置,接了一個RC電路,保證能輸出一個浮動電壓給麥克風。
智能語音識別云臺轉動模塊電路設計
云臺轉動電路
雙自由度云臺有4 個控制轉動方向的端口, 分別是水平左轉、水平右轉、上升、下降, 需要24 V 的交流電來驅動, 而語音識別結果的二進制序列經過解碼后由單片機AT89S52 的I/O 口輸出, 其端口電平是0 ~5 V 的直流。為了能使單片機根據語音識別結果驅動云臺轉動,在AT89S52 和云臺之間放置一個電流放大器件ULN2003 。ULN2003 是大電流、高耐壓達林頓陣列, 包括7 個達林頓管, 在5 V 的工作電壓下, 能夠與TTL 和CMOS 電路直接相連, 這樣就可以直接處理原來需要標準邏輯緩沖器來處理的數據。將控制云臺轉動方向的4 個端口D_Right 、D_Left 、D_Up 、D_Down 分別與繼電器K1、K2、K3、K4 相連, 單片機AT89S52 根據解碼后的語音識別結果控制繼電器的斷開和閉合, 從而控制云臺轉動的方向和角度。云臺轉動電路圖如圖所示。
TOP10 語音識別播放電路
語音識別播放電路主要由語音芯片LD3320、STC10L08XE 單片機及其他外圍電路構成。語音芯片LD3320 內部固化有完整的非特定人語音識別特征庫和高效的非特定人語音識別搜索引擎模塊, 不需要事先訓練和錄音。只需要單片機把候選識別語句的拼音串傳入芯片內部, 通過芯片內部的DSP 算法, 找出最佳識別結果。同時此芯片還支持MP3 播放功能, 此時需要外接Flash 芯片, 用來存儲播放的聲音素材等數據。STC10L08XE 單片機讀取串行存儲芯片的MP3 數據, 依次送入LD3320 芯片內部就可以從芯片的相應引腳輸出聲音。STC10L08XE 單片機與語音芯片LD3320 之間采用并行的通信方式, 故在硬件上需要使用8 根數據線和4 個控制信號將語音芯片與單片機并行連接。
最小系統電路
最小系統電路圖如下圖所示,在OSC0,OSC1 口接晶振以及諧振電容,在鎖相環接入相應電容電阻,在電源端和接地端接上0.1UF 去耦電容,提高考干擾能力。
SPCE061A 語音識別模塊硬件結構
在SPCE061A 主控芯片對語音信號進行A/D 轉換具有專門的轉換通道——聲音模-數轉換通道。并且SPCE061A 內部置有麥克風放大電路和自動增益控制部分。自動增益控制部分可以自動調節所收到的麥克風音量,這樣使得該系統不會受到發送命令的人所處位置的限制。 SPCE061A 內部的麥克風前置放大電路主要由輸入級、中間級、輸出級三部分組成,輸入級采用的是差分放大電路,它是麥克風前置放大電路的主要組成部分,差分放大電路作為輸入級有很大的優勢,能夠有效的抑制輸入端輸入的共模干擾,對于輸入的有效差分信號則不會產生任何干擾。本系統的語音識別信號輸入電路如下圖所示。 C23,C24 是作為退偶電容用,減少噪音信號對語音識別的干擾。
SPCE061A 的音頻輸出模塊硬件電路設計圖如下所示:
電源模塊電路設計分析
TOP11 RSC-4X系列語音識別集成應用電路
在本系統中SPCE061A 所需要用到的3.3V 電源,采用AMS1117 芯片產生。AMS1117 是一個正向低壓降穩壓器,AMS1117 有兩種:一種為固定輸出電壓,輸出的電壓值有:1.5V、1.8V、2.5V、2.85V、3.0V、3.3V;另一種為可調節輸出電壓。AMS1117 內部集成了過熱保護電路和過流保護電路。為了保護AMS1117 的穩定性,在輸出端要接一個至少22UF 的鉭電容由AMS1117 構成的3.3V 電壓產生電路圖。
由LM2576 構成的5V 電壓產生電路圖如下圖所示:
電機驅動模塊硬件電路設計
L298 是專用驅動集成電路,可以驅動感性負載,例如:大功率直流電機和步進電機等,可驅動46V,2A 以下的電機。其輸入端可以直接與單片機連接,并且可以實現電機的正轉、反轉、加速和減速等控制。L298 有兩個電源,分別為邏輯電源和動力電源,6V 為邏輯電源。12V 為動力電源。電路圖如下所示:
總的來說,計還是比較簡單的,對于語音識別技術更是有了全新的認識,完全掌握了SPCE061A的原理及其技術。還有,語音識別是一項很有應用前景的全新項目,可以應用于多種未來新新項目,應用范圍廣,可靠性高。是一個很有前途的創新項目!
RSC-4X系列語音識別集成應用電路設計
RSC-4x系列是新一代嵌入式語音識別處理器集成電路,它具有集成度高、外圍電路簡單、功耗低、不怕掉電、使用方便等特點。一個完整的語音識別系統僅由RSC-4x系列芯片及少量外部元器件(揚聲器、麥克風、音頻輸入/輸出電路、存儲器和電池或整流穩壓電源)等組成.R S C-4 x系列芯片適用7.0語音識別技術RSC-4x系列芯片通常采用48P/64P/100P-LQFP封裝。
工作原理:RSC-4x是一種交互式智能語音識別電路,通過執行內嵌的馬爾可夫鏈和神經網絡去處理語音識別。說話者需要在芯片的外部存儲器(如 sRAM、EEPROM、閃存等)存儲語音識別信息,識別過程中需要ROM去存儲要被識別的字.RSC-4x有如下幾個獨創的識別特性:
1、語音識別無須訓練。在一個活動單元內可識別16個字(單元存儲的字由內部ROM和外部存儲器限制)。
2、連續接收每一個特殊的字。由于這個功能,所以此產品可以用在一般的場合和對一些特殊的字時需要安靜的環境。
3、字定點測量允許芯片一次可連續接收達5個SI或10個SD,在該字定點方式下,無須保持安靜的環境.RSC-4x系列可在芯片的sRAM中存儲6個sD字或在外部存儲器中存入更多的字。
RSC-4x利用巧妙的頻域規則提供高質量語音合成,典型的數據率小于5k/s.語音合成需要片內或片外ROM去存儲所要合成的語音數據.RSC-4x 提供4種高質量音樂/語音合成手段.RSC-4x獨到之處還有可使用計算機網絡系統產生具有128種音色、47種真實樂器聲的高檔音樂 MIDI.。RSC-4x可以在不同的采樣比率下對聲音進行錄音和重播,采樣比取決于對語音時長和音質的要求,數據率在14k/s時,一般就可以獲得較高音質的效果.RSC-4x還可以消除靜差以提高聲音質量和減少存儲容量。
評論
查看更多