設計 任務書 論文 開題 答辯 說明書 格式 模板 外文 翻譯 范文 資料 作品 文獻 課程 實習 指導 調研 下載 網絡教育 計算機 網站 網頁 小程序 商城 購物 訂餐 電影 安卓 Android Html Html5 SSM SSH Python 爬蟲 大數據 管理系統 圖書 校園網 考試 選題 網絡安全 推薦系統 機械 模具 夾具 自動化 數控 車床 汽車 故障 診斷 電機 建模 機械手 去殼機 千斤頂 變速器 減速器 圖紙 電氣 變電站 電子 Stm32 單片機 物聯網 監控 密碼鎖 Plc 組態 控制 智能 Matlab 土木 建筑 結構 框架 教學樓 住宅樓 造價 施工 辦公樓 給水 排水 橋梁 剛構橋 水利 重力壩 水庫 采礦 環境 化工 固廢 工廠 視覺傳達 室內設計 產品設計 電子商務 物流 盈利 案例 分析 評估 報告 營銷 報銷 會計
                   首 頁 機械畢業設計 電子電氣畢業設計 計算機畢業設計 土木工程畢業設計 視覺傳達畢業設計 理工論文 文科論文 畢設資料 幫助中心 設計流程 
                  墊片
                  您現在所在的位置:首頁 >>計算機畢業設計 >> 文章內容
                                   
                  墊片
                     我們提供全套畢業設計和畢業論文服務,聯系點擊這里給我發消息   914298682   
                  基于Python的語音識別系統(孤立詞) 說明書+源碼
                  文章來源:www.freehotlive.com   發布者:學生畢業作品網站  

                  目錄

                  1 任務介紹 1

                  2 項目實現 1

                  2.1 預處理 2

                  2.2 特征提取 3

                  2.2.1 歸一化 3

                  2.2.2 預加重 3

                  2.2.3 分幀 3

                  2.3 加窗 4

                  2.3.1 端點檢測 6

                  2.3.2 快速傅里葉變換 8

                  2.3.3 梅爾頻率域特征 10

                  2.4 識別模型 12

                  2.4.2 數據加載 13

                  2.4.3 模型訓練 13

                  2.5 識別交互 14

                  2.5.1 前端界面 14

                  2.5.2 服務器端 15

                  3 總結 15

                  任務介紹

                  語音識別是通往真正的人工智能的不可缺少的技術。盡管能真正聽懂人類說話的智能機器任然在未來不可捉摸的迷  霧之中,但我們必須先解決如何識別出人類語音中包含的自然語言信息的問題。而數字信號處理技術將為這一任務  賦能。在本課程項目的任務之中,我們面對的是一個簡化的語音識別場景——即孤立詞識別。

                  我們針對 20 個關鍵詞,采集了所有參與課程的同學朗讀每個詞 20 遍的語音。我將以此為數據集來構建一個能正

                  確識別這 20 個關鍵詞的孤立詞識別系統。

                  項目實現

                  基于一學期跟隨老師學習到的關于信號處理與語音識別技術的知識,我額外查閱多方資料,最終呈現出了我的語音  識別系統與報告。

                  我實現的語音識別系統的亮點有以下幾個方面:

                  說話人無關的孤立詞識別是語音識別技術發展中一個里程碑。從現代的觀點來看,如果將語言信號視作時間 序列,那么孤立詞識別就是一個模式識別中的分類問題。模式識別問題的解決一般分為特征提取與模型構建 兩個部分。我們將這兩個部分分開處理,使得代碼的實現更加具有結構性和層次性。報告也將這兩部分的處 理分開敘述

                  我在整個系統的實現中,除了利用了數值處理函數包 numpy 和自動求導工具包 pytorch之外的所有核心代碼

                  都是單純使用 python 實現。即真正鍛煉了代碼實現能力,也加深了對語音識別技術的理解。在報告中我也強調了各個方法和過程的代碼實現,并將關鍵代碼添加到附錄之中以方便檢閱

                  特別地,我基于課堂上所學的蝶形變換方法,實現了以 2 為基的快速傅里葉變換,并運用到了頻域特征的分析之中。這讓我更加領略到該算法的優美

                  根據我自行實現的快速傅里葉變換,實現了梅爾頻率域的倒譜系數的計算,并根據通過梅爾濾波器之后得到 梅爾頻譜特征設計了基于卷積神經網絡的識別算法

                  我將計算出的頻譜特征視為圖片,因而可以使用近年來在大規模圖片分類任務上大放異彩的卷積神經網絡來 進行分類識別。我采用了 2014 年在 ImageNet 的比賽上獲勝的VGG Net 作為我們的識別模型,并使用了批歸一化和 Dropout 手段來避免過擬合,提高模型的泛化能力









                    全套畢業設計論文現成成品資料請咨詢點擊這里給我發消息914298682      返回首頁 如轉載請注明來源于www.freehotlive.com  

                                   

                  打印本頁 | 關閉窗口
                  本類最新文章
                  基于html醫療前端界面設計畢業 基于Android的點餐系統設計 基于vuex的物業管理系統APP
                  基于SSM的餐飲管理系統的設計與 基于Python和C++的網絡圖 基于ASP.NET的網絡購物系統
                  | 關于我們 | 友情鏈接 | 畢業設計招聘 |

                  Email:biyeshejiba@163.com 在線QQ: 點擊這里給我發消息  914298682 學生畢業作品網站  
                  本站畢業設計畢業論文資料均屬原創者所有,僅供學習交流之用,請勿轉載并做其他非法用途.如有侵犯您的版權有損您的利益,請聯系我們會立即改正或刪除有關內容!
                  蜀ICP備10201305號-4

                  bestialityvideo另类最新_成年片黄网站色大全网站_日日摸夜夜添夜夜添破_一个顶流的诞生_25岁的女高中生_heyzo中文字幕无码