本文是一篇計算機碩士論文,筆者認為目前主流的漢盲轉換大多采用基于神經機器翻譯模型的端到端漢盲轉換方法,該方法使用句子級語料庫進行訓練,推理時一步完成句子級別轉換,相對于傳統方法轉換流程更加簡單,準確率高。
第一章緒論
1.1研究背景與研究意義
信息無障礙[1]是指通過信息技術的應用,使每個人都能夠無障礙地獲得信息資源,其主要目的是通過科技手段,消除一些生理機能衰退或缺失的群體在信息獲取和接受方面的障礙。據世界衛生組織的數據,全世界約有2.85億視力障礙患者,其中3900萬人完全失失明[2]。我國視障者群體龐大,應引起重視,目前我國盲人數量約為1700萬,這些視力障礙者中大約有824萬人完全失明1。隨著社會文明不斷進步,促進盲人事業發展已經成為國際社會的廣泛共識。
雖然我國在助盲建設方面已取得顯著成就[3-5],但仍存在許多不足。對視障人士而言,盲文出版物是獲取外界信息和知識的關鍵渠道。然而,當前中國盲文出版資源極度匱乏[6],且內容相對陳舊。目前全國僅有中國盲文出版社一家專業出版機構,遠無法滿足視障群體的閱讀需求。據統計,中國盲文目前每年出版盲文書刊1000多種,全國平均1.29萬盲人一種,與明眼人人均享有40種出版物相比,盲文出版物嚴重匱乏。因此,解決盲文出版物稀缺問題,滿足視障群體的閱讀需求已成為亟待解決的社會課題。此外,我國盲文導向系統建設滯后,導致視障人士出行困難;銀行、政府等公共服務機構缺乏適配服務;商品與藥品包裝缺少盲文標識,致使視障者日常生活諸多不便。當前我國盲人教育現狀令人擔憂。雖然經過多年發展并取得一定成就,盲人高等教育逐漸獲得國家政策支持,接受高等教育的盲人數量也呈增長趨勢,但與普通高等教育相比,盲人高等教育仍然嚴重滯后。根據中國殘疾人聯合會的統計數據[7],接受高等教育的盲人僅占在校盲人總數的1%。此外,全國專門招收盲人的高等院校數量極為有限[8],僅有長春大學、北京聯合大學、濱州醫學院等少數幾所高校面向全國招收盲生,且培養目標局限于專科和本科層次,缺乏研究生層次教育,無法滿足盲人獲取更高學歷的需求。
1.2國內外研究現狀
1.2.1國外研究現狀
(1)基于規則的盲文轉換方法
在盲文轉換領域,國外的研究早期主要集中在基于規則的轉換方法上。2008年,AMS Al-Salman等人[12]開發了一個雙向雙語的阿拉伯語盲文轉換/編輯系統,該系統通過配置規則文件可擴展至其他語言,為視障人士和明眼人之間的交流提供了便利。1997年,Blenkhorn[13]提出了一種基于規則的英文到盲文轉換機制,該系統使用字典實現字符到盲文的映射,為早期盲文自動轉換奠定了基礎。2008年,Al-Salman[12]開發了一種成本較低的基于規則的阿拉伯語到盲文的轉換解決方案,并支持盲文到文本的逆向轉換。2014年,Yamaguchi等人[14]開發了一種專門針對STEM(科學、技術、工程和數學)領域的盲文轉換系統,解決了技術符號在盲文中準確表示的難題,為視障人士參與科學研究提供了重要工具。2016年,Wang等人[15]開發了基于詞分割的中文到盲文轉換系統,通過語言特定的規則處理中文特有的語言結構問題。2013年S Padmavathi等人[16]提出了一種掃描盲文文檔的盲文轉換方法,該方法通過預處理、分割和點提取將盲文轉換為數字序列,可映射到英語、印地語和泰米爾語等多種語言,同時支持通過鍵盤數字鍵盤輸入盲文字符,提高了系統的實用性。2013年T Oda等人[17]針對醫療領域盲文轉換程序eBraille-M的局限性,開發了基于機器學習的分詞模型,通過將兩個具有不同特征集的統計學習模型與規則分類器相結合,提升了日語醫療文本的分詞效果。這一階段的研究主要依靠語言學規則和字典映射實現盲文轉換,雖然在特定語境下效果良好,但面對復雜語言現象時靈活性不足。
第二章相關理論與技術
2.1引言
本章詳細介紹了本文研究所涉及的相關理論與技術。首先,對盲文進行了概述,重點介紹了中國盲文的發展歷程及其特征。其次,本章詳細分析了漢盲轉換的兩種主要方法——多步式漢盲轉換方法與端到端漢盲轉換方法,對比闡釋了各自的工作流程、技術特點及優缺點。最后,本章深入探討了本研究采用的深度學習核心技術,包括知識蒸餾、預訓練技術以及非自回歸翻譯方法,為后續研究奠定了理論基礎。

2.2盲文概述
2.2.1盲文簡介
盲文是專門為視障者設計的一種文字系統,由法國人路易·布萊葉于1824年創造,盲人通過觸摸來識別盲文,盲文是他們閱讀與寫作的載體,對盲人有著不可或缺的作用。
一個盲點由三行兩列的六個凸點組成,左邊一列從上往下分別是1、2、3點,右邊一列從上往下分別是4、5、6點,根據排列組合,每個位置的凸起與否共有64種情況,所以共有64種盲點。圖2-1為246點的盲點表示。
盲文ASCII碼是計算機存儲盲文信息的最基本的方式,從ASCII編碼字符集中抽取出64個,分別代表64種盲文字符。在漢盲轉換過程中,通常采用盲文ASCII碼作為盲文的表示與存儲方式,之后根據實際需求將盲文ASCII碼轉換為盲點形式。除此之外,盲文ASCII碼被廣泛應用于盲文點顯器和盲文刻印機,作為其標準輸入格式。
2.2.2中國盲文
中國盲文系統[36]以布萊爾盲文編碼為原則,采用北京語音作為標準、以普通話為基礎、按照詞為基本單位、遵循盲文分詞連寫規則進行設計。中國盲文主要有三種形式,包括現行盲文、雙拼盲文以及國家通用盲文。使用聲母、韻母以及聲調來體現一個完備音節。例如“不”的拼音為“bu4”,聲母“b”對應的盲點為“......”,韻母“u”對應的盲點為:“......”,聲調去聲對應的盲點為:“......”,所以漢字“不”對應的盲文為:“..................”。
1953年,教育部公布了《新盲字方案》(亦稱“現行盲文”),這是我國首個規范統一的盲文方案,至今仍在使用。現行盲文的設計簡單易學,對廣大視障群體的學習和閱讀發揮了重要作用。該方案規定[37],省略“zhi、chi、shi、ri、zi、ci、si”中的韻母“i”,允許“zh、ch、sh、r、c、s”這七個聲母單獨成音節,該簡寫策略極大提高了書寫與閱讀效率。此外,現行盲文還規定[38]“僅在需要時標調”,即只有在某些字的讀音存在歧義時才會標注聲調。統計數據顯示,在各類盲文出版物中,標注聲調的音節僅占5%左右,同一詞匯是否進行標調取決于個人習慣,因此可能導致不同的人使用不同盲文來表示同一個詞。均未標調的情況下可能會產生更大的歧義,例如,現行盲文“..................”對應的拼音為“jiaoshi”,可被理解為“教師”或“教室”,二者均成立。因此,同音字的混淆問題對盲人學習和使用現行盲文構成了挑戰。盲人在摸讀過程中需要依賴上下文來推測讀音及詞義,這不僅對盲人的閱讀速度產生影響,同時對盲人理解詞義造成了困難。
第三章基于多任務的端到端漢盲轉換方法研究............................23
3.1引言.........................23
3.2 TPL方法............................24
第四章基于預訓練的漢盲轉換方法...........................39
4.1引言...............................39
4.2預訓練數據集的設計與構建......................39
第五章基于非自回歸方法的漢盲轉換模型..................52
5.1引言.....................................52
5.2序列擴充方法.........................52
第六章開放式漢盲轉換系統優化與實現
6.1中國盲文數字平臺簡介
中國盲文數字平臺1是一個開放式的盲文數字化資源平臺,是我國首個盲文數字平臺,該平臺面向中國1700萬視障群體,由中國殘疾人聯合會、中國盲人協會共同委托蘭州大學信息無障礙研究中心研發,已在全國推廣應用。中國盲文數字平臺的首頁如圖6-1所示,該平臺主要功能有兩大塊,一個是轉換功能,包括將漢語、數學公式、化學公式、物理電路圖和樂譜等轉換為盲文,以及將盲文轉換為漢語的功能。另一個功能是資源服務管理,盲文數字化資源庫主要包含各種中文書籍、資料和音樂樂譜的盲文版本。用戶可以在線瀏覽、朗讀、搜索或下載這些盲文資源,并通過盲文打印機或點顯器進行輸出,從而為盲人提供豐富的閱讀材料,支持他們的學習與閱讀需求。

第七章總結與展望
7.1本文總結
目前我國盲人教育資源匱乏,盲人導向系統不完善,漢盲轉換技術仍有較大提升空間。針對這些問題,本文對漢盲轉換方法進行了深入研究。現有的漢盲轉換方法主要分為兩類:傳統多步式轉換方法和基于深度學習的端到端轉換方法。本文針對漢盲轉換任務中存在的問題以及現有研究方法的不足,提出了相應的解決方案。主要工作總結如下:
(1)本文針對傳統漢盲轉換方法中每個步驟無法充分利用上下文,多個步驟錯誤累加導致的轉換準確率低以及端到端漢盲轉換方法無法充分解耦兩個子任務的問題,提出了一種基于多任務學習的漢盲轉換方法,將漢盲轉換任務分解為盲點生成以及盲文分詞兩個子任務,不改變端到端轉換模型推理方式的同時,能夠分別兼顧到兩個子任務之間的差異與聯系,從而整體提高了漢盲轉換準確率。
(2)針對目前漢盲對照語料庫匱乏,導致模型準確率受限,泛化能力不足的問題。本文基于預訓練技術,根據盲文的特性設計并構建了三種帶標簽預訓練數據集以及一種無標簽與訓練數據集,使模型在預訓練結構學習到分詞與拼音的相關先驗知識,得到較好的初始化權重,隨后在少量漢盲對照數據集上進行微調,提高了模型在少量數據集情況下的轉換準確率。
(3)針對自回歸推理模型推理速度慢的問題,本文提出了一種非自回歸漢盲轉換方法。該方法采用編碼器框架,結合CTC損失實現非自回歸轉換,同時設計了兩種序列擴充方法以滿足CTC損失訓練條件。該方法實現了推理速度的大幅提高,為后續模型部署奠定了有力基礎。
參考文獻(略)
相關文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.