漢語人機語言通信基礎

漢語人機語言通信基礎
定價:1176
NT $ 1,023
  • 作者:張家(馬錄)
  • 出版社:上海科學技術出版社
  • 出版日期:2010-04-01
  • 語言:簡體中文
  • ISBN10:7532397106
  • ISBN13:9787532397105
  • 裝訂:787頁 / 24 x 16 cm / 普通級 / 初版
 

內容簡介

本書首先系統地闡述了言語科學和言語工程賴以建立的電學、語音學和聲學的基礎理論與實用知識,繼而介紹了語音產生的聲學理論和語音分析的技術與方法,進一步給出有關漢語的語音分析結果和部分原始數據,還對言語可懂度試驗和言語可懂度理論,以及言語質量評價做了深入的討論。最後,綜述構建人機語音通信的言語輸出、言語輸入和對話系統。讀者通過本書可以集中方便地獲取人機語音通信這個新興多學科交叉領域的基礎知識和有關漢語語音特征的研究結果。

本書可作為言語科學與技術、語音信息處理和電話通信等專業的研究生或大學高年級學生的教材或參考書,也可供聽力學和嗓音醫學界的從業人員閱讀參考。


張家(馬錄) 1955年畢業於北方交通大學電信系。1956年考取中國科學院副博士研究生,師從馬大猷教授學習電聲學專業。20世紀80年代和90年代應邀先後在瑞典皇家理工學院、隆德大學、英國倫敦大學學院和德國夫朗和費學會勞動經濟與組織研究所進行合作研究,是新中國從事語言聲學研究工作時間最長的老一代科研工作者之一。曾任中國科學院聲學研究所學術委員會副主任、語言聲學研究室主任,北京大學兼職教授,中國聲學學會常務理事及語言、聽覺和音樂聲學分會主任委員.國際言語數據庫言語輸入/輸出系統評價協調委員會成員,《應用聲學》副主編,日本電子情報通信學會(IEICE)《信息與系統》專刊(Transactions on Information and Systems)顧問。曾獲國家自然科學三等獎,國家發明二等獎,中國科學院自然科學一、二等獎,軍隊科技進步二等獎。發表學術論文100余篇。
 

目錄

《科學前沿進展》序
序一
序二
前言
第0章 緒論
§0.1 初創時期
§0.2 機械模擬時期
§0.3 波形原理時期
§0.4 參數提取時期
§0.5 信息處理時期
參考文獻
第1章 電學基礎
第2章 語音學基礎
第3章 聲學基礎
第4章 語音產生的聲學特性
第5章 語音分析
第6章 漢語語音分析
第7章 言語可懂度與語音質量評定
第8章 言語輸出
第9章 言語輸入
第10章 口語對話系統
索引
後記
 

1936年,我大學畢業,開始作研究生,范圍是電聲學。我在大學沒有上過聲學課,只是在薩本棟先生的大學物理課上,聽他講過中國棉衣的吸聲特性,所以對聲學的內容和發展一無所知。於是,就按導師朱物華先生和任之恭先生的指導,去檢索文獻。那時,現代聲學還很幼稚,國際上唯一有組織的美國聲學學會只有七年歷史。好在當時北大物理系的藏書非常豐富,美國聲學學會會刊和其他可檢索的期刊、雜志如科學索引、哲學雜志等都有收藏,而且是開架展覽。所以,我很快地就瀏覽了所有會刊論文和其他有關聲學的摘要,並且做了筆記。在此基礎上,寫出了「聲學的發展和展望」的綜述報告,概括地論述了當時的聲學水平和發展趨向。並且,提出了兩個值得注意的方向:一個是「聲定位器」,利用雙耳定位原理通過聲音定出來襲飛機的方位,這是准備反抗日本侵略所需,不久發展了雷達,聲學定位就無用了;另一個方向是「語言聲的頻譜分析」,當時電話上講話不大清楚,很費勁,頻譜分析的目的是找出改進電話的方法,這對我們也是重要問題。

導師朱物華先生的研究工作是電信網絡的過渡現象,他有一具陰極射線示波器(只有管子,沒有掃描線路)和一架高速照相機可以借給我用。我又向中國文學系語言學家羅常培教授借來一台留聲機,買來留聲機上用的電磁拾聲器。最後,自己找來零件做了一台電阻耦合放大器。這樣,攢成了中國第一套聲波波形記錄設備,這套設備也成了一個小段語言的波形記錄系統。它讀下波形就可以進行傅里葉分析了,這是中國的第一台電子式語言分析系統。

過去,我國研究語音主要靠研究人員的聽力,只有劉復(半農)先生發明的聲調推斷尺,在煙熏紙上划出波形,測出波長,推出頻率。我利用他的原理,用波形記錄器記錄下大量小段語言波形,在每一個波上讀出幾十個點上的幅值,用算盤算出24個傅里葉分量,得到大量成果。在計算中,每一個點上的幅值要乘上一個相當的常數,但計算了一些以後,我發現第一個點上乘的常數和同一個波最後的一點要乘的常數相同。這樣就可以先把兩點上的幅值相加,以後再乘上那個常數,兩次相乘再相加就變成了一次相加和一次相乘,減少了計算。第二個點也相似,第三個點也相似,等等。24個點就可變成12個點,12個點還可變成6個點,如此下去就大大減少了計算量。現在想起來,這就是快速傅里葉分析的原理。當時還沒有計算機,沒有想到這里,只是思想上的收獲。不久,七七事變發生,北京被占領,學校也進了日本兵,所有計算結果連同草稿都失掉了,也只有思想上的收獲。這是我最早的經歷。

後來1940年學習結束了,回國路上去訪問趙元任先生,可惜人很多沒有來得及細談。經過紐約正好舉行世界博覽會,貝爾實驗室在會上有語聲合成器(Voder)的表演。一位女秘書,前面有像是一台英文打字機的機器,下面還有個踏板,女秘書用兩手操縱機器上幾個按鍵,腳踏踏板,就發出人講話的聲音。一個人提個問題,人們就聽到「Oh,yes」的回答,活像女秘書親自講話,很吸引人。這是語言合成的開始,給我深刻印象。經過芝加哥,去工廠參觀「sound mirror」,這實際是鋼絲錄音機,在機器前面說句話,一會兒機器就說回來。這也是頗有前途的設備,雖然當時質量還不好。後來,到西岸去看了老師努特森,就乘船回國了。

到昆明除了在西南聯大教書外,也到當地工廠參觀,如無線電廠、有線電研究所、機械廠、光學廠等,都沒有需要研究的課題,只有有線電研究所還不大了解電話機的原理,我就給他們講了電聲學,還寫了講義。我在空閑時間做了漢語按聲、韻、調的統計,受到文科研究所的重視。

1956年到電子所,後來分開到聲學所恢復聲學研究工作才又談到語音通信問題。1958年,國際上流行在電子線路上識別幾個字的實驗,我們認為可以以此為開端,進行語聲識別工作。張家碌、李炳光等同志很快制好設備,能識別十個元音。讀一個「阿」字,屏幕上就打出a,讀一個「一」字,屏幕上就打出i。但是這個系統很難發展,識別一百個字就要一百個共振線路;識別一千個字,就要一千個共振線路,不現實。張家碌同志就轉而從語音通信的基本理論、規律出發進行探討,研究涉及語音學、聲學基本問題,語聲產生的基本理論,語聲分析和處理技術以及有關數據,特別是漢語普通話的特殊問題,等等。內容非常豐富,現在寫出來,幾乎成了語音通信的百科全書,是語音通信工作的最好參考書。

語言合成在20世紀30年代就比較成熟,但不太自然,直到現在還不令人完全滿意。語言識別20世紀60和80年代幾次讓人高興,直到最後Via Voice讓人認為最了不起,後來還是冷了下來。要想什麽地方都用,還是不成。語音通信如何保密,現在辦法還不多。語音通信的研究工作還有長路要走。
網路書店 類別 折扣 價格
  1. 新書
    87
    $1023