自從2019以來,科大訊飛發表了全世界第一支語音轉文字錄音筆,運用了自己世界最強的中文語音辨識技術,將會議記錄、課程筆記或採訪逐字稿…等,各種需要錄音檔轉文字的場景都變一鍵轉成文字,更發展出獨立不須網路的「離線錄音轉文字」的技術。以下筆者將帶讀者瀏覽語音轉文字的各種細節,希望可以幫您找到一隻最適合您的錄音筆。

錄音筆轉寫方式

1. 轉寫?翻譯?傻傻分不清楚!

 

「轉寫」是指同一語言進行語音和文字的轉換,例如中文語音轉成中文逐字稿、英文語音轉成英文逐字稿,也常常以「語音轉文字」、「錄音轉文字」來表達。

「翻譯」是指將A語言轉換成B語言,例如將英文翻譯為中文。

若您的需求是「翻譯」為主,請參考我適合哪一台科大訊飛《翻譯機》?,有更詳細的說明。

 

2. 在線轉寫、離線轉寫有什麼差別?

 

科大訊飛錄音筆有2種語音轉文字的方式:在線轉寫、離線轉寫

「在線轉寫」:是將錄音資料透過網路上傳至廠商的服務器,經過運算再將文字檔案下載到錄音筆端。

「離線轉寫」:不需經過網路連線,錄音完成後,利用錄音筆內建的資料庫進行辨識,即可將錄音轉成文字檔。

兩者的差異是,在線轉寫的準確率較高,但因需要將音檔上傳,需要等待一點時間才能取得文字檔;離線轉寫的優點是資料「只保存」在錄音筆,準確率較差,但少了一道網路上傳的手續,轉寫速度也比在線轉寫快許多。

下方影片以SR702實測演示在線轉寫及離線轉寫的差異:
 
 

錄音轉文字支援語言

聽什麼文寫什麼文:除了中文語音轉文字,外語的語種支援英文、日文、韓文、西文、越南文、俄文、法文、義大利文等外語語音轉文字。

此外,科大訊飛的轉寫引擎更特別訓練了中英混合的場景,所以在會議記錄或是上課筆記中,中文英文夾雜的狀況,依然有高達98%的正確率。

比較可惜的是目前僅支援到中文和英文混合,還不支援其他外語和中文的混合內容。也尚未支援台語語音轉寫台語逐字稿。

 

錄音筆使用場景

1. 採訪逐字稿/線上課程

 

採訪和線上課程(電腦旁)常為近距離收音,若背景聲音不吵雜,由於科大訊飛錄音筆每一個型號都有具備降噪全向的麥克風,在聲音清晰狀況下,語音轉文字逐字稿品質最高正確率可達98%。

 

2. 會議紀錄

 

會議錄音通常為做紀錄或方便整理會議記錄使用,通常會議的人聲由四面八方而來,360度環繞為主,由於聲音會依據方向性衰減,所以會議錄音筆以麥克風具備「全指向性+降噪」為佳。

 

另外科大訊飛錄音筆的在線轉寫有支援「區分人聲」,最多可分辨9人,在語音轉文字文稿中,以分段落方式區分,並會標註「講話人1」、「講話人2」,會後非常好整理。

 

「區分人聲」有更進階的功能是「建立聲紋」,可以在錄音筆內建立講話人的聲音特徵並設置暱稱,設置好之後,開啟區分講話人功能,錄音時會辨認出設置好的聲紋,轉寫逐字稿會顯示聲紋暱稱,對於會後整理及查詢,非常實用!

 

3. 演講|上課

 

由於講者聲源是單方向,建議最好收音方式為「指向式」的收音,盡可能避開收到不屬於聲源方的四周雜音,科大訊飛錄音筆內的「演講模式」,即是針對此這種情況設定的。

 

4. 即時翻譯(同聲傳譯)

 

錄音筆內建的「同聲傳譯」兼具錄音筆和翻譯機的功能,支援中文對英文、日文、韓文、俄文、法文、西文和越南文翻譯。

 

「同聲傳譯」簡單來說,就是一邊錄音同時一邊翻譯,適用於外語的研討會、論壇(使用者是聽眾),由於科大訊飛的機器反應速度快、翻譯準確率較高(全世界最強的中文辨識引擎),在國際會議、演講和課程均能解決翻譯問題。

錄音的同時進行語音轉文字,螢幕上半部可看到原文即時轉寫,下半部可看到即時翻譯內容,錄音保存後,可導出音檔、原文與譯文的逐字稿文檔。

 

錄音時,將錄音筆連接藍芽耳機,即可聽到譯文播報,例如英翻中時,耳機可聽到中文播報,不用時刻盯著螢幕看文字,雖然播報仍會有5-10秒的延遲,不過準確度還是很高的。

 

錄音筆在有網路連線的情況下,「同聲傳譯」可以做到即時翻譯,若沒有網路連線,仍可以錄音,待錄音保存後,將錄音筆連接網路,即可轉寫出原文及譯文的逐字稿。

 

對於「同聲傳譯」功能有興趣的讀者,可參考實測影片的示範語音轉文字錄音筆大評比

 

5. 需要翻譯的外語課程或會議(線上)

 

如上一點提到的,錄音筆的「同聲傳譯」功能可用在現場外語課程或會議的翻譯,如果是針對線上課程或視訊會議,又要讓參與會議者都能看到翻譯內容,建議參考科大訊飛翻譯機的「同聲字幕」功能。

 

外語視訊會議不求人!「同聲字幕」將線上會議內容一鍵變成逐字稿和翻譯稿一文,有針對「同聲字幕」功能更詳盡的解說。

 

錄音筆OCR拍照辨識

OCR拍照辨識:拍照後即將照片中的文字轉成電子檔。舉例來說:拍照書本上的內容,即會轉成文字檔,可進一步在電腦內編輯。

 

拍照辨識功能目前僅支援中文和英文。

 

OCR功能支援辨識包含文字的圖片,例如:紙本文件、會議或課堂上的PPT投影片。此外,科大訊飛的OCR功能還有表格辨識的能力,可辨識紙本表格文字、PPT投影片內包含表格的頁面。

 

 

錄音筆使用情境對應功能

以上完整地介紹科大訊飛《語音轉文字錄音筆》具備的功能以及應用場景。

 

強烈建議讀者在選擇錄音筆之前,先試想要錄音的情境,再根據下圖來判斷需要哪些錄音筆功能,接著再根據錄音筆容量、收音距離等規格,選擇適合的錄音筆型號。

 

如果還是不知道應該選哪款,那就加入官網客服LINE@吧,直接詢問客服最快!

科大訊飛語音轉文字錄音筆型號介紹

科大訊飛錄音筆SR302 Pro

 科大訊飛錄音筆SR302 Pro
離線轉寫支援,正確率高達95%
在線轉寫不支援
邊錄邊譯不支援
收音麥克風2顆指向麥克風,4顆全向降噪麥克風
收音距離收音可高達10公尺。
錄音筆模式智慧錄音、會議錄音、演講錄音、採訪錄音
語音轉文字語言中、英、日、韓、俄、粵語
區分人聲不支援
OCR拍照辨識不支援
容量32G大容量(約190小時)
產品特點性價比高、安全性高,資料轉寫不需透過任何服務器
商品詳情SR302 Pro

 

科大訊飛錄音筆SR502

 科大訊飛錄音筆SR502
在線轉寫支援,正確率高達98%
離線轉寫支援,正確率高達95%
邊錄邊譯中文對英文、日文、韓文、俄文、法文、西文、越南文
收音麥克風2顆指向麥克風,6顆全向降噪麥克風
收音距離收音可高達12-15公尺。
錄音筆模式通用、採訪、會議、演講、備忘、音樂
語音轉文字語言中、英、日、韓、西、法、俄、越南、義大利
區分人聲支援,最多到9人
OCR拍照辨識支援
容量32G大容量(約190小時)
產品特點性價比高、科大訊飛錄音筆三大主要功能均滿足
商品詳情SR502

 

科大訊飛錄音筆702

 科大訊飛錄音筆SR702
在線轉寫支援,正確率高達98%
離線轉寫支援,正確率高達95%
邊錄邊譯中文對英文、日文、韓文、俄文、法文、西文和越南文
收音麥克風2顆指向麥克風,6顆全向降噪麥克風
收音距離收音可高達15公尺。
錄音筆模式採訪、會議、演講、通用、備忘、音樂
語音轉文字語言中、英、日、韓、西、法、俄、越南、義大利
區分人聲支援,最多到9人
OCR拍照辨識支援
容量32G大容量(約190小時)
影片字幕支援短影片(5min)
商品詳情SR702

 

科大訊飛錄音筆701

 科大訊飛錄音筆SR701
收音麥克風2顆指向麥克風,6顆全向降噪麥克風
收音距離收音可高達15公尺。
容量32G大容量
在線轉寫支援,正確率高達98%
離線轉寫不支援
語音轉文字語言中、英、日、韓、西、法、俄和越南
邊錄邊譯中文對英文、日文、韓文、俄文、法文、西文和越南文
OCR辨識不支援
錄音筆模式採訪、會議、演講、通用、備忘、音樂
區分人聲支援,最多到9人
影片字幕不支援短影片
產品特點科大訊飛錄音筆SR701
 

 

科大訊飛錄音筆702星火版

 科大訊飛錄音筆SR702星火版
在線轉寫支援,正確率高達98%
離線轉寫支援,正確率高達95%
邊錄邊譯中文對英文、日語、韓語、俄語、法語、西班牙語、越南語、義大利語
收音麥克風2顆指向麥克風,6顆全向降噪麥克風
收音距離收音可高達15公尺。
錄音筆模式採訪、會議、演講、通用、備忘、音樂
語音轉文字語言中、英、中英混說、日、韓、西、法、德、俄、越南、義大利
區分人聲支援,最多到9人
OCR拍照辨識支援
容量64G大容量
影片字幕支援短影片(5min)
產品特點科大訊飛錄音筆商務旗艦機
商品詳情SR702星火版

 

錄音筆缺點

雖然科大訊飛錄音筆的語音轉文字實力堅強,美中不足的是,仍有以下幾個缺點:

 

1. 簡體中文

 

除了SR302 Pro以外,其他型號的語音轉文字錄音筆都是簡體中文的操作介面、逐字稿,不過這個問題可以透過word內建的「繁簡轉換」功能來解決。

 

想要省略繁簡轉換的步驟的話,建議直接選擇科大訊飛SR320 Pro錄音筆,作業系統和逐字稿都是繁體中文,但是SR302 Pro的收音距離較短,選擇時要考慮到實際使用場景哦。

 

2. 體積較大

 

和一般市售小台錄音筆相比,科大訊飛錄音筆的體積確實是比較大,不過為了要達到最好的收音與降噪功能,需要使用足夠強大的硬體設備,那就不得不犧牲體積了。

 

上圖由左而右依序是:SR302 Pro, SR502, SR702

總結

下表是集結各個型號的特點而製成的,各位讀者可以更清楚的了解各個型號差異。

商品Q&A裡,我們也集結了大多數使用者的常見問題,希望能解答您的疑問,若還有更多疑問,歡迎點選的右下角的@Line客服,由客服協助您。

 SR302 ProSR502星火版SR702SR702星火版
螢幕2.0吋3.5吋3.5吋3.5吋
麥克風2定向+4降噪2定向+6降噪2定向+6降噪2定向+6降噪
硬體儲存空間32G32G32G64G
(建議)收音距離10公尺15公尺15公尺15公尺
在線轉寫不支援✔️✔️✔️
離線轉寫✔️✔️✔️✔️
邊錄邊譯(即時翻譯)不支援✔️✔️✔️
翻譯語言不支援中文←→英、日、韓、俄、法、西、越、德、義、藏語、維吾爾語中文←→英、日、韓、俄、法、西、越、德、義、藏語、維吾爾語中文←→英、日、韓、俄、法、西、越、德、義、藏語、維吾爾語
OCR拍照識別不支援✔️✔️✔️
專業領域轉寫✔️✔️✔️✔️
區分講話人不支援✔️✔️✔️
星火大模型功能不支援✔️全文紀要、語篇規整、講話人總結、關鍵字不支援✔️全文紀要、語篇規整、講話人總結、關鍵字
連接電腦輸出文檔✔️✔️✔️✔️
透過雲端平台取得文檔不支援✔️不支援✔️
商品詳情SR302 ProSR502星火版SR702SR702星火版

 

📔延伸閱讀:語音轉文字錄音筆大評比

📔延伸閱讀:2023語音轉文字工具推薦與評比