AI年代:與立法會合作 提供實時會議字幕
【明報專訊】立法會於7月16日正式推出與科大訊飛聯合打造的智慧謄錄系統「智識聽」人工智能(AI)實時字幕功能,公眾可以通過立法會網站的網上廣播等平台收看帶有實時字幕的立法會大會會議直播。這標誌茈萿k會公開透明化邁出關鍵一步。
「智識聽」深度適配立法會場景的實時字幕功能,運用了科大訊飛中英粵混讀引擎,結合聲紋識別和字幕與幀(Frame,即影片中由靜態圖片連續組成的最小視覺單位)畫面對齊壓製技術,實現會議直播中文字和視頻畫面的同軌顯示,公眾可通過實時字幕無障礙獲取政策資訊。
應付議員不同口音 準確率96%
從水土不服到深度賦能,「智識聽」深度學習2.5億字中英翻譯的平行文本、400小時的錄音與謄本及20萬組本港特色關鍵詞,口音、新地名、混語發言實時適配,即使面對議員特殊口音或複雜地名也能處理,據科大訊飛的公布,目前實時字幕的準確率96%,通過幕後同事的即時修正,準確率通過人機結合可達99%。
科大訊飛粵港澳大灣區港澳區域首席代表閻晴溪在專訪中表示,「智識聽」從年初準確率只有93%,系s通過持續技術優化,提升至目前的96%。
閻晴溪指出,科大訊飛支援「智識聽」的「訊飛星火大模型」,自2023年5月發布以來,至今仍是國內全民開放可下載大模型中唯一的國產算力訓練出來的大模型。
2025年以來,科大訊飛發布並持續升級業界首個基於全國產算力平台訓練的深度推理大模型「訊飛星火X1」,就在7月,「訊飛星火X1」進行了最新升級,整體效果對標OpenAI o3等國內外一流大模型最新版本效果,它的多語言能力已覆蓋超過130語種。
「智識聽」是基於科大訊飛旗下「訊飛聽見智能會議系統」(見視頻二)來做本地化開發而來的,該系統在內地除了獲中化集團、中國五礦及中國商飛等龍頭企業使用外,亦連續7年服務全國兩會各駐地會議記錄工作,累計1000多場小組會議。
翻譯機8語言互譯 專為粵語場景升級
科大訊飛的智能辦公本、錄音筆及翻譯機等面向消費者的「C端產品」同時亦進軍香港,將於本月底在本港正式發售,當中,翻譯機因應本港粵語場景做了升級,實現粵語和中英日等8種語言的互譯,進一步滿足港人對國際化交流的需求。