7月初,在2023世界人工智能大會現場,蜜度重磅發布了蜜度文修大語言模型。
作為國內首個專攻智能校對場景的垂直領域大語言模型,蜜度文修不僅凝聚了蜜度在智能校對領域多年的經驗,更是蜜度在大模型時代以專業智能化服務賦能千行百業的方式。目前,蜜度文修已經成功在AI智能校對產品——蜜度校對通中落地,運用大語言模型能力精準解決辦公領域的痛點。
90秒校對20萬字 助力中文內容校對提質增效
在蜜度文修正式發布后,搭載大模型的校對通將原有能力進行了全線升級:在保障響應速度的基礎上,從文字標點差錯校對、知識性差錯校對與內容導向風險識別的三大類型中,整合化地提供27類細分方向的審校服務。
以出版行業的應用為例,一部20萬字的書稿,用傳統校對方式初審需要數天,而蜜度校對通僅用90秒就可以完成覆蓋錯詞病句、常識錯誤與不規范表述等層面的審核與校對,并給出修正與潤色建議。
蜜度文修為新聞出版、政務公文等專業領域帶來工作模式升級迭代。作為專為中文校對任務而生的大語言模型,蜜度文修基于蜜度多年深耕智能校對領域的技術沉淀與洞察積累,通過運用高質量數據學習多種特色子任務,模型能力在產品中的落地,使得蜜度校對通在中文校對和潤色能力的智能化程度上完成了大幅躍升。同時,蜜度校對通能夠執行針對大部分格式圖片與視頻內容的文字校對任務,不僅輔助專業用戶提高校對質量、提升校對速度、降低差錯率,也能夠更好地讓大模型能力深度賦能各行各業辦公場景,為新時代多模態內容的高質量發展注智賦能。
垂直領域大語言模型的日趨成熟,有效助力AI應用的發展。除了在產品研發中全面引入大語言模型的優勢,完成創新垂直應用深度與廣度的構筑之外,蜜度也借助大模型的能力,實現對現有指標的突破。在中文拼寫勘誤、語法糾正任務上,蜜度文修均實現了各類校對項目F1值(模型精確率與召回率的調和平均數,用以闡述模型完成指定任務的質量)的全面SOTA(state-of-the-art,指模型在指定任務中的表現為當前業界最優),相較于通用大模型ChatGPT的校對能力,約有20% ~30%的效果提升。與此同時,蜜度文修在校對速度、細微語義差異辨析、基于語義理解與推理的句式雜糅修正、文稿潤色能力等細分維度也都有著優異表現。
“蜜度校對通”對內容進行校對
“蜜度校對通”對內容進行潤色
專注“校勘修文” 蜜度文修以落地產品實現傳承與創新
蜜度文修的名字,在一定程度上致敬了宋代雕版印刷技術的高速發展為校勘學帶來的盛況。兩宋期間,任一過往古籍在付梓前,均經多次校勘修文。宋時有專為校讎史書而設的館閣校勘一職,文人唱和中也有“細祓丹鉛勘文字”的詩句。據史料記載,《后漢志》雖僅三十卷,在北宋的一次校勘中參加者至少有九人,并分校勘與詳校兩組,總耗時超過一年。而文本體量更大的《漢書》,則在四十年中至少歷經了三次復校,僅最后一次校出的刊誤文字結集就多達三十余卷,足見宋代校對工作的細致與重要。
蜜度文修將大數據與大模型的優勢充分疊加,并在校對通產品中實現應用,以AI能力創新應用的方式,為新時代語言文字工作高質量發展注智賦能。蜜度文修大語言模型不僅針對中文常見易混淆詞語進行增強學習訓練,辨析詞語的細微語義差異,實現對內容的智能校對,而且還能進行更全面的語義理解與作者意圖推斷,在尊重稿件原意的前提下,完成對句式雜糅、邏輯錯亂等問題的修正。
與此同時,大模型在知識圖譜上的厚積,也讓蜜度文修擁有了由知識驅動的常識校對能力,并通過專用校對知識圖譜,讓字符串獲得關聯語義,在校對與潤色任務中,實現符合AI時代進程的深度智能化。針對特定行業的垂直領域專屬需求,蜜度文修充分發揮大模型的快速訓練優勢,通過集成學習技術,快速部署專業領域內的特有校對能力,為不同領域企事業單位搭建專屬校對大模型。
浩茫蒼穹間,疾馳攬彗星。我們所見證著的時代,AI給多個領域帶來了變革,用AI能力精準解決辦公領域痛點,通過提供全流程切入的落地解決方案,建構語言智能的流暢范式,是蜜度讓千行百業受益于AI浪潮的方式之一。
作為深耕行業的語言智能科技企業,蜜度將持續緊跟時代進程的前沿技術,為各個行業提供用以提升效率的能量,以智能的力量共創未來。
關注微信公眾號(kjxw001)及微博(中國科技新聞網)

