11月30日,由深度學習技術與應用國家工程研究中心主辦、飛槳承辦的WAVE SUMMIT+ 2022深度學習開發者峰會在線上舉辦。會上,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜帶來文心大模型的最新發布。其中,百度聯合深圳燃氣、吉利、泰康保險、TCL、上海辭書出版社等不同行業頭部企業一次性發布5個行業大模型,成為峰會一大亮點。
從技術研發到落地應用,大模型發展已經進入產業落地的關鍵期,與產業場景需求的高度契合是大模型真正助力產業發展的重要前提。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在峰會上指出了大模型的產業化路徑:具有算法、算力和數據綜合優勢的企業,可以將復雜的模型生產過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務。
目前,這條大模型產業化路徑已在百度的產業實踐中得到驗證,聯合行業頭部企業研制行業大模型就是其中的重要實踐之一。作為推進大模型在行業深度應用的關鍵舉措,百度在今年5月率先推出行業大模型,以“行業知識增強”為核心特色,基于通用數據訓練的文心大模型,加上挖掘行業應用場景中大量存在的行業特色數據與知識,再結合與行業專家一起研討,引入行業實際業務積累的樣本數據和特有知識,設計行業領域特色算法任務,提升大模型對行業應用的適配性。
本次峰會上,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜帶來了文心行業大模型發布以來最集中的一次升級。百度聯合深圳燃氣、吉利、泰康保險、TCL、上海辭書出版社等多個不同領域行業頭部企業重磅發布5個行業大模型:深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辭海-百度·文心,進一步印證了行業大模型的落地效果。
此次全新發布的行業大模型已經在各自行業的實際業務場景中得到了應用或論證。在燃氣行業,“深燃-百度·文心”在環境巡檢、安全監控等領域落地,有效解決了場景繁雜、識別困難等難題;在汽車行業,“吉利-百度·文心”應用于售后服務和汽?領域知識庫構建等場景,實現了顯著的效果提升;在保險行業,“泰康-百度·文心”應用于醫療單據識別等任務,平均字段識別錯誤率相對下降;在電子制造行業,“TCL-百度·文心”變革了傳統質檢算法流程,大幅提升了模型研發與運營效率,實現降本增效;在社科行業,“辭海-百度·文心”用于版權保護、詞條管理和知識挖掘等方面,發揮了基礎關鍵的技術作用。
截至2022年11月,文心已累計發布11個行業大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領域,實現顯著的效果提升,產業生態初步形成,正在成為加速推動行業智能化轉型升級的重要力量。吳甜表示,文心行業大模型是百度與行業頭部企業、機構聯合探索出的行之有效的大模型產業落地方式,讓大模型在實際應用場景中“不但能用還便捷好用”。
為了讓企業和開發者更加方便、快速地使用大模型的最新能力,文心大模型的工具與平臺進行了全面更新。吳甜介紹到,在工具方面,文心大模型開發套件全面升級,發布行業大模型定制工具,同時提供更加完備的場景化建模工具、更為豐富的模型精調工具,以及大模型可信學習工具,讓大模型開發訓練更加靈活高效;文心API服務支持多種模型尺寸的精調,體驗專區提供更多可體驗能力,同時基于大規模集群算力分布式推理加速能力,可滿足大規模高性能產業級調用。
在大模型迅猛發展的當下,支撐大模型開發、訓練和推理部署的飛槳深度學習平臺也在持續進化。為了讓大模型產業落地更高效便捷,飛槳提供了全流程產業化工具與平臺,包括大模型開發套件、場景模型生產線等,極大降低應用門檻。
從WAVE SUMMIT+ 2022深度學習開發者峰會上的最新發布來看,文心行業大模型已經從先鋒、探索性質,發展到了覆蓋行業眾多、體系完備的新階段。未來,文心將與行業頭部企業繼續研發和優化行業大模型,探索大模型技術對實際場景中業務難題的創新解法,加速推動產業智能化升級。