保觀 |聚焦保險(xiǎn)創(chuàng)新
進(jìn)入公眾號,可點(diǎn)擊右上【···】設(shè)為星標(biāo)哦
毫無疑問,大模型應(yīng)用正在加速進(jìn)入2.0階段。
(資料圖)
在1.0階段,ChatGPT以強(qiáng)大的語言交互能力完成了一次屬于AI的破圈,也讓大模型進(jìn)入了大家的視野。
雖然C端用戶的熱情在逐漸冷靜下來,對長于技術(shù)應(yīng)用開發(fā)的中國市場來說,大模型在各垂直領(lǐng)域的落地才剛剛開始,這顯然是一條更實(shí)用、商業(yè)模式更清晰的路線。大模型的2.0階段,重點(diǎn)就是要讓大模型在業(yè)務(wù)流程中真正發(fā)揮作用。
我們可以明顯感受到垂直領(lǐng)域大模型的“爆發(fā)”:亞馬遜推出了智能家居全新的Alexa語音助手,背后有大語言模型支持;百度發(fā)布了中國首個(gè)“產(chǎn)業(yè)級”醫(yī)療大模型“靈醫(yī)大模型”。
盤點(diǎn)目前已經(jīng)發(fā)布的大模型,金融、醫(yī)療健康是兩個(gè)非常重要、廣泛的應(yīng)用賽道。
最近,醫(yī)療保險(xiǎn)科技公司金仕達(dá)衛(wèi)寧推出了專門用于解答醫(yī)保和商業(yè)健康險(xiǎn)領(lǐng)域?qū)I(yè)知識、報(bào)銷、理賠相關(guān)政策的大語言模型——“知問”,希望為客戶打造一款醫(yī)保與商保領(lǐng)域?qū)I(yè)的智慧顧問。
圍繞“知問”和大模型的相關(guān)話題,我們對金仕達(dá)衛(wèi)寧副總經(jīng)理、產(chǎn)品臨床中心兼創(chuàng)新業(yè)務(wù)中心負(fù)責(zé)人王尚前進(jìn)行了專訪,一起聊了聊他們對大模型的理解和應(yīng)用,希望能為行業(yè)提供一些基于實(shí)踐的參考經(jīng)驗(yàn)。
深耕醫(yī)保與商保,“知問”讓信息問答化繁為簡
金仕達(dá)衛(wèi)寧成立于2012年,是醫(yī)療保險(xiǎn)和商業(yè)健康險(xiǎn)數(shù)字化風(fēng)險(xiǎn)控制解決方案與服務(wù)提供商,業(yè)務(wù)包括醫(yī)保基金監(jiān)管、醫(yī)保支付方式管理、醫(yī)?;疬\(yùn)行與審計(jì)管理、商業(yè)健康保險(xiǎn)智能風(fēng)控、醫(yī)療機(jī)構(gòu)精細(xì)化管理等,致力于通過運(yùn)用大數(shù)據(jù)、人工智能等技術(shù),服務(wù)于醫(yī)保管理部門、商業(yè)保險(xiǎn)公司及醫(yī)療機(jī)構(gòu),打造智能化的醫(yī)療保險(xiǎn)、商業(yè)健康險(xiǎn)風(fēng)控新模式。
在醫(yī)保領(lǐng)域,金仕達(dá)衛(wèi)寧針對醫(yī)保管理推出多種一體化解決方案,包括醫(yī)保智能監(jiān)控解決方案、醫(yī)?;疬\(yùn)行與審計(jì)解決方案,以及宏觀決策大數(shù)據(jù)分析解決方案等。從2019年開始,金仕達(dá)衛(wèi)寧參與建設(shè)和運(yùn)維了國家醫(yī)保局醫(yī)保信息平臺醫(yī)保智能監(jiān)管子系統(tǒng)、基金運(yùn)行及審計(jì)監(jiān)管子系統(tǒng)、宏觀決策大數(shù)據(jù)分析應(yīng)用子系統(tǒng)、運(yùn)行監(jiān)測子系統(tǒng)、數(shù)據(jù)中臺,并為全國20多個(gè)省的醫(yī)保管理部門提供相關(guān)服務(wù)。
在商保領(lǐng)域,金仕達(dá)衛(wèi)寧則提供了健康險(xiǎn)智能核保與風(fēng)險(xiǎn)防范、智能核賠與反欺詐、人群畫像與風(fēng)險(xiǎn)模型、惠民保、保險(xiǎn)產(chǎn)品精算、營銷推廣、長護(hù)險(xiǎn)照護(hù)管家等服務(wù)。
經(jīng)過十多年的發(fā)展,金仕達(dá)衛(wèi)寧在醫(yī)保和商保領(lǐng)域已經(jīng)有豐富的專業(yè)積累。
此次推出的“知問”專注于嚴(yán)肅、復(fù)雜的醫(yī)保和商保領(lǐng)域,是一款智能問答系統(tǒng)。關(guān)于為什么做“知問”大模型,王尚前告訴我們,首先是因?yàn)門ransformer帶來了技術(shù)突破,使自然語言的應(yīng)用有了更好的效果。他的團(tuán)隊(duì)在使用ChatGPT時(shí)也發(fā)現(xiàn)了通用大模型的一個(gè)缺點(diǎn),即在回答專業(yè)垂直領(lǐng)域問題的時(shí)候非常欠缺。因此,需要有垂直領(lǐng)域的大模型在通用大模型產(chǎn)品無法應(yīng)對專業(yè)領(lǐng)域問題的時(shí)候,填補(bǔ)這一缺口。
金仕達(dá)衛(wèi)寧在服務(wù)客戶的過程中發(fā)現(xiàn),這幾年醫(yī)保政策變化比較多,藥品、耗材、醫(yī)療服務(wù)項(xiàng)目醫(yī)保報(bào)銷目錄和報(bào)銷比例更新很快,普通人要準(zhǔn)確了解這些繁多瑣細(xì)的報(bào)銷細(xì)節(jié)和監(jiān)管要求,需要掌握大量相關(guān)知識。而商業(yè)健康險(xiǎn)產(chǎn)品范圍廣,從住院手術(shù)、門診治療到重疾保障,每一項(xiàng)都有獨(dú)特的保障內(nèi)容、限額和免賠規(guī)定。普通人經(jīng)常會(huì)被眾多的保險(xiǎn)產(chǎn)品、復(fù)雜晦澀的保險(xiǎn)條款搞的暈頭轉(zhuǎn)向。
基于上述這些痛點(diǎn),金仕達(dá)衛(wèi)寧在醫(yī)保領(lǐng)域有超過十年的經(jīng)驗(yàn),醫(yī)保知識庫規(guī)則庫積累了大量的醫(yī)藥學(xué)知識、醫(yī)保政策規(guī)范、醫(yī)保管理規(guī)范、法律法規(guī)、醫(yī)保信息業(yè)務(wù)編碼和監(jiān)管規(guī)則等,可以用于醫(yī)保垂直領(lǐng)域大模型的開發(fā)。
“知問”的主要功能是向醫(yī)保經(jīng)辦人員、醫(yī)療機(jī)構(gòu)工作人員,以及商業(yè)健康保險(xiǎn)購買者和保險(xiǎn)代理人提供不受時(shí)間和空間限制的高質(zhì)量、化繁為簡的信息咨詢和決策參考服務(wù)。
在醫(yī)保領(lǐng)域,“知問”可以回答一系列與醫(yī)保相關(guān)的問題,如醫(yī)保政策規(guī)定、異地報(bào)銷比例、醫(yī)保目錄中支付條件的限制、違規(guī)場景以及案例等,幫助用戶快速獲取最新、最準(zhǔn)確的醫(yī)保信息。
在商保方面,“知問”能夠回答保單、理賠、保險(xiǎn)條款等問題。王尚前介紹到,“知問”主要服務(wù)于惠民保,因?yàn)榛菝癖S泻軓?qiáng)的地區(qū)性差異,很多參保人也不了解惠民保的具體作用,惠民保的運(yùn)營方很需要有工具可以輔助解釋參保人的問題。
醫(yī)保知識問題的測試集中,“知問”回答的準(zhǔn)確率達(dá)到80%;面對復(fù)雜的商保條款,其回答準(zhǔn)確率達(dá)到86%。對于95%的查詢,“知問”都能在3秒內(nèi)給出回答。涉及深度計(jì)算或復(fù)雜條款分析的問題,“知問”也能在5秒內(nèi)給出回答。
“知問”大模型能滿足不同機(jī)構(gòu)和用戶的需求,可以植入任何前端場景,例如醫(yī)保局、醫(yī)院等機(jī)構(gòu)的網(wǎng)頁、手機(jī)端的APP、公眾號、微信小程序等,可以在一個(gè)月內(nèi)部署上線應(yīng)用。
垂直領(lǐng)域模型怎么做?抓住“三要素”
從技術(shù)角度來看,“知問”的專業(yè)表現(xiàn)主要基于三個(gè)要素:合適的基座模型、優(yōu)質(zhì)的專業(yè)數(shù)據(jù)和先進(jìn)的訓(xùn)練方法。
王尚前介紹,“知問”選擇了一些開源大模型作為基座模型,例如Meta公司的LLAMA模型、百川、清華的ChatGLM等。這類模型有很多預(yù)制規(guī)則,能夠確保問題回答有更好的精確性,“知問”對這些基座模型選型應(yīng)用,確保最適用于專業(yè)垂直領(lǐng)域。在訓(xùn)練過程中,金仕達(dá)衛(wèi)寧也設(shè)置了很多醫(yī)保、商保領(lǐng)域的預(yù)制規(guī)則,以提高回答的效率和準(zhǔn)確性。
在此基礎(chǔ)上,“知問”加入專業(yè)醫(yī)保和商保領(lǐng)域的數(shù)據(jù)進(jìn)行訓(xùn)練,如多年積累的醫(yī)藥學(xué)知識、全國各地的醫(yī)保政策規(guī)范、醫(yī)保管理規(guī)范、法律法規(guī)、醫(yī)保信息業(yè)務(wù)編碼和監(jiān)管規(guī)則等,做到能夠應(yīng)對全國不同城市客戶的需求。在商保領(lǐng)域,與惠民保相關(guān)的知識比較簡單;相較而言,醫(yī)保的知識較為復(fù)雜,這不僅是由于醫(yī)保的專業(yè)性強(qiáng),還因?yàn)楦魇?、市的醫(yī)保政策差異較大。金仕達(dá)衛(wèi)寧積累的醫(yī)保相關(guān)知識顆粒度可以細(xì)化到地級市。
垂直領(lǐng)域的模型,金仕達(dá)衛(wèi)寧傾向于把模型做“小”,做專業(yè)化,針對客戶需求做個(gè)性化。即以自身的數(shù)據(jù)積累為基礎(chǔ),再針對專門的監(jiān)管機(jī)構(gòu)、各地區(qū)的醫(yī)保經(jīng)辦等人員,從需求出發(fā),利用他們提供的有針對性的、非公開的數(shù)據(jù)進(jìn)行訓(xùn)練,例如某一類別的醫(yī)保政策,既避免了硬件資源的過度消耗,同時(shí)更實(shí)現(xiàn)了其模型在這一領(lǐng)域的精細(xì)化和精準(zhǔn)度,最終確保模型的效果。
大模型的開發(fā)都離不開大量優(yōu)質(zhì)數(shù)據(jù)的支持,“知問”的數(shù)據(jù)主要來源于金仕達(dá)衛(wèi)寧在醫(yī)保和商保領(lǐng)域十幾年的積累,有豐富、權(quán)威且可靠的語料。這些長期業(yè)務(wù)中沉淀下來的數(shù)據(jù)經(jīng)過了實(shí)際驗(yàn)證和用戶反饋,加之金仕達(dá)衛(wèi)寧參與了國家醫(yī)保局的醫(yī)保知識庫和規(guī)則庫建設(shè),本身有較強(qiáng)的專業(yè)性、針對性,基本不需要額外投入大量成本進(jìn)行標(biāo)注。
為了保證語料的高質(zhì)量,金仕達(dá)衛(wèi)寧對知識的獲取、驗(yàn)證和維護(hù)過程進(jìn)行了嚴(yán)格的把控,并采用先進(jìn)的知識表示、編碼和維護(hù)技術(shù),確保語料的權(quán)威性和可靠性。在業(yè)務(wù)中,金仕達(dá)衛(wèi)寧也在不斷進(jìn)行專業(yè)數(shù)據(jù)的調(diào)整和更新,確保了全國范圍內(nèi)的統(tǒng)一性、通用性和標(biāo)準(zhǔn)性。
金仕達(dá)衛(wèi)寧在數(shù)據(jù)使用上采取了謹(jǐn)慎的策略,由于其服務(wù)領(lǐng)域的高度專注,只選擇與醫(yī)保和商保相關(guān)的信息來訓(xùn)練模型。
接下來,金仕達(dá)衛(wèi)寧還準(zhǔn)備進(jìn)一步做一個(gè)政策知識庫,通過呈現(xiàn)結(jié)果加信源的方式,提供更精準(zhǔn)的信息和更好的體驗(yàn)。
為了提供更準(zhǔn)確的回答,“知問”不僅依賴于豐富的知識資源,還采用了前沿先進(jìn)的訓(xùn)練技術(shù)和專業(yè)的業(yè)務(wù)場景對齊,這里的關(guān)鍵技術(shù)包括專業(yè)知識的預(yù)訓(xùn)練、應(yīng)用場景的任務(wù)指令訓(xùn)練、全面精準(zhǔn)的知識搜索、上下文學(xué)習(xí)、思維鏈推理等。
以任務(wù)指令訓(xùn)練為例,這是一種讓模型在接收到特定指令后,能夠按照指令進(jìn)行操作的訓(xùn)練方式。這類訓(xùn)練通過設(shè)置提綱,確?!爸獑枴蹦軌蚶斫馔粏栴}的不同組織方式,既包含一般用戶的通俗問法,也包括從業(yè)人員的專業(yè)問法,從而提高在具體應(yīng)用場景中的準(zhǔn)確度,這也是目前“知問”模型的一大優(yōu)勢所在。
同時(shí),“知問”非常注重法律合規(guī)和用戶數(shù)據(jù)安全,通過多種措施全力保證用戶數(shù)據(jù)的安全與隱私。
大模型的未來:垂直領(lǐng)域應(yīng)用將大顯身手
通用大模型燃起了生成式AI的烈火,而得益于專業(yè)性、針對性以及為特定行業(yè)創(chuàng)造的價(jià)值,垂直領(lǐng)域已經(jīng)成為接下來大模型應(yīng)用的新方向。
垂直大模型的一個(gè)主要優(yōu)勢在于增強(qiáng)特定領(lǐng)域應(yīng)用的能力。通過利用特定領(lǐng)域的專業(yè)知識進(jìn)行訓(xùn)練,這些模型可以深入研究某一領(lǐng)域的復(fù)雜性,成為專業(yè)人士不可或缺的工具。例如,在醫(yī)療領(lǐng)域,大模型可以幫助診斷罕見疾病,提出個(gè)性化治療計(jì)劃,并及時(shí)了解最新研究和動(dòng)態(tài)。
垂直大模型的另一個(gè)優(yōu)勢是具有定制和適應(yīng)性的潛力。通過定制訓(xùn)練數(shù)據(jù),并針對特定領(lǐng)域微調(diào)模型,可以最大程度上確保模型符合某個(gè)領(lǐng)域的獨(dú)特要求和術(shù)語,從而增強(qiáng)用戶體驗(yàn),確保更準(zhǔn)確的輸出。此外,微調(diào)可以持續(xù)改進(jìn),并適應(yīng)不斷變化的行業(yè)趨勢,變得更加有效和可靠。
但是,開發(fā)垂直模型也有一定的難度。王尚前告訴我們,金仕達(dá)衛(wèi)寧在開發(fā)“知問”模型的過程中,主要的難點(diǎn)在于基座模型的選擇和語料設(shè)計(jì)。
目前,開源基座模型眾多,如何選擇最適合醫(yī)保和商保垂直領(lǐng)域的模型,對每種模型效果的評估、具體的評估方法,都帶來了困難。另外,人員成本、機(jī)器配置也都帶來了額外困難,例如,比較眾多開源模型中選型耗費(fèi)的代價(jià)非常大。
另一點(diǎn)就是語料設(shè)計(jì),一問一答并不能達(dá)到預(yù)期的訓(xùn)練效果,需要設(shè)計(jì)考題考綱、問題變種等模式。在這基礎(chǔ)上,在輸出環(huán)節(jié)再加入一些限制規(guī)則,才能確保模型的效果。
在功能方面,除了“知問”目前切入的專業(yè)知識問答領(lǐng)域,王尚前也指出,AIGC還可以提高數(shù)據(jù)統(tǒng)計(jì)的效率,而且金仕達(dá)衛(wèi)寧也會(huì)考慮在未來加入核保、核賠等風(fēng)控應(yīng)用,滿足客戶的需求。
整體而言,王尚前很看好大模型的發(fā)展。和過去的技術(shù)不同,大模型在業(yè)務(wù)流程中的應(yīng)用使用戶可以通過自然語言與這些新工具交互,不需要再學(xué)習(xí)專業(yè)的技術(shù)語言,這也是新一波人工智能技術(shù)賦能效率提高的關(guān)鍵。而且,我們每天在產(chǎn)生大量數(shù)據(jù),有了這些要素的“打磨”,大模型的功能會(huì)更加強(qiáng)大。
關(guān)于大模型接下來的發(fā)展,未來的核心在于客戶需求的競爭,要足夠好用,獲得用戶端的認(rèn)可。為了滿足客戶的需求,會(huì)出現(xiàn)越來越多的垂直領(lǐng)域大模型,當(dāng)然,這些大模型的功能也會(huì)更加專業(yè)化、精細(xì)化。
大模型應(yīng)用的關(guān)鍵之一在于對數(shù)據(jù)的掌握,垂直領(lǐng)域的專業(yè)大模型更是如此。在這一點(diǎn)上,保觀認(rèn)為,從金仕達(dá)衛(wèi)寧的“知問”大模型可以看出,掌握數(shù)據(jù)積累的垂直領(lǐng)域參與者擁有更多機(jī)會(huì)。
雖然大模型要實(shí)現(xiàn)成熟、廣泛的應(yīng)用,以及摸索出可持續(xù)的商業(yè)化模式還有待時(shí)日,但可以看到,通用大模型的發(fā)展解決了很多基本問題,很多企業(yè)也已經(jīng)行動(dòng)了起來,在借助大模型降本增效的探索之路上持續(xù)進(jìn)步。我們也會(huì)持續(xù)關(guān)注行業(yè)的最新動(dòng)態(tài),挖掘更多優(yōu)秀經(jīng)驗(yàn),期待與大家有更多交流!
點(diǎn)擊“閱讀原文”,購買保觀最新行業(yè)報(bào)告
關(guān)鍵詞: