8月16日消息,,全球開源技術(shù)峰會(GOTC2024),,由開源中國與上海浦東軟件園聯(lián)合舉辦,昨日在上海開幕,。
華為數(shù)據(jù)存儲軟件首席專家張群輝受邀在此峰會分享ModelEngine在垂域大模型領(lǐng)域的實踐應(yīng)用,。
據(jù)介紹,ModelEngine是華為DCS(Data Center Stack)全棧的AI訓(xùn)推全流程工具鏈,,涵蓋了從數(shù)據(jù)處理,、知識生成,到模型微調(diào)和部署,,以及RAG應(yīng)用開發(fā),、應(yīng)用部署等環(huán)節(jié)。旨在為數(shù)據(jù)處理工程師,、模型工程師,、應(yīng)用開發(fā)者提供高效易用、開放靈活和開箱即用的全流程AI開發(fā)體驗,。
張群輝進一步指出,,ModelEngine以開放的數(shù)據(jù)使能、模型使能和應(yīng)用使能工具鏈為基礎(chǔ),,支持開放的數(shù)據(jù)處理算子,、主流的模型和開放的應(yīng)用算子。這種開放性使得語料生成時間可以從原本的數(shù)月縮短至幾天,。
針對開發(fā)者,,ModelEngine提供一站式AI應(yīng)用開發(fā),、評估優(yōu)化和部署服務(wù),能夠快速構(gòu)建高準(zhǔn)確率的AI應(yīng)用,。此外,,ModelEngine還支持LangChain、LlamaIndex等插件,,保護已有AI資產(chǎn),。
展望未來,ModelEngine將繼續(xù)增強其可擴展性和定制化能力,,優(yōu)化性能和效率,,并提供更多的應(yīng)用示例,以滿足開發(fā)者在不同場景下的多樣化需求,。