Verta Enterprise(一種開放式端到端MLOps平臺)的提供商Verta.ai宣布推出ModelDB 2.0,這是一種用于進行機器學習的開源模型版本控制系統(tǒng)(ML)開發(fā)和部署可靠,安全且可重現(xiàn)。
在一個快速發(fā)展但缺乏基礎結構來操作和控制模型的領域中,ModelDB 2.0提供了跟蹤和版本化整個建模過程(包括基礎數(shù)據(jù)和培訓配置)的能力,從而確保團隊始終可以返回并重新創(chuàng)建模型,以補救生產(chǎn)事故還是回答法規(guī)問題。
“在保險業(yè)中,許多模型必須提交給監(jiān)管機構進行審計和記錄。但是,創(chuàng)建模型的過程更像是研究。這需要時間,并且是臨時性的。對我們的團隊來說,記錄和復制模型是一項艱巨的任務,精算師花了數(shù)周的時間來回答監(jiān)管機構的問題。因此,對于我們和許多受監(jiān)管的公司而言,使模型和分析具有可重現(xiàn)性對我們的業(yè)務至關重要。”劍橋移動遠程信息處理公司首席科學家Samuel Madden說,劍橋移動遠程信息處理公司是領先的InsureTech公司,使用數(shù)據(jù)和ML來提高駕駛員的安全性。
ModelDB 2.0引領了模型版本控制,類似于代碼的源版本控制
雖然軟件中有健壯的系統(tǒng)可用于關鍵操作,例如源代碼管理,敏捷交付和操作;ML模型缺少這些系統(tǒng),這對公司將ML集成到其核心產(chǎn)品中提出了挑戰(zhàn)。
ModelDB 2.0完全重新考慮了模型版本系統(tǒng)應該提供什么以及應該如何構建。Verta的ModelDB 2.0使用來自代碼版本控制系統(tǒng)(如Git)的同類最佳構造,并使它們適應重現(xiàn)ML模型的特殊要求,從而可以對ML模型進行完整的管理,審核,版本控制和協(xié)作。
ModelDB 2.0已獲得Apache V2的許可,現(xiàn)已普遍可用,它為開源社區(qū)提供了以下新功能:
能夠對模型的關鍵要素進行版本控制,包括代碼,數(shù)據(jù),配置和環(huán)境
能夠復制使用ModelDB協(xié)議版本化的任何模型
集成到流行的ML框架中,例如PyTorch,Tensorflow和scikit-learn
具有身份驗證,授權,組織和團隊的用戶管理
Verta.ai的ModelDB 2.0幫助組織將敏捷性帶入數(shù)據(jù)科學
麻省理工學院開發(fā)的ModelDB的第一個版本專注于跟蹤模型元數(shù)據(jù)(例如,誰創(chuàng)建了模型,用于模型訓練的確切配置等),許多研究和商業(yè)系統(tǒng)都繼續(xù)采用ModelDB引入的這種方法。但是,多年建立和部署ML模型的經(jīng)驗以及在受監(jiān)管行業(yè)工作的機會向Verta團隊強調了這種方法的不足之處。
“雖然元數(shù)據(jù)很有用,并且可以告訴您諸如誰建立了特定模型的信息,但是它沒有提供例如追溯到過去并重新創(chuàng)建該模型以回答監(jiān)管問題的能力。隨著模型制定關鍵的業(yè)務決策,業(yè)界要求我們在模型的創(chuàng)建和使用方式上承擔更大的責任和安全性。
模型版本控制為諸如打包,部署,操作和監(jiān)視之類的下游MLOps提供了堅實的基礎,Verta看到了將Verta Enterprise置于ModelDB的強大模型版本控制系統(tǒng)中的優(yōu)勢。