2019年7月3日,“Baidu Create 2019”百度 AI開發者大會在京召開。百度創始人、董事長兼首席執行官李彥宏與百度各業務板塊的領軍人物一起,為來自全球各地的開發者與行業合作伙伴展示百度AI最前沿的人工智能技術、產品,并與現場數千名開發者、企業代表共同探討AI技術落地各行各業及全球產業智能化大趨勢。

DevOps for AI解決方案亮相百度AI開發者大會

在今年大會的公開課環節,百度效率云團隊聯合百度視覺技術部貢獻了一堂名為“DevOps for AI: Deploy ML Application via DevOps Pipelines”的公開課。公開課以開發一個著名品牌面包店識別商品、自動生成訂單服務為場景,結合現場實操向學員及來賓展示了通過百度效率云及AIFlow開發AI服務的全流程。公開課吸引了眾多對AI開發及DevOps感興趣的工程師以及技術人員的參與。

DevOps for AI解決方案亮相百度AI開發者大會

公開課上提到的AI服務到底是什么?開發一個AI服務和開發其它服務有哪些異同呢?

一、AI服務及開發挑戰

01. AI服務是什么,他的開發過程是怎樣的?

以AI視覺能力為例,一個完整的AI服務包括了基于AI模型的AI基礎能力,也包括了對外提供服務的工程代碼,最終用戶通過不同的客戶端對服務進行訪問。

DevOps for AI解決方案亮相百度AI開發者大會

AI服務的示例

一個完整的AI服務開發包括了工程代碼開發、模型訓練以及最終的集成階段。

在工程代碼開發階段,工程師像開發普通服務一樣通過coding, build, test等活動,最終產出發布物

在模型訓練部分,工程師經過數據收集與標注、數據處理、模型訓練與調優等活動最終產出一個AI模型

接下來,工程師需要將工程部分的發布物和AI模型打包在一起形成最終的產出物,并將最終產出物發布到線上

DevOps for AI解決方案亮相百度AI開發者大會

AI服務開發的過程

02. AI產品研發面臨的挑戰有哪些?

相對于傳統軟件開發而言,AI產品的研發面臨著諸多挑戰:

1、項目協作難:項目涉及開發、測試、運維等多角色,而AI項目往往額外涉及多個AI算法團隊,溝通、協調成本高,工作效率低

2、技術要求高:AI研發流程更長且專業性要求更高

3、環境周邊成本高:AI數據、模型、服務、工具維護使用成本高、安全風險大

4、技術復用難:業務閉環迭代慢,且無法快速規模化遷移應用已有能力

二、AI服務開發全生命周期解決方案

針對以上問題,百度內部通過多年的探索和實踐,最終形成了一套針對AI服務的DevOps解決方案。該方案涵蓋了模型訓練的部分,以及服務代碼開發的DevOps部分,并已經實現了全部的產品化,被百度內部多個AI開發團隊所使用。整套方案貫徹了DevOps理念中自動化一切的部分, 包括:

1、服務代碼--模型組裝--服務部署自動化

2、訓練工具源碼--訓練工具集成自動化

3、訓練數據管理--模型訓練--模型評估自動化

DevOps for AI解決方案亮相百度AI開發者大會

AI服務全周期解決方案

整個方案包括兩大重要工具以及支撐機器學習訓練的GPU服務器,他們分別是:

01. 重要工具:百度效率云

DevOps for AI解決方案亮相百度AI開發者大會

百度效率云(以下簡稱效率云)是百度自主研發的一站式DevOps解決方案,凝聚了百度多年來在軟件工程領域的探索和實踐經驗。效率云在百度內部服務10000+工程師的日常產品管理、開發、測試、發布等研發工作,每天支持百度內部30000+次的云端編譯、70000+次的構建、700+次的服務發布。

效率云已經加入百度智能云產品序列,于2019年5月正式對外提供服務。百度效率云目前同時服務外部2000+企業及個人客戶的項目管理,研發,測試等研發工作。

效率云的核心理念是: 用先進的軟件工程技術使復雜的開發工作更簡單!

DevOps for AI解決方案亮相百度AI開發者大會

效率云產品架構

整個效率云包括三大平臺類工具和四大主要功能模塊,分別是產品和項目管理工具iCafe、代碼托管和協同開發平臺iCode、持續交付平臺iPipe;

四大主要功能模塊包括靜態代碼掃描工具iScan、容器化構建工具iBuild、構建產物管理工具iRepo和由aiXcoder提供的智能開發助手iXcoder。

DevOps for AI解決方案亮相百度AI開發者大會

效率云主要功能模塊

和其他研發平臺相比,效率云具備以下幾個獨特的差異化功能:

基于用戶故事地圖的產品規劃

DevOps for AI解決方案亮相百度AI開發者大會

代碼入庫前的云端流水線:

與大多數基于pull request的流水線不同,效率云提倡進一步將質量保證手段前置。工程師在提交代碼后、代碼入庫之前即經過一系列的自動化代碼檢查和Code Review環節;只有通過所有的質量保證手段,代碼方可合入到當前代碼庫中。

DevOps for AI解決方案亮相百度AI開發者大會

即插即用的智能開發助手

DevOps for AI解決方案亮相百度AI開發者大會

基于特征識別的靜態代碼分析手段

DevOps for AI解決方案亮相百度AI開發者大會

02. 重要工具:AIFlow

DevOps for AI解決方案亮相百度AI開發者大會

AIFlow是百度成熟的一站式AI能力研發平臺,在百度內部已率先落地應用于視覺領域,并正在與自然語言處理、大數據部、知識圖譜、飛槳等團隊一起協作,共同推進AI基礎平臺建設。 該平臺在百度內部已經過150+重點項目的驗證,收錄數據12.6億、模型1745個、工具567個、覆蓋流量3600w/天。

在AI行業開發的多年探索中,AIFlow團隊充分調研了AI應用者、AI開發者(策略、架構)等不同群體的訴求、發掘了資源管理混亂且需求響應慢、流程多而復雜且各環節復用性低的痛點;因此,在設計上側重以下幾個特點:

1、數據、模型、工具統一托管,支持共享復用

2、AI能力自動化流程構建,支持數據閉環迭代

3、沉淀AI解決方案,支持快速規模化應用

通過產品的不斷打磨,AIFlow設計了諸多被用戶廣泛稱贊的亮點功能:

亮點功能1:可視化畫板搭建工作流,實現任意端到端的視覺研發解決方案輸出

DevOps for AI解決方案亮相百度AI開發者大會

1、易操作:用戶根據不同需求(數據處理、模型訓練、服務部署)從畫板左側依次拖拽輸入(數據/模型)、工具(數據處理、模型訓練、服務部署、自動評測)等資源,并在畫板右側配置對應參數,即可構建任意端到端的AI研發流程

2、可復用:用戶構建的研發流程可定期自動執行;并通過保存工作流、另存配置等不同方式,實現流程復用

3、便管理:以項目為維度,將對應的數據、工具、模型、服務等資源統一聚合管理,提升資源利用率

亮點功能2:數據倉庫支持對訓練數據進行多種高階操作

支持順序瀑布流式或表格方式樣本預覽,格式化數據并畫框展示

DevOps for AI解決方案亮相百度AI開發者大會

支持任意字段分布統計

DevOps for AI解決方案亮相百度AI開發者大會

支持任意字段的快速樣本查詢

DevOps for AI解決方案亮相百度AI開發者大會

03. GPU服務器:百度-浪潮聯合開發的AI超級計算平臺

不論是AI效率云還是AIFlow,智能化應用的背后都是計算力在發揮重要作用。基于JDM模式,百度與浪潮聯合開發出X-MAN系列超級AI計算平臺,為AI和深度學習應用提供了強大的算力支持。同時,結合百度在平臺層和應用層的先進方案,百度與浪潮也在共建一個更完善的AI生態,將軟硬件的一體化方案推向更大的產業市場,效率云和AIFlow就是一個很好的實踐。

效率云免費試用

重磅好消息!百度效率云及AIFlow現面向各企業、個人用戶開放免費試用,掃描下方二維碼,進入微信群,了解百度DevOps的系列課程,免費體驗效率云服務!

百度效率云官網:https://cloud.baidu.com/product/xly.html

DevOps for AI解決方案亮相百度AI開發者大會