從風火輪到內容處理
微軟AI能做哪些超乎想象的工作?
設計一款新玩具、總結一次會議、創作一則內容……這些以往必須由專業人員處理的工作內容現在可以完全交給AI系統,AI不止可以為設計者提供無窮的創意,可以將自然語言轉化成最終作品,還可以根據每個不同的對象生成個性化圖像和內容,極大提升生產力和創作力,現在就讓我們一起來看看強大的微軟AI為各行各業做出的那些令人驚嘆的事情。
最近美泰玩具公司的設計師們被要求設計一款新的風火輪模型車時,他們從DALL?E 2中尋找靈感。DALL?E 2是一個由OpenAI開發的AI系統,可以根據簡單的語言描述內容量身定做圖像和藝術作品。
使用該工具時,設計師可以輸入一條指示,如“一輛老爺車的縮尺模型”,然后DALL?E 2會生成一個玩具古董車的圖像,也許會是銀色的車身加白壁輪胎。
下一步,設計者可以擦除車頂,然后輸入“變成敞篷車”,DALL?E 2會將汽車圖像更新為敞篷車。設計師可以繼續調整設計,要求DALL?E 2把車涂成粉色或藍色,打開敞篷等等。
在面向開發者和信息技術專業人士的Ignite大會上,微軟宣布DALL?E 21將加入全球Azure平臺上的 OpenAI服務,先期受邀請的AzureAI客戶可以使用文本或圖像生成自定義圖像。
微軟表示,通過Azure OpenAI服務2提供的DALL?E 2為美泰這樣的客戶提供了AI的云基礎設施,有機結合了文本到圖象生成技術的前沿創新和Azure云平臺的合規性及負責任的AI護欄與認證。
美泰公司的設計師們能夠生成幾十張圖片,每一次迭代都能激發和打磨創意,有助于設計出一個新的風火輪汽車模型的內容詳實的最終效果圖。
加利福尼亞州埃爾塞貢多市美泰未來實驗室的產品設計總監卡麗·布斯表示:“人們會感嘆‘噢,我怎么沒有想到這個!’”。她把AI技術視為一種幫助設計師產生更多創意的工具。她提到:“追根究底,質量是最重要的,但有時積累數量可以得到質量?!?/span>
微軟也正在將DALL?E 2整合到其面向消費者的應用程序和服務中,從新宣布的微軟Designer3應用程序開始,很快它將被并入到微軟必應的Image Creator中。
在微軟產品和服務中推出DALL?E 2反映了該公司在AI研究方面的投資是如何將AI注入其創造、生產和發行的多個方面,以幫助每個人提高生產力和創新力。
在過去的一年半時間里,我們已經看到了這種技術已經漸漸應用到對最終用戶有用的實際場景和流程中。
這一趨勢是AI能力取得非線性突破的結果,而突破來自于將更多的計算帶入到更多的數據來訓練更豐富更強大的模型。
模型的力量已經跨過了質的門檻,現在它們在更多的應用中發揮作用。我們現在看到的另一個趨勢是,所有的產品開發者都開始認真思考他們可以如何在其產品中使用AI,既是為了方便操作也是為了說“哦,如使用AI,我的產品能有更好表現。”
埃里克·博伊德
微軟公司負責AI平臺副總裁
DALL?E 2的訓練是在微軟為OpenAI專門打造的一臺托管在Azure的超級計算機進行的。同一臺Azure超級計算機還被用來訓練OpenAI的GPT-3自然語言模型和Codex,該模型為編程工具GitHub Copilot和微軟Power Apps中使用Azure OpenAI的某些功能提供了支持4。Azure使這些AI工具能夠迅速生成圖像、文本或代碼建議,供用戶參考和借鑒。
DALL?E 2的加入建立在微軟和OpenAI持續合作5的基礎上,并擴寬了Azure OpenAI服務內的使用案例的豐富能力。處于預覽階段的Azure OpenAI服務是Azure認知服務系列的最新產品,它提供了內置于微軟Azure的安全性、可靠性、合規性、數據保密和其它企業級功能。
由微軟開發并通過Azure認知服務6提供的其它AI技術,如語言翻譯、語音轉錄、光學字符識別和文檔摘要,也出現在微軟Teams7、微軟Power Platform8和微軟3659等產品和服務中。
微軟公司業務應用和平臺副總裁查爾斯·拉曼納說:“在過去的一年半時間里,我們已經看到了這種技術已經漸漸應用到對最終用戶有用的實際場景和流程中?!薄斑@是這些大型語言模型的產品化?!?/span>
收到老板的電子郵件時,
向我的手機發送一條短信。
拉曼納說,這些AI功能旨在卸除繁瑣的工作,使員工能夠專注于有更高價值的任務,比如讓銷售人員與客戶交談時10無需做筆記。這些新工具還可以將目前占用人們工作日數小時時間的流程自動化,如撰寫銷售電話的總結并將總結添加到客戶數據庫中。
拉曼納表示:“現在我們可以注入AI的能力,讓AI聽取對話并通過轉錄文字、記錄行動項目、進行總結會議、識別常用短語或分析‘我是一個好的傾聽者嗎?’來幫助人們提高產出效率?!薄斑@需要使用最新的AI能力并升級數字協作工具。”
拉曼納專注于打造出使任何擁有計算設備的人都能使用微軟Power Platform創建自己的由AI驅動的應用程序的工具。例如,他的團隊正在Power Automate中推出一項具有AI輔助功能的性能11,讓人們能夠使用自然語言來建立鏈接微軟云中運行的各種服務的工作流程。
拉曼納解釋道:“用戶可以說,‘嘿,收到老板的電子郵件時,給我的手機發一條短信,并在我的Outlook里放置一個待辦事項。’”只要他們發話,它就會自動生成。
他說,這種將一句話變成工作流程的能力極大地增加了能夠提供AI軟件解決方案的人數。他又補充道,擁有更多技術知識的人可以利用微軟動力平臺中的低代碼工具和圖形界面,如AI Builder中的智能文檔處理技術12,進一步定制和完善他們的應用程序。
律師可以利用這項技術定制一個應用程序,每當有新的合同上傳到公司的門戶站點SharePoint網站時就會被啟動。這個應用程序可以提煉關鍵信息,如誰擬的合同、關聯方和行業部門,然后通過電子郵件將合同的摘要和這些細節信息發送給公司里負責該行業部門或客戶的律師。
在將這種AI自動化工作流程與今日完成此類任務的常規方式進行對比時,拉曼納說:“這有點神奇”。“你查看SharePoint網站,打開了一個新文件,然后瀏覽文件作總結,來看看是否與你有關。AI正在幫助人們擺脫這種單調任務,讓計算機做對人們最有利的事情。”
內容AI
過去幾年的數字化轉型讓世界各地的人們生產的內容更加泛濫。例如,微軟客戶現在每天向Microsoft 365 添加約16億條內容。想想看營銷演示文檔、合同、發票和工作指令及Teams會議的視頻錄制和文字記錄。
微軟協作應用和平臺總裁杰夫·特伯表示:“他們在創建文件,他們在Teams上進行合作,他們把文件儲存在SharePoint體驗中。”“我們想做的是將AI技術與這些內容結合起來,這樣客戶就可以進行更多的條理性活動,如審批合同、管理發票管理和監管備案。”
這就是為什么微軟又打造了微軟Syntex13。微軟Syntex是Microsoft 365的一個新的內容AI產品,它利用Azure認知服務和其它AI技術來改變內容創建、處理和挖掘方式。無論是數字內容還是紙質內容,它都可以讀取、標記和索引,使其可以在特定的應用程序中檢索和使用或作為可重復使用的信息。它還可以通過安全和保留設置來管理內容生命周期。
例如,TaylorMade 高爾夫公司曾向微軟Syntex14尋求一個綜合性文件管理系統來整理和保護電子郵件、附件和其它知識產權及專利文件。而當時,公司的律師需要手動管理這些內容,花費數小時時間來歸檔和移動文件,以便后期共享和處理。
有了微軟Syntex,這些文件會以一種更安全的方式被自動歸類、標記和篩選,而且它們易于通過搜索查找,不再需要在傳統的文件和文件夾系統中翻找。TaylorMade 公司還在探索如何使用微軟Syntex來自動處理訂單收據和其它應付賬款和財務團隊的事務性文件。
例如,TaylorMade 高爾夫公司曾向微軟Syntex14尋求一個綜合性文件管理系統來整理和保護電子郵件、附件和其它知識產權及專利文件。而當時,公司的律師需要手動管理這些內容,花費數小時時間來歸檔和移動文件,以便后期共享和處理。
有了微軟Syntex,這些文件會以一種更安全的方式被自動歸類、標記和篩選,而且它們易于通過搜索查找,不再需要在傳統的文件和文件夾系統中翻找。TaylorMade 公司還在探索如何使用微軟Syntex來自動處理訂單收據和其它應付賬款和財務團隊的事務性文件。
特伯指出,其他客戶正在使用微軟Syntex進行合同管理和匯編。雖然每份合同都或有其特殊內容,但它們基本都是圍繞財務條款、變更控制、時間表等通用條款構成。與其每次都從頭開始撰寫這些通用條款,人們可以使用Syntex從各種文件中匯編這些條款,然后進行修改。
他說:“他們需要AI和機器學習來查對,‘嘿,這一段與我們的標準條款非常不同,可能需要額外的注意’”。
他補充道:“如果你試圖閱讀一份100頁的合同并查找有重大變化的內容,沒有AI的幫助,這將是一項非常繁重的工作。然后圍繞這些合同的工作流程是:誰來審批它們?把它們存放在哪里?以后如何找到它們?這其中有很大一部分是元數據。”
個性化DALL?E 2
在Azure OpenAI服務中使用DALL?E 2激發了德國RTL公司不斷探索如何根據客戶的興趣生成個性化圖像,該公司是德國最大的私營跨媒體企業。例如,在RTL的數據研究和AI功能中心,數據科學家正在測試各種策略,通過生成圖像來提升用戶體驗。
德國RTL的流媒體服務RTL+正在擴展,現在可按需讀取數百萬視頻、音樂專輯、播客、有聲讀物和電子雜志。RTL數據團隊的數據產品和技術高級副總裁馬克·埃格說,該平臺主要依靠圖片來吸引人們的注意力。
他說:“即使你的推送很完美,你依然不知道用戶是否會點擊它,因為用戶是通過視覺線索來決定他們是否有興趣消費某物。因此插圖真的很重要,必須為合適的人準備合適的插圖”。
試想一下一部關于一名職業足球運動員被調往巴黎并與一名法國體育記者相愛的浪漫喜劇電影。如果有足球比賽的畫面,體育迷可能會更愿意去看這部電影,而喜歡看言情小說或旅游的人可能會對情侶在埃菲爾鐵塔下接吻的畫面更感興趣。
埃格表示,將DALL?E 2的力量與用戶互動過的內容元數據結合起來有可能提供以前無法想象的規模的個性化圖像。
他說道:“如果你有數百萬用戶和數以百萬計的資產,你會遇到無法解決的問題,那就是工作人員不夠。圖形設計師數量永遠不夠來設計你想要的所有個性化圖片。因此,這種技術可以讓你做到動用其它方式無法做到的事情。”
埃格的團隊也在考慮如何在Azure OpenAI服務中使用DALL?E 2為目前缺乏圖像的內容打造視覺效果,如播客劇集和有聲讀物場景。例如,一部播客劇集的元數據可以用來生成一個獨特的圖像來搭配它,而不是反復使用相同的通用播客圖像。
德國最大的私營跨媒體企業德國RTL正在探索如何在Azure OpenAI服務中使用DALL?E 2來吸引人們瀏覽其流媒體服務RTL+。其中一個構想是使用DALL?E 2生成獨特的圖像來給每個播客集作插圖,而不是用一樣的播客封面。
按照類似思路,在手機上聽有聲讀物的人通??吹降氖敲恳徽露枷嗤姆饷?。DALL?E 2可以用來生成一個獨特的圖像用來搭配每個章節的各個場景。
埃格補充說,通過Azure OpenAI服務使用DALL?E 2可以在一個地方訪問其他Azure服務和工具,這使他的團隊能夠高效和不間斷地工作?!芭c所有其它軟件即服務的產品一樣,我們可以肯定,如果我們需要由DALL?E 2創作的大量圖像,我們不用擔心線上操作問題。”
恰當和負責任地
使用DALL?E 2
據AzureAI微軟首席小組項目經理薩拉·伯德稱,沒有哪項AI技術像DALL?E 2這樣能夠從自然語言描述中生成圖像的系統那樣引起人們的興奮。
她在談到DALL?E 2時說:“人們喜歡圖像,但對于像我這樣完全沒有視覺藝術細胞的人來說,我能用它做出比用其它視覺工具漂亮得多的東西”?!八峁┙o人類一個新的工具來創造性地表達自己,并以引人入勝妙趣橫生的方式進行交流。”
她的團隊專注于開發工具和技術以指導人們正確和負責任地使用AI工具15,如Azure AI中的DALL?E 2,并對可能會產生危害的使用方式進行限制。
為了防止DALL?E 2在Azure OpenAI服務中輸出不當內容,OpenAI從用于訓練模型的數據集中刪除了最明顯的性和暴力相關內容,而且Azure AI部署了篩選程序來拒止違反內容政策的提示。
除此之外,該團隊還整合了一些技術,防止DALL?E 2創建名人圖像及經常被用來欺騙系統生成性或暴力內容的對象。在輸出端,該團隊添加了一些模型用來刪除AI生成的包含成人、血腥和其它類型不當內容的圖像。
我們正在設計界面來幫助用戶......使用這個工具來得到他們想要的效果。
DALL?E 2仍然受到許多AI系統都會遇到的挑戰:只有用于訓練它的數據足夠好,系統才會好。如果沒有用來了解用戶意圖的上下文,輸入DALL?E 2的描述性較差的提示會出現嵌入在訓練數據(網絡文本和圖像)中的偏差。
這就是為什么伯德正在與微軟產品團隊合作教人們如何使用DALL?E 2來幫助他們實現他們的目標,例如使用更多的描述性提示幫助AI系統更好地理解他們所追求的效果。
她說:“我們正在設計界面來幫助用戶更順利地生成創造,并分享今天的限制條件,以便用戶能夠使用這個工具來獲得他們想要的效果,而不是網上那些平庸的效果”。
“你如何預測未來?”
最近布斯加入了美泰未來實驗室,該實驗室正在探索元宇宙和NFT(非同質化代幣)等想法以擴大玩具業務的范圍。她正在利用DALL?E 2輔助她想象虛擬體驗可能的樣子。
她在說明DALL?E 2正在幫助其團隊預測未來時說道:“隨便滑動手指,選一個描述詞,森林、美人魚,隨便什么都可以,來思考虛構世界會發生什么,非常有趣?!??!叭绾晤A測未來?不斷地給自己灌輸更多的信息、畫面與想法,想象它們將如何組合在一起?!?/span>
微軟公司Azure平臺副總裁博伊德表示,DALL?E 2和支持它的大型語言模型家族正在釋放客戶的創造性力。AI系統是想象力的助燃器,它讓用戶產生新的有趣的想法,并在演示文稿和文件中生動展現這些想法。
他說道:“我認為,最令人激動的是,我們對這些大型語言模型的力量還只是觸及皮毛”。
[1]https://info.microsoft.com/ww-landing-ai-interest-capture-execution-for-ignite-keynote.html?lcid=en-usus/free/ai/search/
[2]https://azure.microsoft.com/en-us/products/cognitive-services/openai-service/
[3]https://www.microsoft.com/en-us/microsoft-365/blog/2022/10/12/new-tools-from-microsoft-365-edge-and-bing-bridge-the-gap-between-productivity-and-creativity/
[4]https://blogs.microsoft.com/ai/how-ai-makes-developers-lives-easier-and-helps-everybody-learn-to-develop-software/
[5]https://news.microsoft.com/2019/07/22/openai-forms-exclusive-computing-partnership-with-microsoft-to-build-new-azure-ai-supercomputing-technologies/
[6]https://azure.microsoft.com/en-us/products/cognitive-services/
[7]https://www.microsoft.com/en-us/microsoft-teams/group-chat-software
[8]https://powerplatform.microsoft.com/en-us/
[9]https://www.microsoft.com/en-us/microsoft-365
[10]https://cloudblogs.microsoft.com/dynamics365/bdm/2022/10/12/bringing-more-intelligence-to-sales-teams-with-dynamics-365/
[11]https://powerautomate.microsoft.com/zh-cn/blog/new-ways-to-innovate-with-ai-and-microsoft-power-automate/
[12]https://powerautomate.microsoft.com/zh-cn/blog/new-ways-to-innovate-with-ai-and-microsoft-power-automate/
[13]https://www.microsoft.com/en-us/microsoft-365/blog/2022/10/12/welcome-to-microsoft-syntexcontent-ai-integrated-in-the-flow-of-work/
[14]https://customers.microsoft.com/en-us/story/1556853242544319473-taylormade-golf-retailers-microsoft-syntex
[15]https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3Aprimaryr6
?
原文標題:設計一款風火輪模型車?竟如此簡單
文章出處:【微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。
-
微軟
+關注
關注
4文章
6600瀏覽量
104134
原文標題:設計一款風火輪模型車?竟如此簡單
文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論