
微軟 Build 2024開發者大會
2024.05.21
當地時間5月21日,微軟Build 2024年度全球開發者大會在美國西雅圖召開,微軟CEO Satya Nadella在大會上致辭,側重于Windows和AI的介紹,并一連發布了60多種新產品和解決方案。
首先,Nadella提出了兩個貫穿全局的核心問題:
在這個資訊激增的時代里,PC如何幫我們利用這些資訊進行快速推理、計劃和行動?
計算機可以主動理解我們,而我們不必了解計算機嗎?
“Copilot+PC”預熱
在這場大會的前一天,微軟先舉辦了一場有關“Surface和Windows AI”的預熱活動,發布了新一代Surface以及全新AI功能——Recall,從而正式宣告了Copilot+PC的面世。
據了解,新一代Surface分為第七代Surface Laptop和第十一代Surface Pro兩種機型,搭載了高通新品驍龍X Elite芯片,附加Prism技術以全面轉向ARM陣營。Recall則是通過整合Copilot的“回溯”功能(學習、理解及推理能力),借助大模型追蹤用戶操作,支持以時間線的形式調用有關內容和操作的“回放”。
對于Copilot+PC來說,其主要OEM包括AMD、英特爾和高通,以及宏碁、華碩、戴爾、惠普、聯想和三星等眾多知名大廠。其中,前三者負責微軟PC的芯片制造,而后幾位則是微軟的設備合作伙伴,其PC產品即將搭載微軟的AI模型。
微軟副總裁兼消費品類首席營銷官Yusuf Mehdi介紹,Windows 11 AI PC是有史以來最強大的 Windows PC,融合了多種突破性的AI體驗,并預計該款AI PC明年銷量可達5,000萬臺。
Nadella還表示:“蘋果在多個方面都表現得極為出色,我們現在正期待Windows與Mac能夠重新展開真正意義上的對決?!?/span>
Copilot產品線
顯而易見的是,Copilot在這場開發者大會的地位相當重要:一方面,它能夠更加流暢地幫助個人用戶處理繁雜的工作;另一方面,Copilot也讓團隊協作變得輕松自如。
Team Copilot
對于職場人來說,Team Copilot使Copilot“擬人化”,Copilot將不再是一個“旁觀者”,而直接化身為團隊成員,在Teams、Loop、Planner等協作應用中直接受調用。
例如,Copilot作為會議主持人,管理議程并實時記錄要點;或充當協作者,提取重要信息并解決遺留問題;甚至作為項目經理,通過創建和分配任務、跟蹤截止日期等方式推動團隊協作等等……其預覽版本將于今年晚些時候推出。
Copilot Agent代理功能
該功能推出后,在Microsoft Copilot Studio的開發者們將可以根據特定任務和功能,構建可以主動響應數據和事件的Copilot,它可通過記憶和知識理解上下文、推理操作和輸入,基于用戶反饋進行學習,從而獨立、自主地管理復雜、長期運行的業務流程,并有望進化為全自動的AI Agent。
微軟業務應用和平臺的公司副總裁Charles Lamanna表示:“我們很快意識到,僅限于對話的Copilot在當今所能做的事情上是非常有限的,與其讓Copilot等待有人與其聊天,不如讓它更主動,在后臺執行自動化任務。”
GitHub Copilot Extensions
大會上,Nadella稱GitHub Copilot為“這個AI時代的第一款熱門產品”。作為最廣泛采用的AI開發工具之一,GitHub Copilot的訂閱用戶已經突破180萬人。
而今,微軟又進一步與100多家合作伙伴推出GitHub Copilot Extensions,一改此前“補全代碼”的常態,化身效率提升神器——通過對話整合所有開發流程,減少上下文切換,讓開發者專注于核心代碼內容。
不論是語音輸入還是文字輸入,不論是Java還是Python,輸入語言也沒有任何限制,只要提出需求,GitHub Copilot都能作出開發者需要的代碼。不僅如此,它還能回答有關開發過程的問題,并支持多種開發工具和平臺。
Copilot堆棧&Fabric實時智能
2023年里,微軟成功構建了Microsoft Copilot并更新了150多個迭代版本,并開發出Copilot堆棧,為開發人員賦予了更高的自由度。
在此基礎上,微軟在今年為開發者們升級了Copilot堆棧,使其可以構建自己的AI應用程序、解決方案和多樣體驗。據介紹,Windows Copilot庫包含了40多種端側AI模型,包括Windows兼容的API和算法。
另外,Nadella還宣布在Microsoft Fabric上推出實時智能(Real-Time Intelligence),這個受AI驅動的分析平臺可為組織提供即時決策和SaaS服務等,不僅幫助數據分析人員獲得簡單的低代碼或無代碼體驗,也能通過代碼豐富的用戶界面讓專業開發者受益。
GPT-4o和Phi-3-vision
作為OpenAI最大的投資方,微軟也獲得了OpenAI所有AI模型的優先使用權。
上周,OpenAI最新發布的多模態模型GPT-4o正是在Azure上訓練的,現已在Azure AI Studio中作為API提供,支持多模式輸入和輸出,為企業用戶和開發者帶來更多創作空間。微軟CTO Kevin Scott也戲稱,GPT-4o比原始模型便宜了12倍左右。
而在這場盛會的最后,OpenAI CEO Sam Altman也驚喜現身于會場,并透露了微軟正在開發可承載GPT-5高算力需求的超級計算機的消息。
除了GPT-4o,微軟開發的Phi-3系列AI小語言模型也發布了一款全新多模態模型Phi-3-vision,與前任Phi-3-mini和Phi-3-medium一起,通過Azure AI的MaaS產品面向用戶。
據了解,Phi-3-vision具備音頻和視覺功能,能夠讀取文本并分析圖片,且其較小規模(42億參數量)適用于移動設備。不過,與DALL-E和Stable Diffusion不同,Phi-3-vision不會生成圖像,主要用來理解圖像中的內容并為用戶進行分析,目前已進入預覽階段。
擴大AI合作關系網
與英偉達
微軟方面稱,其與英偉達欲合作推動全球制造業的數字化進程,基于微軟Azure的英偉達全宇宙云應用編程接口(Omniverse Cloud API)將為用于設計、構建和操作工業數字孿生工具的軟件,帶來數據互操作性、協作和基于物理世界的可視化等重要功能。
與Meta
微軟宣布,將微軟混合現實應用程序(Windows Volumetric Apps)引入Meta Quest頭顯設備,使開發人員能夠將其應用程序擴展到3D空間,該擴展將允許用戶不離開支持他們工作依賴的應用程序,同時增強空間理解的能力。
與可汗學院
這一多元合作伙伴關系的重點在于利用AI技術為教育材料提供支持。微軟將為美國所有K-12教育者免費提供AI教育助手Khanmigo for Teachers,并捐贈Azure AI優化的基礎架構權限。
可汗學院方面則會借助微軟開發的Phi-3最新版本,探索經濟實惠、可擴展且適應性強的方式改進數學輔導,并計劃將更多可汗學院的教學內容引入Copilot和Microsoft Teams教育版,提供更多學習資源。
其它亮點
Edge實時視頻翻譯
該功能將支持實時語音同傳翻譯,適用范圍包括YouTube、LinkedIn、Reuters和Coursera等主流網站影片,但只支持英語、印地語、德語、俄語、意大利語和西班牙語的雙向互譯。微軟也表示,后續將會添加更多的語言和視頻平臺。
Teams定制Emoji
七月,微軟Teams將全面上線定制表情符號功能,讓用戶更有創意、更加真實地表達自己。企業IT管理員將可以限制哪些用戶可以上傳或刪除自定義表情符號,或完全關閉該功能。自定義表情符號將盡在同一組織域中可見。
Windows 11的AI剪貼板功能
據悉,“高級粘貼(Advanced Paste)”功能現已于PowerToys 0.81版本推出,啟用后,用戶可使用“Windows+Shift+V”喚醒該功能,從而可以在粘貼內容時進行格式轉換,如純文本、markdown或JSON。