整個AI領域,GPT-4 發布無疑成為載入 AI 史冊的大事件。但其還留下來一些發展空間,其不可能把所有的事情都做完。比如,涉及小數、分數的運算,GPT-4 可能給不出正確答案(其多位乘法運算準確率僅為 4.3%)。
可以說,現階段我們并沒有實現理想中的「通用人工智能」,強如 GPT-4 也并不完美。這也意味著,對于大模型使用者或者想在其上開發應用的技術人員來說,GPT-4 或許不是唯一的選擇,甚至不是最適合的選擇。
那么,在生成式 AI 的下半場,應用到底應該怎么造?這并不是一個能夠簡單得出答案的問題,很多時候,我們恨不得把現有的比較強的模型都試一下。但即使要做這件事也不容易,因為很多模型在發布的同時其實并沒有提供太多「配套服務」,試用也有成本和代價。
好在,擁有強大基礎設施的亞馬遜云科技也關注到了這些問題。近日正式上線的 Amazon Bedrock 就是奔著「提供更多選擇」和配套服務這一目標來的。
一、Claude、Llama 2、Stable Diffusion... 超全明星模型庫
除了 ChatGPT,在更多領域中,人們想要應用生成式 AI 還存在肉眼可見的挑戰:我們必須構建專用于生成式 AI 的硬件基礎設施,配合自身數據對大模型進行調優,不斷更新部署,同時還需要保護隱私數據的安全。即使對于科技公司而言,這也是非常復雜的事。
對此,亞馬遜云科技拿出了一套幫助人們建大模型應用的「基礎設施」。
今年 4 月,亞馬遜云科技正式發布 Amazon Bedrock,這是一套生成式 AI 全托管服務,包含業界領先的基礎模型和構建生成式 AI 應用程序所需的一系列功能。
Amazon Bedrock 匯聚了業內幾乎所有領先的基礎大模型,面對不同應用場景,它可以讓人們只需通過單一 API 就能用上來自 AI21 Labs、Anthropic、Cohere、Meta Llama2、Stability AI 等公司的先進大模型來構建自己的應用。
提到亞馬遜,很多人可能都會想到前段時間的一個重要融資事件:他們計劃對 OpenAI 頭號競爭對手 ——Anthropic 投資 40 億美元。
在大模型創業領域,Anthropic 是一個非常耀眼的存在。它由 OpenAI 前研究副總裁 Dario Amodei、GPT-3 論文第一作者 Tom Brown 等人在 2021 年共同創立,其創始成員大多為 OpenAI 的核心員工,他們曾經深度參與過 OpenAI 的 GPT-3,率先提出引入人類偏好的強化學習(RLHF)等技術。
這套強大的陣容打造出了一個同樣耀眼的模型 ——Claude(最新版本是 Claude 2)。在某些方面,這個模型甚至做到了 GPT-4 都沒做到的事情,比如 100k token 的上下文窗口,其代碼生成能力也超過了原版的 GPT-4。這些都是亞馬遜選擇投資 Anthropic 的重要原因。
更重要的是,亞馬遜云科技發布的新聞中有這么一段話:「作為投資協議的一部分,Anthropic 將使用亞馬遜云科技的服務承擔關鍵任務工作負載,合作進行安全研究和未來基礎模型開發。使用亞馬遜云科技的開發人員和工程師將能夠通過 Amazon Bedrock 在 Anthropic 最先進的模型基礎上構建應用?!?/p>
沒錯,應用生成式 AI,現在有了新的思路:有人把表現優秀的模型上線到 AI 基礎設施平臺上,讓用戶去選什么是最合適的。為了擴大操作的范圍,Amazon Bedrock 不僅上線了 Claude 2,還有開源界的扛把子 Llama 2 以及口碑同樣很好的 Jurassic-2、Command 等模型。
Jurassic-2 來自 AI21 Labs,是業內規模最大,性能最強的幾種基礎大模型之一。在 Amazon Bedrock 上甚至提供了超千億參數的 Ultra 版本,其可以應用于任何復雜的語言生成任務,例如問答、摘要、長格式副本生成、高級信息提取等,也支持多種語言。
Command 則是另一家明星創業公司 Cohere 推出的,可夠接受用戶個性化命令訓練的文本生成模型。企業用戶在將自己的數據和 Command 結合之后,就可以生成一個面向特定應用的語言模型,能在實際業務中立即發揮作用。在 520 億參數的體量之上,Command 的性能超過了很多更大的模型。
此外,在 ChatGPT 之前就已席卷 AI 圈,擁有強大文生圖能力的 Stable Diffusion 也在他們的模型列表里。
至此,在大模型應用的方向上,一條道路正在變得逐漸清晰。
二、生成式 AI 落地的全流程服務
最近在業內,人們對于大模型的應用方向逐漸形成了一種思路:利用業內領先的大模型作為基礎模型(Foundation Model),配合自有數據進行訓練和調優,進而構建出面向不同業務場景的應用。亞馬遜云科技把這條路迅速成為了現實,還進一步降低了企業入門的難度。
在 Amazon Bedrock 的基礎之上,企業可以更方便、快速地嘗試各種領先的基礎模型,進行提示工程,完成微調和檢索增強生成(RAG)等動作,使用自身專有數據定制模型。
利用 Amazon Bedrock Agents 工具生成式 AI 應用的開發、部署、管理等 Agent 能力被集合在一起。我們可以像用 AutoGPT 一樣無需編寫任何代碼就能創建出托管代理(AI agent),讓它來指揮大模型執行復雜的任務,如旅行預訂、處理保險索賠、策劃廣告活動和管理庫存等。
只需用自然語言文字寫指令,Agent 就能明白要完成的目標。
在平臺和硬件上,作為專為人工智能打造的平臺,Amazon Bedrock 連接了亞馬遜云科技的基礎設施,從硬件和軟件都對 AI 計算進行了專門的優化,覆蓋大模型從構建、訓練到部署的一系列工作負載。由于 Amazon Bedrock 采用無服務器(Serverless)技術,客戶不必管理任何基礎設施,就能在熟悉的亞馬遜云科技服務平臺上將生成式 AI 能力安全地集成和部署到應用程序中。
想要做大模型的應用,一個繞不過的問題就是算力的成本。最近就有人給微軟 GitHub Copilot 的服務算了筆賬:每月每位用戶收費 10 美元,結果微軟反而還要倒貼 20 美元。
對于亞馬遜云科技這樣的服務廠商而言,提高算力、降低成本的系統性解決方案是其最擅長的事。以使用最先進 AI 芯片英偉達 H100 的 Amazon EC2 P5 為例,它可以為訓練大模型提供高達 20 exaflops 的計算性能。與上一代基于 GPU 的實例相比,訓練時間最多可縮短 6 倍,而訓練成本則可以降低多達 40%。
具體到每 token 的價格上,Amazon Bedrock 上使用 Claude 系列模型的價格相比 GPT 系列有顯著優勢。
當然,Amazon Bedrock 也充分考慮了安全性和隱私保護??蛻艨梢允褂?Amazon PrivateLink 在 Amazon Bedrock 與虛擬私有網絡(VPC)之間建立專門的安全連接,確保任何數據傳輸都不會暴露在公共網絡上。
有趣的是,除了可以高效構建生成式 AI 應用之外,亞馬遜云科技也在其他層面上充分利用技術幫我們提高工作效率,比如利用大模型工具寫有你「自己風格」的代碼。
Amazon CodeWhisperer 是亞馬遜云科技提出的 AI 編碼應用程序,可在 IDE 中生成整行代碼和完整的函數代碼建議,幫人加速完成工作,它在今年 6 月發布了預覽版,并對個人開發者免費。目前它可以幫人們生成的 15 種編程語言的代碼,包括 Python、Java 和 JavaScript。
最近,亞馬遜云科技推出了一項 CodeWhisperer 企業計劃,旨在實現自定義化的 AI 代碼生成和建議服務?;谛鹿δ?,用戶可以利用企業內部的代碼存儲庫當訓練數據,讓 AI 相應地調整代碼生成建議,管理員也可以從控制臺管理自定義,在控制臺查看評估指標,估計每個自定義的執行方式,并有選擇地將它們部署給開發人員,保證了企業質量與安全標準。
在開發新技術之外,我們也能應用生成式 AI 提高業務評估和診斷的效率。Amazon QuickSight 提供了生成式 BI 的數據分析功能,它能夠創建交互式儀表盤、分頁報告以及嵌入式分析,同時具備進行自然語言查詢的能力,讓業務分析師能夠更加方便快捷的探索數據,并使用自然語言描述輕松創建可視化報告。
在所有流程上,亞馬遜云科技提供的能力大幅度降低了先進大模型的落地門檻,在人們使用技術領先大模型的同時,消除了管理環境、配置硬件與安全管理的事務,只需要關心業務創新就可以了。
三、生成式 AI 的變革,應該走這條路
我們知道,生成式 AI 的前景是不可限量的。
隨著門檻被 AI 基礎設施打下來,我們可以展望:在醫療健康領域,讓 AI 自動提取關鍵細節并根據臨床醫生與患者的互動創建文檔摘要;在藥物發現上,使用生成式 AI 工具進行蛋白質折疊、蛋白質序列、對接和分子設計,加速藥物發現和設計過程;在制造業中,生成式 AI 可以通過提取歷史數據實時診斷設備故障,并建議維護操作,例如輸入調整、維修或可能的備件。
利用開箱即用的生成式 AI 服務提升創新效率,更快地構建出實用化應用,或許才是大模型時代創新的正確方式。
如此看來,構建平臺,降低門檻的意義與 Llama2 這樣的重要技術創新可謂同等重要。
正如亞馬遜 CEO Andy Jaessy 所說的:「讓任何人,哪怕他還在自己的宿舍或者車庫里剛剛開始創業之旅,也能獲得與大型企業一樣先進的基礎設施和成本來實現自己的創新。我們希望幫助所有初創企業都有機會成為明天的『巨頭』?!?/p>
一句話,亞馬遜云科技提供的服務,正在讓眾多AI 浪潮旁觀者變成參與者。一場變革正悄然發生,生成式 AI 也將會在不遠的未來發生顛覆式變化,沖擊各行各業。
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!
圖片|PhotobyLevartPhotographeronunsplash?自象限原創作者|周游編輯|程心OpenAI又讓整個大模型界炸開了鍋。10月5日消息,據路透社報道,OpenAI正在探索制造自己的人工智能芯片,并已開始評估潛在的收購目標。據統計,OpenAI至少投資了3家芯片公司,其中Ce
人工智能(AI)是當今科技領域最具創新性和潛力的領域之一,也是微軟公司的核心業務和競爭優勢所在。然而,AI的發展也面臨著巨大的能源挑戰,因為AI需要大量的算力來處理海量的數據,而算力又意味著能耗。
9月22日,“創客北京2023”創新創業大賽算能科技·企業AI+TPU專項賽決賽圓滿完成。本次比賽有417個各具特色的創新創業項目入選算能科技專項賽道,經過層層選拔,最終24個項目晉級決賽,并于今天展開了激烈的比賽。算能大模型產品總監孫哲作為承辦單位代表,在活動上致辭:本屆“創客北京”大賽是一項為促
火山引擎數智平臺VeDI推出“AI助手”,通過接入人工智能大模型,幫助企業提升數據處理和查詢分析的效率,也就是幫助不會寫代碼的運營人員通過與大模型對話,做好業務運營數據的取數、看數和歸因分析。
近期,“AI新云”(NeoCloud)概念在科技圈和投資圈引發熱潮。今年3月,被業內稱作“英偉達親兒子”的AI基礎設施企業CoreWeave上市。這家依托英偉達GPU資源沖擊新云市場的初創公司,上市不到3個月市值飆升359%,達881億美元。CoreWeave的“身價暴漲”吸引了無數視線。對此,不少
一場人工智能領域的革新風暴正從華為開發者大會現場席卷全球產業界。2025年6月20日,在東莞舉行的華為開發者大會HDC2025上,華為常務董事、華為云計算CEO張平安揭開了盤古大模型5.5的神秘面紗。這一全新版本在自然語言處理、計算機視覺、多模態、預測和科學計算五大基礎模型上實現全面突破,標志著中國
一行代碼未寫,企業已獲完整客服系統——這將是AI代理普及的新起點?!敖裉鞓酥局鳤I代理技術從實驗室走向產業的轉折點?!監penAI產品負責人OlivierGodement在項目發布聲明中如此評價。就在今日,這家AI巨頭通過HuggingFace平臺開源了一套完整的客戶服務代理框架,采用寬松的MIT許
6月17日,阿里巴巴旗下智能信息平臺夸克App正式推出全新學習產品“夸克老師”——一款集講題、批作業、出題、找試卷于一體的AI家教。該功能依托通義千問大模型,通過指令微調、強化學習等前沿技術,首次實現“因材施教”的個性化輔導,標志著AI在教育領域的應用邁入新階段。技術突破:AI模擬真人教學,推理能力
2025年6月17日,字節跳動旗下智能助手豆包正式在電腦版及網頁端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網頁鏈接,即可一鍵生成由兩位AI主播演繹的對話式播客節目。這一創新功能憑借高度擬人化的語音效果和秒級轉化效率,迅速引發內容創作者、學生群體及職場人士的關注。技術突破:真人級語音交互,秒
我不是危言聳聽,現在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態控制權,誰就是AI圈的老大。你們有沒有發現,MCP在2025年初開始特別火爆,互聯網技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺,提供50+預置MCP服務。不過大都只面向阿里系產品。(2)騰
2025國際人工智能程序設計精英挑戰賽(IAEPC)在香港中文大學成功舉辦。作為主辦方之一,歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普