上週 5/13 OpenAI 公開了最新一代的模型 GPT-4o,而讓人意外的是 Azure 居然搶在第一天與 OpenAI 同時上線了 GPT-4o,要知道以往這都要落後一個月的。時過一週 Microsoft Build 2024 開發者大會登場,題目當然是繼續圍繞著 AI,而 GPT-4o 也脫離 Azure OpenAI Early Playground 進入可佈署模型,沒錯,僅僅一週這個剛推出的 Early Playground 又不見了 。
在 Microsoft Build 2024 期間推出的眾多新功能中,目前最讓我出乎意料的就是 GPT-4o 多了一種新的 Global Standard 佈署型態,這讓 GPT-4o 可以達到前所未見的一千萬 TPM,對於整天 429 的我來說真的是一大救星。
模型佈署
截至撰文當下,GPT-4o 只支援美東、美東二、美國中南部、美國中北部、美西與美西三地區,所以必須要先在這些地區建立 Azure OpenAI 資源,正確的支援地區請參考官方文件。
佈署方式與之前的模型一樣,點擊「Deployments」頁面上方的「Create new deployment」。
當選擇 gpt-4o 模型時,佈署型態就能選到全新的 Global Standard,接著開啟下方的「Advanced options」。
真的可以有一千萬 TPM 😱
Global Standard vs Standard
根據最新發佈的官方文件,Global Standard 其實就是透過將客戶的請求負載均衡到世界各地的 Azure 資料中心,藉此來提供更高的 TPM,同時 Global Standard 也是目前官方建議在測試或實驗階段首選的佈署型態。
不過因為每次請求都不知道會到達哪個地區的資料中心,所以 Global Standard 並不支援 Azure Data Residency Promises,如果有這方面考量的人可能就需要注意了。
最後附上官方文件上的比較表供讀者參考。
TPM
事實上 Global Standard 的一千萬 TPM 必須要 Enterprise Agreement 客戶才能得到,這對蠻多使用者來說可能比較難達成,如果你使用的是 Pay-As-You-Go 或 MCA 那最高可能就只有 450K 了。
一樣附上官方文件供讀者參考。
Tier | TPM | RPM |
---|---|---|
EA | 10M | 60K |
預設 | 450K | 2.7K |
總結
以上討論了在 GPT-4o 上最新開放的 Global Standard 佈署型態,雖然我們沒有提到太多關於 GPT-4o 模型本身,但是 GPT-4o 的低延遲與相比 GPT-4 Turbo 僅一半成本的優勢,肯定也是要搭配高 TPM 才能展現出其價值, Global Standard 的出現可說是非常即時!
留言
張貼留言