Provisioned Throughput Units 一直是目前在 Azure OpenAI 對於延遲問題的最有效解法,同時也是官方最推薦的方案。有別於基本的隨付即用,PTU 具有穩定、可預測的延遲等優勢,適合用於正式上線的生產環境。
但 PTU 的成本是一個不可忽視的問題,儘管選購最小單位量的 PTU,也是需要應用到達一定規模後才看得出使用效益。在確認是否購買 PTU 時,除了詳細閱讀官方文件並使用官方推出的計算機規劃額度外,以下幾點或許也是你該注意的。
不可自行購買 PTU
首先,是的,截自撰文當日 (2024/07/09) PTU 只能透過微軟業務窗口洽詢購買細節,這可能對於多數用戶是不友善的,但我相信這個過程很快就能得到優化。
PTU 的可用區域僅供參考
在官方文件中記錄了下述表格,其中詳細的呈現各種模型的 PTU 在不同地區的可用性,但這張表只是一個參考,因為當你洽詢業務窗口時你會得到另一張不同的表格。
其中對於台灣用戶可能最有影響的,是我們沒辦法在日本東部購買 gpt-4o 模型的 PTU,對於想透過購買 PTU 以降低模型延遲的用戶來說這是一個矛盾的選擇,當然更不用提隨之產生的跨區傳輸量成本。
一樣截至撰文為止,為何在打勾區域✅無法購買的問題,官方並沒有給出任何理由,或許是我們採購量沒有達到官方需要解釋的程度😔
有別於你認知的定價策略
承如前述,PTU 的成本絕對是導入時的重要考量點。
PTU 的售價到底是多少
事實上 PTU 的官方售價早就是公開的秘密,稱之為秘密是因為 PTU 的售價截至目前並沒有被列在官方文件或定價計算機中,但在最新的 Azure OpenAI Studio 裡,你可以由左側的「Manage」→「Quotas」→「Provisioned」→「Manage Commitments」進入,在點擊「Purchase commitment」後就能略知一二。
每種模型的售價是一樣的
從以上得到價格時沒有綁定模型就知道了,另外也可以對比以下連結的官方計算案例,綜合以上資訊可以判斷出 PTU 的計價是不論模型種類的。
這也就是說在 gpt-4o 公開之時所主打的「只需 turbo 一半價格」在購買 PTU 時是不成立的,並且只要這樣的策略不變,未來任何的新模型上架所帶來的降低成本優勢都將不復存在。
總結
最終我們可能都為了低延遲需求而選擇 PTU,但在 PTU 的選購上我們需要考量的事情遠比隨付即用模式還多,同時單次最少的購買量也需要 50 個單位達一個月,唯有謹慎評估現有需求才能享受 PTU 所帶來的所有好處。
留言
張貼留言