沒能等到GPT-5,但OpenAI在深夜卻很突然地open了一下——
開源兩個推理模型:gpt-oss-120b和gpt-oss-20b。
要知道,上一次OpenAI開源模型還是6年前,也就是2019年的GPT-2。
而這次的名字也是非常的直接,gpt-oss,即Open Source Series,意思就是“開源系列”。
它們的亮點如下:
gpt-oss-120b:1170億參數(shù)(MoE架構,激活參數(shù)約51億),可在單張80GB GPU上運行,性能接近閉源的o4-mini。
gpt-oss-20b:210億參數(shù)(Moe架構,激活參數(shù)約36億),可在16GB內(nèi)存的消費級設備上運行,性能接近o3-mini。
并且它倆均采用Apache 2.0許可證,允許商用無需付費或授權。
從性能角度來看,gpt-oss已經(jīng)達到了開源模型里推理性能的第一梯隊,但在代碼生成和復雜推理任務中仍略遜于閉源模型(如GPT-o3和o4-mini)。
在模型發(fā)布的第一時間,Sam Altman在自己的社交平臺上也道出了這倆模型的“價值”:
可以在本地筆記本(20b的可以在手機上)運行;耗資數(shù)十億美元的研究成果。