新京報貝殼財經(jīng)訊 3月18日,昆侖萬維宣布正式開源Skywork R1V多模態(tài)視覺思維鏈推理模型,并即日起開源模型權(quán)重和技術(shù)報告。
該公司在官方公號中表示,和開源同規(guī)模或更大規(guī)模模型的對比,Skywork R1V 38B體現(xiàn)出行業(yè)顯著優(yōu)異的推理能力,以及領(lǐng)先的多模態(tài)視覺理解能力,并表示Skywork R1V能夠達(dá)到當(dāng)前的性能高度,依賴于在訓(xùn)練過程中創(chuàng)新性地采用了“文本推理能力的多模態(tài)高效遷移”“多模態(tài)混合式訓(xùn)練(Iterative SFT+GRPO)”“多模態(tài)混合式訓(xùn)練(Iterative SFT+GRPO)”三階段方法,使得文本端強大的推理能力得以高效遷移至視覺任務(wù)上。
編輯 羅亦丹
校對 盧茜