1月24日,巖芯數智正式發布自研大模型“Yan模型”。Yan模型采用非Transformer架構,為非Attention機制的通用自然語言大模型。據悉,該大模型相較于同等參數的Transformer,在訓練效率上提高了7倍,在推理吞吐方面提高了5倍,并且擁有3倍的記憶能力。
編輯/程乾本平臺發布/轉載的內容僅用于信息分享,不代表我司對外的任何意見、建議或保證,我們倡導尊重與保護知識產權,如發現本站文章存在版權問題,煩請將版權疑問、授權證明、版權證明、聯系方式等,發郵件至info@tonews.cn,我們將第一時間核實、處理。同時,歡迎各方媒體、機構轉載和引用,但要嚴格注明來源:今日商訊。