證券時報網(wǎng)
2025-02-21 23:40
DeepSeek突傳大動作。
2月18日,DeepSeek在社交平臺X上發(fā)布了一篇關(guān)于NSA的純技術(shù)論文報告。DeepSeek稱,NSA是一種與硬件高度適配并可原生訓(xùn)練的稀疏注意力機制,實現(xiàn)超高速長上下文訓(xùn)練與推理。通過針對現(xiàn)代硬件的優(yōu)化設(shè)計,NSA加快了推理速度,同時降低了預(yù)訓(xùn)練成本,而不會影響性能。
與此同時,人工智能初創(chuàng)公司月之暗面也有大動作。2月18日,其宣布推出一款新模型Kimi Latest,它將對標Kimi智能助手當前使用的模型,隨智能助手產(chǎn)品更新而同步升級(模型名稱始終不變),用戶現(xiàn)已可在Kimi開放平臺體驗。
市場層面,2月18日,港股DeepSeek概念股延續(xù)強勢,截至收盤,出門問問大漲超16%,創(chuàng)夢天地大漲超12%、美圖公司大漲超10%、快手漲超9%。高盛最新研報指出,DeepSeek-R1及中國本土AI模型的突破性進展,正在重塑科技產(chǎn)業(yè)敘事邏輯。
DeepSeek發(fā)布
2月18日,DeepSeek官方在海外社交平臺X上發(fā)布了一篇純技術(shù)論文報告,論文主要內(nèi)容是關(guān)于NSA(Natively Sparse Attention,原生稀疏注意力),官方介紹這是一種用于超快速長文本訓(xùn)練與推理的、硬件對齊且可原生訓(xùn)練的稀疏注意力機制,用于超快速的長上下文訓(xùn)練和推理。
校對:趙燕