日韩国产一区二区三区,在线观看日本一区,麻豆一二三区,九九热免费视频

突然火爆全網(wǎng)!中國“神秘力量”震動美國科技圈

  發(fā)布時間:2025-02-05 16:46:32   作者:玩站小弟   我要評論
近日,國產(chǎn)AI DeepSeek在中國、美國的科技圈受到廣泛關注,甚至被認為是大模型行業(yè)的最大“黑馬”,在外網(wǎng),DeepSeek被不少人稱為“神秘的東方力量”。1月27日,DeepSeek應用登頂蘋果 。

  近日,神秘力量國產(chǎn)AI DeepSeek在中國、火爆美國的全網(wǎng)圈科技圈受到廣泛關注,甚至被認為是中國震動大模型行業(yè)的最大“黑馬”,在外網(wǎng),美國DeepSeek被不少人稱為“神秘的科技東方力量”。

  1月27日,神秘力量DeepSeek應用登頂蘋果美國地區(qū)應用商店免費APP下載排行榜,火爆在美區(qū)下載榜上超越了ChatGPT。全網(wǎng)圈同日,中國震動蘋果中國區(qū)應用商店免費榜顯示,美國DeepSeek成為中國區(qū)第一??萍?/p>蘋果美國區(qū)應用商店蘋果美國區(qū)應用商店蘋果APP Store中國區(qū)免費榜蘋果APP Store中國區(qū)免費榜

  1月27日

  相關微博熱搜刷屏

  游戲科學創(chuàng)始人、CEO,火爆《黑神話:悟空》制作人馮驥評價DeepSeek:可能是全網(wǎng)圈個國運級別的科技成果。

  DeepSeek是啥?

  DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進的大語言模型(LLM)和相關技術。

  去年12月DeepSeek-V3發(fā)布后,AI數(shù)據(jù)服務公司Scale AI創(chuàng)始人Alexander Wang就發(fā)帖稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓?!爱斆绹菹r,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”

  不到一個月之后,今年1月20日,DeepSeek正式開源R1推理模型。

  據(jù)DeepSeek介紹,其最新發(fā)布的模型DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。

  這一模型發(fā)布后,引發(fā)了海外AI圈眾多科技大佬的討論。例如,英偉達高級研究科學家Jim Fan就在個人社交平臺上公開發(fā)表推文表示:“我們正身處這樣一個歷史時刻:一家非美國公司正在延續(xù)OpenAI最初的使命——通過真正開放的前沿研究賦能全人類??此撇缓铣@?,但最有趣的結(jié)局往往最可能成真?!?/p>圖源:證券時報圖源:證券時報

  DeepSeek為何突然爆火?

  26日,DeepSeek出現(xiàn)了短時閃崩現(xiàn)象。不少網(wǎng)友反映,使用時遇到 “服務器繁忙” 的提示。

  對此,DeepSeek回應稱,當天下午確實出現(xiàn)了局部服務波動,但問題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發(fā)需求。不過,官方狀態(tài)頁并未將這一事件標記為事故。

  據(jù)了解,此前DeepSeek在美區(qū)榜單的排名并無特別突出表現(xiàn),處于穩(wěn)步上升階段,但未進入前十。此次突然躥升,與其近期一系列突出表現(xiàn)有直接關系。

  據(jù)廣州日報報道,“DeepSeek爆火的原因主要可以歸結(jié)為兩點:性能和成本?!彼_摩耶云科技集團首席經(jīng)濟學家鄭磊告訴記者。DeepSeek解釋稱,R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。這種卓越的性能不僅吸引了科技界的廣泛關注,也讓投資界看到了其巨大的商業(yè)潛力。

  更為關注的是,DeepSeek R1真正與眾不同之處在于它的成本——或者說成本很低。DeepSeek的R1的預訓練費用只有557.6萬美元,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。同時,DeepSeek公布了API的定價,每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個收費大約是OpenAI o1運行成本的三十分之一,也因此,DeepSeek被稱為AI界的“拼多多”。

  鄭磊直言,DeepSeek對硬件市場產(chǎn)生了重大影響,因為它可能會降低人工智能模型的硬件成本,從而推動人工智能技術的發(fā)展。

  團隊不到140人,都來自國內(nèi)頂尖高校

  DeepSeek之所以能取得這些創(chuàng)新并非一日之功,而是“孵化”數(shù)年之久,長期謀劃后的結(jié)果。DeepSeek創(chuàng)始人梁文鋒也是頭部量化私募幻方量化的創(chuàng)始人。Deepseek充分利用了其幻方量化積累的資金、數(shù)據(jù)和卡。梁文鋒本科、研究生畢業(yè)于浙江大學,擁有信息與電子工程學系本科和碩士學位。2008年起,他開始帶領團隊使用機器學習等技術探索全自動量化交易。2023年7月,DeepSeek正式成立,進軍通用人工智能領域,至今從未對外融資。

  此前,OpenAI前政策主管、Anthropic聯(lián)合創(chuàng)始人Jack Clark認為DeepSeek雇用了“一批高深莫測的奇才”,對此,梁文峰在接受自媒體采訪時曾透露過,并沒有什么高深莫測的奇才,都是來自Top高校的畢業(yè)生、沒畢業(yè)的博四、博五實習生,還有一些畢業(yè)才幾年的年輕人。從目前已有的媒體公開報道中可以看出,DeepSeek團隊最大的特點是名校、年輕,即使是團隊Leader級別,年紀也多在35歲以下。不到140人的團隊,工程師和研發(fā)人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內(nèi)頂尖高校,工作時間都不長。

  番外

  專家解讀:中國新AI大模型為何火爆全網(wǎng)

  近日,一個名為DeepSeek(深度求索)的中國AI初創(chuàng)公司成為國內(nèi)外人工智能(AI)大模型領域熱議話題。在不到30天的時間里,DeepSeek先后發(fā)布了DeepSeek-V3和DeepSeek-R1兩款大模型,其成本與動輒數(shù)億甚至上百億美元的國外大模型項目相比堪稱低廉,而性能與國外頂尖大模型相當。同時,DeepSeek與外國大模型巨頭閉源的路徑不同,采用開源模式。中國這家公司的發(fā)展模式與成果讓硅谷高度關注,多家西方主流媒體紛紛發(fā)文感嘆“中國AI模型震驚硅谷”,甚至引發(fā)了國內(nèi)外多家知名廠商與機構(gòu)連夜嘗試復現(xiàn)DeepSeek成果的“熱潮”。DeepSeek的發(fā)展具有哪些特點?是否對國產(chǎn)大模型的發(fā)展路徑以及創(chuàng)新思路帶來一些啟示?《環(huán)球時報》記者26日采訪了多位人工智能領域的專家。

  “OpenAI o1經(jīng)濟實惠且開放的競爭對手”

  DeepSeek公司本月20日發(fā)布大模型R1,并表示“在數(shù)學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版”,引發(fā)外媒特別是美國媒體高度關注這家中國公司及其最新大模型成果。

  “中國便宜、開放的人工智能模型 DeepSeek讓科學家興奮不已?!薄蹲匀弧冯s志24日以此為題稱,中國研制的大語言模型DeepSeek-R1令科學家們興奮不已,它被認為是OpenAI o1等“推理”模型的經(jīng)濟實惠且開放的競爭對手。

  《紐約時報》24日以“中國人工智能初創(chuàng)企業(yè)DeepSeek如何與硅谷巨頭競爭”為題報道稱,能做到上述成績本已是一個里程碑,但DeepSeek-V3大模型背后的團隊描述了一個更大的進步。他們在訓練該系統(tǒng)時只用了先進人工智能公司所用的高度專業(yè)化計算機芯片的一小部分。中國工程師稱,他們只花了約600萬美元以及約2000個英偉達專用芯片就完成了新模型的訓練,無論資金以及芯片使用規(guī)模都遠低于世界領先的人工智能公司。

  “這不是中國追趕美國的問題,而是開源追趕閉源的問題”

  DeepSeek備受關注,除了性價比超高,還有另一個原因:開源。連日來,網(wǎng)絡上已經(jīng)出現(xiàn)了一波復現(xiàn)DeepSeek的熱潮。加州大學伯克利分校、香港科技大學、知名人工智能公司HuggingFace等紛紛成功復現(xiàn),只用強化學習,沒有監(jiān)督微調(diào),甚至只用幾十美元的成本就能完成復現(xiàn)。

  美國紅迪網(wǎng)25日稱,中國DeepSeek的模型是開源的,這是令人興奮的真正原因?;旧希麄儗⒅圃爝@些東西的知識免費提供給全世界,確保沒有人能夠真正壟斷它。中國公司基本上與美國公司的做法完全相反。你能看到OpenAI、Anthropic或谷歌開源任何強大的模型嗎?到目前為止,我們從他們那里得到的只是皮毛。Meta是唯一一家對開源大模型做出重大貢獻的西方大公司,但他們將來可能不會開源其最好的模型。被譽為“深度學習三巨頭”之一的Yann LeCun(楊立昆)在社交平臺X上表示,這不是中國追趕美國的問題,而是開源追趕閉源的問題。

  北京郵電大學人機交互與認知工程實驗室主任劉偉在接受《環(huán)球時報》記者采訪時表示,大模型三大核心要素是數(shù)據(jù)、算法、算力,Deepseek使用較少的數(shù)據(jù)、較少的算力,通過算法的優(yōu)化實現(xiàn)了與國外知名大模型等效甚至更優(yōu)的效果,這是非常值得肯定的。同時還要看到它是開源的,可以供全球希望使用這一大模型的用戶來使用和復現(xiàn)。

  清華大學新聞學院、人工智能學院教授沈陽26日對《環(huán)球時報》記者表示,DeepSeek的大模型是全球開源大模型當中相當優(yōu)秀的一款,是混合使用多種先進技術實現(xiàn)超越傳統(tǒng)預訓練技術的創(chuàng)新突破。他結(jié)合自身使用的感受談了這款大模型的幾個優(yōu)點。一是它把目前提升AI大模型能力的方法進行了工程上的微創(chuàng)新組合。二是DeepSeek公布了相關論文,整個過程可以讓大家去復現(xiàn),這就是開源的力量。三是DeepSeek的推理過程,有自身的創(chuàng)新。沈陽作為AI領域的研究者,使用AI超過3萬次,他認為,DeepSeek跟美國的AI相比,還有很多中國元素在里面,如中國網(wǎng)絡當中的一些熱詞。

  提升推理能力

  對于Deepseek的發(fā)展模式為國內(nèi)大模型發(fā)展以及創(chuàng)新提供了怎樣的重要啟示,劉偉認為,“創(chuàng)新不是規(guī)劃出來的,需要市場、專業(yè)機構(gòu)通過長時間的研究來另辟蹊徑,尤其是一些長期關注垂直領域的商業(yè)公司可以通過對技術路徑的反思、對市場發(fā)展的嗅覺,來找到更好的創(chuàng)新點。OpenAI最初的發(fā)展過程也是這樣,并不是美國官方與科技巨頭砸重金規(guī)劃出來的?!?/p>

  日前,OpenAI、軟銀等公司公布了“星際之門”計劃,要在4年中砸5000億美元來加速美國人工智能的發(fā)展。劉偉強調(diào),這種集中人力、財力、物力,再給予政策傾斜的發(fā)展路徑,在未來研究方向與研究結(jié)果方面都存在一定的不確定性?!斑€是要鼓勵國內(nèi)更多商業(yè)公司、科研院所聚焦自身的研究領域,找到適合自己的創(chuàng)新與發(fā)展路徑?!?/p>

  沈陽表示,在AI發(fā)展歷史中,新的突破往往是由不顯眼的工程創(chuàng)新與科學探索共同驅(qū)動的。這種趨勢在DeepSeek的成果中得到了深刻體現(xiàn),它不僅突破了傳統(tǒng)的訓練方式,也為推理能力的提升帶來了全新的視角?!氨M管它的成就尚處于一個階段性水平,但其工程貢獻和理論創(chuàng)新已經(jīng)為未來的AI發(fā)展奠定了重要基礎。”沈陽認為,DeepSeek團隊在基礎模型預訓練方面的貢獻,不僅是在技術層面上的突破,更在于其工程方法的精細與高效。DeepSeek的這種工程創(chuàng)新,標志著AI模型訓練的一個全新階段,這不僅降低了開發(fā)成本,也為其他公司提供了可借鑒的路徑。同時,DeepSeek的核心創(chuàng)新還體現(xiàn)在推理能力的提升上,尤其是通過相關算法創(chuàng)新來推動模型的自然推理能力,證明了AI領域的一種潛力——無須大量昂貴的思維鏈標注,模型依然能夠涌現(xiàn)出推理能力。

  沈陽認為,DeepSeek的成功也讓我們看到了未來AI產(chǎn)業(yè)的發(fā)展方向:更多的開源創(chuàng)新、硬件與軟件的深度協(xié)同,以及對模型開發(fā)成本與推理能力的不斷優(yōu)化。同時,我們也必須看到,DeepSeek雖然取得了顯著的階段性成果,要想在未來發(fā)展道路上實現(xiàn)進一步突破,仍然需要面對許多深層次的挑戰(zhàn),例如需要更多的原創(chuàng)性訓練數(shù)據(jù)和算法創(chuàng)新。

  來源:環(huán)球時報-環(huán)球網(wǎng)記者 劉揚、環(huán)球時報-環(huán)球網(wǎng)特約記者 任重、中國新聞社綜合自DeepSeek官方微信 澎湃新聞 每日經(jīng)濟新聞 界面新聞 財聯(lián)社 廣州日報 證券時報等

  • Tag:

相關文章

  • 美聯(lián)儲開年“按兵不動”,下一次降息何時來?

    1月29日,美國聯(lián)邦儲備委員會主席鮑威爾在華盛頓出席記者會。新華社 圖2025年美聯(lián)儲首次議息會議結(jié)果當?shù)貢r間29日出爐,將聯(lián)邦基金利率目標區(qū)間維持在4.25%至4.5%之間不變,符合市場普遍預期。這
    2025-02-05
  • 美股三大指數(shù)結(jié)束多日連跌 特斯拉漲超8%

    證券時報e公司訊,1月3日,美股高開高走,三大指數(shù)集體收漲。納指漲1.77%,標普500指數(shù)漲1.26%,道指漲0.8%。其中,納指、標普500指數(shù)終結(jié)日線5連跌,道指終結(jié)日線4連跌。特斯拉漲超8%,
    2025-02-05
  • 哈薩克斯坦近百輛汽車連環(huán)相撞事故致12人受傷

    當?shù)貢r間1月3日,哈薩克斯坦公路管理局運營公司KazAutoZhol發(fā)布消息稱,當天發(fā)生的汽車連環(huán)相撞事故造成12人受傷。哈薩克斯坦緊急情況部表示,已將事故現(xiàn)場包括8名兒童在內(nèi)的71人撤離至取暖點,并
    2025-02-05
  • 特朗普:將施行美國歷史上規(guī)模最大的減稅措施

    來源:財聯(lián)社財聯(lián)社1月6日電,特朗普在X上表示,“美國國會議員們正在著手制定一項強有力的法案。我們必須確保我們的邊境安全,開發(fā)美國能源,并更新特朗普稅收減免措施,這是歷史上規(guī)模最大的減稅措施,我們將實
    2025-02-05
  • “毛孩子經(jīng)濟”春節(jié)火了 你家萌寵這個節(jié)怎么過?

    春節(jié)作為中國傳統(tǒng)的重要節(jié)日,歷來是消費市場的高峰期。而近年來,隨著寵物產(chǎn)業(yè)的不斷發(fā)展,春節(jié)寵物消費市場也呈現(xiàn)出了新的風尚和趨勢——寵物“年夜飯”“壓歲糧”等節(jié)日食品推出,寵物寫真照的拍攝和分享也成為春
    2025-02-05
  • 央行:實施適度寬松的貨幣政策 擇機降準降息

    來源:財聯(lián)社財聯(lián)社1月4日電,2025年中國人民銀行工作會議1月3日-4日召開。會議強調(diào),實施適度寬松的貨幣政策,為經(jīng)濟穩(wěn)定增長創(chuàng)造適宜的貨幣金融環(huán)境。綜合運用多種貨幣政策工具,根據(jù)國內(nèi)外經(jīng)濟金融形勢
    2025-02-05

最新評論