【文/觀察者網(wǎng) 呂棟】
(相關(guān)資料圖)
到目前為止,如果要評選2023年最熱的概念,非AI大模型莫屬。這輪由ChatGPT引爆的技術(shù)熱潮,經(jīng)過一段時間的發(fā)酵,已在國內(nèi)迎來爆發(fā)期,互聯(lián)網(wǎng)大廠紛紛躬身入局。人們也似乎越來越認(rèn)識到,大模型是通往通用人工智能(AGI)最明確的路徑。
在此背景下,商湯科技也厚積薄發(fā),于近期正式推出了自研AI大模型體系“日日新SenseNova”,其中不僅包含語言大模型,還擁有AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場景/小物體生成等一系列生成式AI模型及應(yīng)用。
在這輪AI大模型浪潮中,由于ChatGPT率先出圈,不少人認(rèn)為,中國企業(yè)只是隨波逐流,跟風(fēng)模仿,甚至只是概念炒作。但實(shí)際上,想要推出一個經(jīng)得起考驗(yàn)的大模型,絕不可能一蹴而就。國內(nèi)已推出大模型的企業(yè)中,均有著長期規(guī)劃,商湯自然也早有準(zhǔn)備。
在算力、數(shù)據(jù)和應(yīng)用場景等大模型核心能力上,商湯科技已處于國內(nèi)B端第一梯隊(duì)。其前瞻布局的AI大裝置SenseCore,擁有2.7萬塊GPU,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智算平臺之一,也是商湯自研大模型體系的關(guān)鍵基礎(chǔ)設(shè)施。
基于“大模型+大算力”雙輪布局,無論在當(dāng)下還是未來,商湯科技都對中國AI產(chǎn)業(yè)界具有重要的戰(zhàn)略價值和意義。
千億參數(shù)大模型,驚艷亮相
4月10日,在距上海市中心近百公里的臨港,商湯科技在自己的智算中心舉辦技術(shù)交流日,現(xiàn)場投資者、分析師、記者等人流攢動,座無虛席。在大模型持續(xù)爆火幾個月后,大家依然非常期待這個人工智能領(lǐng)域的頭部企業(yè)能拿出更亮眼的作品。
商湯科技不負(fù)眾望,董事長兼CEO徐立登場后,正式發(fā)布了國內(nèi)首個大模型體系——“日日新SenseNova”。該名稱出自《禮記·大學(xué)》中湯之《盤銘》:茍日新、日日新、又日新。這個名字也承載了商湯對大模型快速迭代、走向通用人工智能(AGI)的希冀。
由于ChatGPT持續(xù)火熱,加之百度和阿里相繼推出“文心一言”和“通義千問”,語言類大模型為人所熟知。在最新的大模型體系中,商湯也推出了自研語言大模型“商量SenseChat”。
與之前語音交互、圖像識別等AI應(yīng)用類似,語言大模型也被用于人機(jī)交互,人們能通過文字和機(jī)器對話,獲得內(nèi)容。但語言大模型的突破之處在于,它是真正在嘗試?yán)斫馊藗兊南敕ǎ⒒诖髷?shù)據(jù)集生成內(nèi)容,而不是簡單對比和匹配,這意味著AI擁有了一定的自學(xué)習(xí)能力。

















營業(yè)執(zhí)照公示信息