完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個AI 界追逐的寵兒,AI大模型有效果好、泛化性強、研發(fā)流程標(biāo)準化程度高等特點。
文章:3095個 瀏覽:4056次 帖子:20個
對話文本數(shù)據(jù)是培養(yǎng)大模型的智能與交流之源
對話文本數(shù)據(jù),作為人類交流的生動表現(xiàn),正成為訓(xùn)練大型模型的寶貴資源。這些數(shù)據(jù)不僅蘊含了豐富的語言特點和人類交流方式,更在模型訓(xùn)練中發(fā)揮著重要的意義,從而...
2023-08-14 標(biāo)簽:人工智能深度學(xué)習(xí)大模型 859 0
篇論文主要研究了大型語言模型(LLMs)中的一個現(xiàn)象,即在模型的隱藏狀態(tài)中存在極少數(shù)激活值(activations)遠大于其他激活值的情況,這些被稱為“...
2024-03-01 標(biāo)簽:大模型 850 0
Intel OpenVINO? Day0 實現(xiàn)阿里通義 Qwen3 快速部署
本文將以 Qwen3-8B 為例,介紹如何利用 OpenVINO 的 Python API 在英特爾平臺(GPU, NPU)Qwen3 系列模型。
自然語言處理領(lǐng)域存在著一個非常有趣的現(xiàn)象:在多語言模型中,不同的語言之間似乎存在著一種隱含的對齊關(guān)系。
2024-02-20 標(biāo)簽:機器學(xué)習(xí)自然語言處理大模型 841 0
背景: 目前,大模型的技術(shù)應(yīng)用已經(jīng)遍地開花。最快的應(yīng)用方式無非是利用自有垂直領(lǐng)域的數(shù)據(jù)進行模型微調(diào)。chatglm2-6b在國內(nèi)開源的大模型上,效果比較...
LLaMA2上下文長度暴漲至100萬tokens,只需調(diào)整1個超參數(shù)
目前的Transformer位置編碼方法,有絕對位置編碼(將位置信息融入到輸入)、相對位置編碼(將位置信息寫入attention分數(shù)計算)和旋轉(zhuǎn)位置編碼...
AI大模型終于走到了數(shù)據(jù)爭奪戰(zhàn)
數(shù)據(jù)標(biāo)注行業(yè)亟待升級
2023-09-04 標(biāo)簽:AI數(shù)據(jù)庫GPT 793 0
LLaMA微調(diào)顯存需求減半,清華提出4比特優(yōu)化器
從 GPT-3,Gopher 到 LLaMA,大模型有更好的性能已成為業(yè)界的共識。但相比之下,單個 GPU 的顯存大小卻增長緩慢,這讓顯存成為了大模型訓(xùn)...
聽圖森CTO王乃巖淺談從L2到L4商用車自動駕駛中的規(guī)?;?、可靠性與成本
算法冗余:針對單點算法失效的問題,圖森未來將整車運行的算法分成兩大類,即Data driven算法和Principle based算法;Data dri...
在傳統(tǒng)“小”模型方法中,需要對訓(xùn)練數(shù)據(jù)進行構(gòu)建,例如訓(xùn)練一個分類模型,以便將用戶的問題分類為不同的意圖。同樣,回答用戶問題的方式也需要模型的處理,因為售...
本文總結(jié)了大模型領(lǐng)域常用的近100個名詞解釋,并按照模型架構(gòu)與基礎(chǔ)概念,訓(xùn)練方法與技術(shù),模型優(yōu)化與壓縮,推理與應(yīng)用,計算與性能優(yōu)化,數(shù)據(jù)與標(biāo)簽,模型評估...
2025-02-19 標(biāo)簽:機器學(xué)習(xí)深度學(xué)習(xí)大模型 778 0
進一步,為了支持這一研究領(lǐng)域的模型訓(xùn)練和評估,研究團隊在LVIS數(shù)據(jù)集的基礎(chǔ)之上,借助GPT-4V構(gòu)建了一個面向多目標(biāo)推理分割場景的數(shù)據(jù)集MUSE,它包...
shippers 和 sources 是收集的原始日志組件,承接著原始日志(log文件日志、系統(tǒng)日志、網(wǎng)絡(luò)日志等)采集和發(fā)送,其中 Elastic Ag...
探索ICLR‘24 Spotlight中的首個十億級別3D通用大模型
Uni3D在少樣本點云部件分割任務(wù)上也展示出了卓越的性能。下表結(jié)果顯示,在各種實驗條件下,Uni3D的性能都明顯優(yōu)于Point-BERT等基線方法。
兆芯推出基于KH-40000的深度學(xué)習(xí)訓(xùn)推一體化解決方案
該方案支持以兆芯開勝KH-40000系列服務(wù)器處理器及算能自研算力產(chǎn)品(包括算能TPU處理器、推理微服務(wù)器、智算卡等)為硬件底座
在RTX 4090被限制的時代下,讓大模型使用RLHF更高效的方法來了
今年,以 ChatGPT 為首的大語言模型(Large Language Models, LLMs) 在各個方面大放光彩,由此引發(fā)了學(xué)術(shù)界和商業(yè)界對 G...
基于Tansformer架構(gòu)的ChatGPT原理解析
ChatGPT模型發(fā)布后,因其流暢的對話表達、極強的上下文存儲、豐富的知識創(chuàng)作及其全面解決問題的能力而風(fēng)靡全球,刷新了大眾對人工智能的認知。提示學(xué)習(xí)(P...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |