完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個AI 界追逐的寵兒,AI大模型有效果好、泛化性強、研發(fā)流程標準化程度高等特點。
文章:3092個 瀏覽:4050次 帖子:20個
5.5G,多出來的0.5G又是啥?為什么不直接邁向6G時代?
5.5G成為通信行業(yè)2024年開年的一大焦點。提到5.5G,多出來的0.5G又是啥?為什么不直接邁向6G時代?今天我們一探究竟!
2024-04-03 標簽:通信技術(shù)物聯(lián)網(wǎng)智能駕駛 1101 0
基于雙級優(yōu)化(BLO)的消除過擬合的微調(diào)方法
這篇論文試圖解決的問題是大型預(yù)訓(xùn)練模型在下游任務(wù)中進行微調(diào)時出現(xiàn)的過擬合問題。盡管低秩適應(yīng)(LoRA)及其變體通過學(xué)習低秩增量矩陣有效地減少了與完全微調(diào)...
2024-04-02 標簽:數(shù)據(jù)集LoRa自然語言 1109 0
拜登政府加碼對華芯片限制,AI筆記本電腦市場面臨新挑戰(zhàn)
中國商務(wù)部對此表示反對,認為美方濫用出口管制措施,破壞市場規(guī)則和國際貿(mào)易秩序。當前,各大PC廠商正積極研發(fā)AI功能的筆記本電腦,如微軟的Surface系...
字節(jié)跳動攻克GPU萬卡互聯(lián)技術(shù)突破與解決方案
在分布式訓(xùn)練中大規(guī)模使用默認的DCQCN協(xié)議時,all-to-all通信可能會導(dǎo)致?lián)砣蚉FC級別的提高。過度使用PFC可能會導(dǎo)致頭部阻塞(HoL),從...
2024-04-01 標簽:gpu人工智能網(wǎng)絡(luò)拓撲 1328 0
AIGC大模型對網(wǎng)絡(luò)的五大核心需求解析
AI 應(yīng)用計算量呈幾何級數(shù)增長,算法模型向巨量化發(fā)展,人工智能模型參數(shù)在過去十年增長了十萬倍,當前AI超大模型的參數(shù)目前已經(jīng)達到了千億~萬億的級別。
FP8在NVIDIA GPU架構(gòu)和軟件系統(tǒng)中的應(yīng)用
在深度學(xué)習和人工智能的快速發(fā)展背景下,尤其是大語言模型(Large Language Model,LLM)的蓬勃發(fā)展,模型的大小和計算復(fù)雜性不斷增加,對...
在選擇k值時,較大的值會使生成的內(nèi)容更具多樣性,但可能會生成不合理的內(nèi)容;較小的值則使生成的內(nèi)容多樣性較低,但質(zhì)量更有保證。我們可以根據(jù)任務(wù)的不同選擇合...
盤點一下史上最全大語言模型訓(xùn)練中的網(wǎng)絡(luò)技術(shù)
人工智能的基礎(chǔ)設(shè)施在大語言模型訓(xùn)練和推理過程中發(fā)揮了關(guān)鍵的作用。隨著大語言模型規(guī)模不斷增大,其對計算和通信的需求也在不斷增加。高
2024-03-27 標簽:處理器人工智能網(wǎng)絡(luò)拓撲 2512 0
這些偏見特征可能導(dǎo)致模型在沒有明確提及這些偏見的情況下,系統(tǒng)性地歪曲其推理過程,從而產(chǎn)生不忠實(unfaithful)的推理。
2024-03-22 標簽:大模型 617 0
探索推理時KV Cache的動態(tài)內(nèi)存壓縮方法
DMC通過一個決策變量(α)來有效地對輸入序列進行分段,每個段落可以獨立地決定是繼續(xù)追加還是進行累積。這允許模型在不同段落之間動態(tài)調(diào)整內(nèi)存使用。
2024-03-22 標簽:AI動態(tài)內(nèi)存DMC 1281 0
不同于上述工作從待干預(yù)模型自身抽取引導(dǎo)向量,我們意在從LLMs預(yù)訓(xùn)練過程的切片中構(gòu)建引導(dǎo)向量來干預(yù)指令微調(diào)模型(SFT Model),試圖提升指令微調(diào)模...
張宏江深度解析:大模型技術(shù)發(fā)展的八大觀察點
在大模型的發(fā)展史上,Scaling Law(規(guī)模律)發(fā)揮了核心作用,它是推動模型性能持續(xù)提升的主要動力。Scaling Law揭示了這樣一個現(xiàn)象:較小的...
2024-03-14 標簽:操作系統(tǒng)Agi自然語言處理 433 0
首先看吞吐量,看起來沒有什么違和的,在單卡能放下模型的情況下,確實是 H100 的吞吐量最高,達到 4090 的兩倍。
OpenVINO?協(xié)同Semantic Kernel:優(yōu)化大模型應(yīng)用性能新路徑
作為主要面向 RAG 任務(wù)方向的框架,Semantic Kernel 可以簡化大模型應(yīng)用開發(fā)過程,而在 RAG 任務(wù)中最常用的深度學(xué)習模型就是 Embe...
篇論文主要研究了大型語言模型(LLMs)中的一個現(xiàn)象,即在模型的隱藏狀態(tài)中存在極少數(shù)激活值(activations)遠大于其他激活值的情況,這些被稱為“...
2024-03-01 標簽:大模型 842 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |