完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > gpu
圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上圖像運算工作的微處理器。
文章:4682個 瀏覽:131176次 帖子:301個
同一主機內(nèi)GPU之間的通信:通過NVLink技術(shù),雙向帶寬達(dá)到600GB/s,單向帶寬達(dá)到300GB/s。
2024-04-07 標(biāo)簽:數(shù)據(jù)傳輸NVIDIAgpu 2738 0
大模型訓(xùn)練如何應(yīng)對GPU萬卡互聯(lián)難題
為了增強對訓(xùn)練穩(wěn)定性和性能的監(jiān)控,開發(fā)了一個精度達(dá)到毫秒級的監(jiān)控系統(tǒng)。采用不同級別的監(jiān)控來跟蹤各種指標(biāo)。
2024-04-07 標(biāo)簽:gpu數(shù)據(jù)中心人工智能 971 0
機器學(xué)習(xí)(ML)推理主要計算之存內(nèi)計算芯片
機器學(xué)習(xí)(ML)應(yīng)用已經(jīng)在汽車、醫(yī)療保健、金融和技術(shù)等各個領(lǐng)域變得無處不在。這導(dǎo)致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
2024-04-07 標(biāo)簽:存儲器神經(jīng)網(wǎng)絡(luò)gpu 1848 2
RISC-V芯片新突破:CPU與GPU一體化核心設(shè)計
X-Silicon 的芯片與其他架構(gòu)不同,其設(shè)計將 CPU 和 GPU 的功能結(jié)合到單核架構(gòu)中。這與 Intel 和 AMD 的典型設(shè)計不同,后者有獨立...
鴻蒙OS元服務(wù)開發(fā):【W(wǎng)ebGL網(wǎng)頁圖形庫開發(fā)概述】
WebGL的全稱為Web Graphic Library(網(wǎng)頁圖形庫),主要用于交互式渲染2D圖形和3D圖形。目前HarmonyOS中使用的WebGL是...
字節(jié)跳動攻克GPU萬卡互聯(lián)技術(shù)突破與解決方案
在分布式訓(xùn)練中大規(guī)模使用默認(rèn)的DCQCN協(xié)議時,all-to-all通信可能會導(dǎo)致?lián)砣蚉FC級別的提高。過度使用PFC可能會導(dǎo)致頭部阻塞(HoL),從...
2024-04-01 標(biāo)簽:gpu人工智能網(wǎng)絡(luò)拓?fù)?/a> 1328 0
以傳統(tǒng)三層架構(gòu)到葉脊架構(gòu)的轉(zhuǎn)變?yōu)槔~脊網(wǎng)絡(luò)架構(gòu)下,光模塊數(shù)量提升最高可達(dá)到數(shù)十倍。
深度學(xué)習(xí)是一種技術(shù),它使用一種稱為梯度反向傳播的優(yōu)化技術(shù)來生成“程序”(也稱為“神經(jīng)網(wǎng)絡(luò)”),就像上面故事中學(xué)者學(xué)生編寫的那些程序一樣。
2024-03-31 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)gpu人工智能 605 0
深度學(xué)習(xí)生成對抗網(wǎng)絡(luò)(GAN)全解析
GANs真正的能力來源于它們遵循的對抗訓(xùn)練模式。生成器的權(quán)重是基于判別器的損失所學(xué)習(xí)到的。因此,生成器被它生成的圖像所推動著進行訓(xùn)練,很難知道生成的圖像...
AIGC大模型對網(wǎng)絡(luò)的五大核心需求解析
AI 應(yīng)用計算量呈幾何級數(shù)增長,算法模型向巨量化發(fā)展,人工智能模型參數(shù)在過去十年增長了十萬倍,當(dāng)前AI超大模型的參數(shù)目前已經(jīng)達(dá)到了千億~萬億的級別。
FPGA(現(xiàn)場可編程門陣列)和GPU(圖形處理器)在多個方面存在顯著的區(qū)別。
在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會產(chǎn)生較大延時,...
2024-03-27 標(biāo)簽:cpu數(shù)據(jù)傳輸NVIDIA 5787 0
英偉達(dá) DGX 服務(wù)器內(nèi)部細(xì)節(jié)詳解
在機架的最頂部,我們發(fā)現(xiàn)了幾個 52 端口 Spectrum 交換機 — 48 個千兆位 RJ45 和四個 QSFP28 100Gbps 聚合端口。
超算網(wǎng)絡(luò)中的主流拓?fù)浼軜?gòu)
傳統(tǒng)的樹形網(wǎng)絡(luò)拓?fù)渲?,帶寬是逐層收斂的,樹根處的網(wǎng)絡(luò)帶寬要遠(yuǎn)小于各個葉子處所有帶寬的總和。而Fat-Tree則更像是真實的樹,越到樹根,枝干越粗,即:從...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |