-----头部结束------------------

尊龙凯时官网app入口消息称英伟达针对中国区改良版H20在LLM推理中比H100更快

2024-01-25 22:30:25

  苹果Vision Pro预售火爆:18分钟售罄 开订1小时交付期已被推迟至3月中旬

  蚂蚁自研数据库OceanBase宣布开源 300万行核心代码向社区开放

  每日头条、业界资讯业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

  特斯拉Cybertruck全国巡展即将开启 届时将亮相上海、北京等8大城市

  IT之家 11 月 9 日消息,国外科技媒体 Semianalysis 近日发布付费文章,表示三款中国版 AI 芯片之一,在 LLM 推理中,要比 H100 快 20% 以上。

  消息称英伟达预计最快将于 11 月 16 号之后公布,国内厂商最快将在这几天拿到样品◆◆。

  蚂蚁链发布BTN:可将区块链网络吞吐量提升186% 带宽成本降低80%

  这篇付费文章中详细介绍了英伟达 H20尊龙凯时官网app入口、L20 和 L2 的详细信息,涉及 FLOPS 数据、NVLink 带宽、功耗、内存带宽、内存容量、芯片尺寸等。

  该文章还预测了英伟达 2024 和 2025 财年业绩,此前消息称由于美国不断地加码,英伟达丢失了超过价值 50 亿美元的订单,而借助这些中国专供 GPU,会改善英伟达的业绩表现。

  青云QingCloud EHPC 打造即买即用的全流程SaaS化超算服务

  OpenAI CEO本周将前往韩国 预计同SK集团会长和三星半导体主管会面

  报道中还提及的一点是,英伟达 HGX H20 采用 HGX 格式,采用台积电的 CoWoS 封装。而另外两款芯片主要基于 Ada,面向游戏领域,不需要复杂的封装。

  IT之家此前报道,英伟达即将推出 HGX H20、L20 PCle 和 L2 PCle 接口芯片,这三款芯片均基于英伟达 H100 改良而来,官方已经生产出这些 GPU 样品,并预估下月投入批量生产。

  Gartner:2023年全球半导体收入减少11% 英特尔收入超越三星登顶

  更为重要的是,在这三款中国版 GPU 中,其中一款(并未明确是哪款,但应该是指 H20)在 LLM 推理中要比 H100 快 20%,而且性能接近于英伟达明年年初发布的新款 GPU◆。

  特斯拉Cybertruck全国巡展即将开启 届时将亮相上海◆◆、北京等8大城市

        if (window.jQuery) { (function($){ default_switch(); //简体繁体互换 function default_switch() { var home_lang = getCookie('home_lang'); if (home_lang == '') { home_lang = 'cn'; } if ($.inArray(home_lang, ['zh','cn'])) { var obj = $('#jquerys2t_1573822909'); var isSimplified = getCookie('jquerys2t_1573822909'); if ('cn' == isSimplified) { $('body').t2s(); $(obj).text('繁體'); } else if ('zh' == isSimplified) { $('body').s2t(); $(obj).text('简体'); } } } //简体繁体互换 $('#jquerys2t_1573822909').click(function(){ var obj = this; var isSimplified = getCookie('jquerys2t_1573822909'); if ('' == isSimplified || 'cn' == isSimplified) { $('body').s2t(); // 简体转繁体 setCookie('jquerys2t_1573822909', 'zh'); $(obj).text('简体'); } else { $('body').t2s(); // 繁体转简体 setCookie('jquerys2t_1573822909', 'cn'); $(obj).text('繁體'); } }); })(jQuery); }