万年历 购物 网址 日历 小说 | 三峰软件 天天财富 小游戏 视频推荐 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页  日历2023  日历2024  日历2025  日历知识  | 每日头条  视频推荐  数码知识 两性话题 情感天地 心理咨询 旅游天地 | 明星娱乐 电视剧  职场天地  体育  娱乐 
日历软件  煮酒论史  历史 中国历史 世界历史 春秋战国 三国 唐朝 宋朝 明朝 清朝 哲学 厚黑学 心理学 | 文库大全  文库分类 
电影票房 娱乐圈 娱乐 弱智 火研 中华城市 仙家 六爻 佛门 风水 钓鱼 双色球 戒色 航空母舰 网球 乒乓球 足球 nba 象棋 体操
    
  知识库 -> 数码 -> 如何评价 龙芯老总胡伟武的爆料:下一代八核处理器将达到英特尔 12 代酷睿 i5 或 i7 水平? -> 正文阅读

[数码]如何评价 龙芯老总胡伟武的爆料:下一代八核处理器将达到英特尔 12 代酷睿 i5 或 i7 水平?

[收藏本文] 【下载本文】
龙芯中科去年 11 月推出了 龙芯 3A6000 国产桌面处理器,采用 14 纳米工艺,据官方实测,2.5GHz 龙芯 3A6000 性能可达英特尔 …
最近改了一下我写的vscode的ebuild,在3A6000上编译出了electron 28和vscode。




编译Electorn 28耗时10小时15分钟,主要负载是clang++多线程编译和ld.lld的多线程LTO和链接。
编译vscode 1.89耗时1小时9分钟,主要负载是nodejs单线程运行的ts转译和体积优化。
与AMD 7945Hx对比:




因为笔记本有3档功耗墙可以调,因此时间略有浮动,但大体上Electron为1小时15分钟,vscode为25分钟。


之前用Intel 9900t的时候,Electron编译时间约为2小时30分钟


更早的时候用着一台单热管压Intel 10810U的笔记本,性能非常不稳定


有一些时间短的是命中了ccache缓存,只需要运行链接。全量编译的时间在6-10个小时,取决于有没有对着空调吹。
10810U是末代14nm,古老的Skylake微架构,标定的基频只有1.10 GHz,标定的睿频却高达4.90 GHz,6C12T却只有25w的最大TDP。总之这个机器平常满载的频率和3A6000的2.6GHz差不多,过热就会变成2.2GHz,贴纸上的4.9GHz属于做梦。
考虑到3A6000是4C8T,3A6000的单核性能是超过了10810U的。但是龙芯是台式机CPU,和低压笔记本CPU对比是不公平的,要想超过12代i5(比如6C12T的12600),用4C8T的规模是不可能超过的,规模(比如8C16T)、架构(LA864)、总线(DDR5/龙链)都要改进才能稳胜。
先捉个虫:
采用 14 纳米工艺
之前大多数报道都是12nm,而且拆到的dieshot来看,3A6000和3A5000使用的工艺有较多相同特征(不同家的工艺通常反光情况有差异):


左:3A6000 右:3C5000L/3A5000
针对这个说法:
对于下一代处理器产品,中科院计算技术研究所研究员、龙芯中科创始人、董事长胡伟武近日接受新华社采访时透露,龙芯下一代产品将达到英特尔 12 代酷睿处理器水平,而且不是 i3,而是 i5 或 i7。
下一代核心是LA864,意思分别是龙指令集(LoongArch,龙指令集架构)、8发射设计、64位的微架构。
那么,i5或者i7是什么水平呢?正好我搜到了一份12700的spec06跑分:
九州原创:Intel Core i7-12700测试SPEC CPU 2006结果5 赞同 · 1 评论文章


我们可以看到,P核心的spec06int是71.9分,E核心是40.3分,显然LA864去对标E核心那太看不起龙芯了,那么对标的分数就是P核心。
对于龙芯来说,想要同编译flag下达到12700的性能,那需要24分/GHz、3GHz。24分/GHz是苹果都难以达到的高度。如果想要在3GHz达到12700的水平,24分/GHz,那么龙芯基本上就是确定性的世界第一的架构,苹果、Intel、AMD、Qcom都是落后的代名词。
那么有没有可能是龙芯经常说的“同频IPC”?也不大可能:
我看了一下测试时的CPU频率,稳定在4.71GHz上下,偶尔下降一瞬间。如果按频率4.7GHz算,单位频率性能整数15.3/GHz,浮点17.06/GHz。
如果是15.3分/GHz那龙芯3A6000已经很接近了——目前国产最强的麒麟9010所用的泰山架构是17.1分/GHz、2.3GHz。目前的龙芯3A6000不开优化14.28分/GHz、2.5GHz。同时,用一个“8发射宽架构”去打一个“6发射深架构”的同频IPC是不公平的,8发射的意思是“理想条件下每周期执行8条指令”
不过这里还有个变量,开优化的话那不同的优化flag可以有不同的高分,而且差距挺大:
  我用自己的硬盘重新安装了Loongnix系统,并自行配置参数测试了SPEC CPU 2006,单核整数性能测试的结果还不错,达到了40.1分,与龙芯公布的编译器“补课”完成前的40分相符。直接运行测试机中提供的SPEC CPU 2006,得分42.9,与公布的43.1相符。
详测龙芯3A6000——性能强到没有朋友 - 知乎 (zhihu.com)
按照Guee的测试3A6000也只有16分/GHz,直接运行测试机提供的可以到17.16分/GHz,大致可以理解为“开满优化的情况下能有17分/GHz”。
不过,Guee的测试倒是给出了LA464(3A5000)和tsv110(鲲鹏920)的成绩:


这样我们就能相对来说给出三代架构的情况:
4发射架构6发射架构8发射架构龙芯LA464LA664LA864华为tsv110tsv120tsv130(名称待定)
(麒麟9010的架构名暂时还没有定,可能是tsv121也可能是tsv130或者没给名字,本文按tsv130进行指代)
可以看出两家的架构宽度是走了相同的路线。
然后性能:
4发射架构6发射架构8发射架构龙芯10.64/GHz(guee)14.28/GHz(无优化)未发布华为10.42/GHz(guee)13.54/GHz(无优化)17.1/GHz
考虑到LA864是从LA664增加了两个解码器,这个变化和麒麟9000s到麒麟9010是一致的:9000s使用的是6发射、9010使用的是8发射,IPC提升了25%。spec06int从13.54提升到17.1分,geekbench5/6的提升幅度也是类似。
那么龙芯LA864如果能实现麒麟9000s到麒麟9010的提升,那么大概就是17.85分/GHz,这个成绩基本上是Cortex X3的水平。如果按guee的成绩去算提升,那就是20分/GHz。
如果按照20分/GHz配合3.6GHz,那就可以“达到12700性能”了。这点其实业界有先例,就是apple M1,用超过20分/GHz的性能配合3.2GHz,达到了69.38分,折合21.68分/GHz。
相比之下,“同频ipc”的标杆是苹果而非intel。对于8发射架构,“同频IPC”天然的就比6发射更高。打一个比方,intel的设计是6车厢的高铁,苹果/华为/龙芯的设计是8车厢的动车——比单次运载能力显然8车厢比6车厢有很大优势,但高铁时速350能运送更多趟。对于龙芯LA860、华为TSV130、苹果Firestorm(即苹果M1 P核心架构名)这种8发射架构,去和intel 12700这种6发射架构比同频IPC是非常不合理的。
对于一个8发射架构,在完全理想的情况下每周期执行8条指令,而6发射架构在完全理想的情况下只能执行6条指令。intel 12700和苹果m1的区别很好理解:
苹果:每次干8件事,一天干6轮——一天干48件事intel:每次干6件事,一天干8轮——一天干48件事
所以12700和m1跑分接近。
那么我们回过头来,其实就能看到一个很明显的对比:
4发射架构6发射架构8发射架构龙芯10.64/GHz(guee)14.28/GHz(无优化)未发布华为10.42/GHz(guee)13.54/GHz(无优化)17.1/GHz(无优化)
再看看时间:
4发射架构6发射架构8发射架构龙芯2022.7.23*2023.11.28未发布华为2019.1.72023.8.29**2024.4.22**
(*龙芯3A4000是GS464 MIPS芯片,也是4发射,发布于2019.12.24)
(**华为因为被制裁,未能按照自己roadmap发布。华为自己的roadmap大概是tsv120 2021年发布、tsv130 2023年发布)
龙芯虽然不能称之为“摸着华为过河”,但是我们大致可以总结出两家的规律:华为率先发布一个新架构,龙芯紧跟其后发布一个性能略微超过华为的架构,交叉领先
当然,华为分数略低于龙芯也并不都是设计水平的问题,移动端、商用化不仅仅需要性能,而且需要省面积、低功耗和安全性。苹果某款新芯片就因为安全bug的缘故关闭了一个能提升约1%ipc的特性,这种设计对于苹果这种安全性要求非常苛刻的公司来说也是存在的。
那么我们其实可以用麒麟9010来合理预估,LA864大概率是一个17.5~18分裸分的架构,略微超过华为tsv130。同时频率应该可以拉到3GHz左右,最终实现一个大概52-54分无优化总分数的设计。
那么我们可以大致预测一下在LA864之后两家的情况:大概率会拓展到10发射,小概率会拓展到12发射。原因很简单,即使intel也开始堆发射数了,苹果M4、ARM Cortex X4都是10发射。
华为会在年底发布麒麟9100,9还是10发射不确定;明年发布9110、9200,可能会到12发射。华为有可能会学些苹果,从8到9再到10这样稳步迭代,半年一更。
龙芯这边应该也会去做更宽的架构,不过预计LA864应该要到明年了,毕竟一年迭代一个架构这速度还是非常惊人的。
当然,香山、玄铁他们今年也要拿出新的6发射架构(对标3a5000),至此国产8大CPU厂商除神威,应该都能拿出总分超过40分的芯片;第一梯队龙芯、华为在冲击60分总分。
总的来说,国产架构的飞速发展是我们所有人的幸运,但也要认识到国产架构距离合适对标的国际领先水平——苹果M1,还有相当大的距离。毕竟从8发射之后,更多的发射数就真不一定能提升太多IPC了(参考ARM X3 8发射到X4 10发射,苹果M1-M3-M4的8、9、10发射,IPC收益几乎不可见)。
总的来说,扩展到8发射是“最后一次简单粗暴”,再往后的提升才是真正的深水区、硬功夫。过了8wide decode之后,加宽所带来的收益几乎为0,甚至会带来power的提升。接下来的提升方向无非是prefetch,BPU,LSU,对华为来说还有增大L3 Cache。
我们还能看到LA864相比于LA664有大幅度的提升,但这大概率是最后一次大幅度提升,预估IPC可以提升25%。但过了8wide,后面的提升会遇到苹果在M1到M4之间遇到的问题。而苹果M4相比M1的IPC提升,每代有3%就已经很不错了。其他跑分不好找,Geekbench6好找,除以频率算出来IPC:
M1MaxM2MaxM3Max7527667711.86%提升0.65%提升
当然,苹果BPU已经做到世界第一了,LSU、Prefetch也做的不错,龙芯的BPU应该还没到这个高度,所以后续的提升幅度可能可以更大一些。
最后,让我们期待一下LA864架构,LA864意味着“性能补课”基本完成,真正在规模上追上了国际一线水平。到时候我也计划买一台,表达一下对国产自研处理器内核的支持。
刚好上一款用过的处理器是12 代I7 12700F,标一下12700F的单核性能
在Fedora Linux下,采用GCC 12.1,只开O3优化,march=core-avx2,链接微软内存优化库mimalloc,SPEC 2017整数得分是9.91,浮点得分是14.1。
同样操作系统和编译器和编译选项,SPEC 2006的单核整数得分是83分,浮点没测。
Geekbench 5.4.5是2079分单核。
只说单核,多核就不说了,八大四小。Windows下各种跑分都是远远强于龙芯目前对标的10100的。Cinebench R23大概有四倍的差距吧。再说龙芯只是对标10100,又不是真能打10100,多核比10100差了32%。功耗还高50%(from极客湾)。
十二代i7是提升百分之四五十就能赶上的?先提升30%真的打平满睿频的10100再说吧。你可以说10100跑4.3G,IPC不咋地。但是人家频率比你高那么多,功耗还比你低一大截。这个根本说不过去。又不是说28纳米打十四纳米。
考虑到loongarch的生态,考虑转译性能才是真的。
考虑转译x86跑gb5,先定一个小目标 gb5 x86版单核跑到1000分。12代Linux下轻松跑到1800分,龙芯转译打个折要求1000不过分吧
结果一看3a6000跑gb5只有300分,geekbench跑高了不一定代表强,但你跑极低分一定说明极大缺陷, 对比一下鲲鹏920利用exagear转译x86能跑460 高下立判(其架构TSV110 也就是A76水平)




2024.05.18
评价不好说,建议有几个:
1.开通媒体账号,放出测试的视频2.对下一代产品的测试结果预以公布,以证明它确实有达到了12代酷睿的水平,就等着量产了
而不是你说测试,大家没看到测试内容,你说“可能”“预计”,全凭一张嘴,如果硬让我来个评价的话,那就是要勇于自我批评,杜绝下次吹牛事件。
8c16t+latx性能优化后的效果还是挺期待的
去学习了下。 龙芯是国家的安全保障。 我们很踏实,很骄傲。
但因为从底层指令集,到操作系统,到应用软件,到主板,电脑服务器整机,整个系统都是独立于现在主流的X86,ARM市场化生态之外的。 当然,中国的政府和企事业单位已经是非常大的市场了。
性能提升的消息当然非常好。说明我们的安全保障更近了一步。但这消息,应该没什么太大反响·,因为对老百姓的影响面很小。
性能接近的时候我们可以拼价格,突出性价比
[收藏本文] 【下载本文】
   数码 最新文章
为什么大型直升机都是头顶上一个大螺旋桨的
如何评价 龙芯老总胡伟武的爆料:下一代八核
想要入手一款能畅玩市面上所有游戏的游戏本
2024 年扫地机器人有哪些推荐?
iOS的墓碑机制这么厉害,为什么Windows、Li
如何看待华为发布会被指造假?
如何看待华为 Pura 70 系列超高速风驰闪拍功
碎纸机是干嘛用的,撕个纸还要用机器,真是
小米真的是为国为民吗?
华为发布 MatePad 11.5 S 平板电脑,该产品
上一篇文章      下一篇文章      查看所有文章
加:2024-05-20 21:02:17  更:2024-05-20 22:16:35 
 
娱乐生活: 电影票房 娱乐圈 娱乐 弱智 火研 中华城市 印度 仙家 六爻 佛门 风水 古钱币交流专用 钓鱼 双色球 航空母舰 网球 乒乓球 中国女排 足球 nba 中超 跑步 象棋 体操 戒色 上海男科 80后
足球: 曼城 利物浦队 托特纳姆热刺 皇家马德里 尤文图斯 罗马 拉齐奥 米兰 里昂 巴黎圣日尔曼 曼联
  网站联系: qq:121756557 email:121756557@qq.com  知识库