| |
|
知识库 -> 两性话题 -> 为什么当年的 Xbox 会出现三红问题? -> 正文阅读 |
|
[两性话题]为什么当年的 Xbox 会出现三红问题? |
[收藏本文] 【下载本文】 |
为什么当年的 Xbox 会出现三红问题? 关注问题?写回答 [img_log] 游戏 Xbox 家用游戏机 为什么当年的 Xbox 会出现三红问题? |
其实散热本身不是问题,GPU温度极高,平均工作温度八九十度,但看看现在的笔记本尤其是高端轻薄本,这叫事吗? 早期一批机器的故障率据说是一年内30%左右,三年故障率超过68%。这其中可能包含其他杂项故障导致跳三红灯,甚至包括一些完全非三红的故障比如刮盘等等。360的开发和试产过程赶工严重,模块之间几乎没有调试磨合,规格互相超余度是常有的事。试产线上良率就已经一塌糊涂了,微软对此采取的态度是横竖横,边生产边改进,现在只要能亮屏能读盘的机器,全都合格。自认为回头改进完了良率能上去,拿个几百万美金保修成本换一年提前上市占据市场,血赚。 回到三红问题上来,几乎所有人都认为是GPU过热、无铅焊锡工艺不成熟导致GPU底下虚焊,并且以此为基础研发了各种土法或者很高大上的维修、改装、预防等等措施,包括毛巾捂热机器、电吹风热风枪吹、拆X架或者压显存、改水冷、重新给GPU植球等等。 水冷能在一定程度上降低温度,延缓故障发生,但都持续不了太久,最后还是会彻底坏掉。 甚至在微软内部,一开始都以为是焊接的问题,尝试在产线上边生产边改良,给GPU四角打胶固定避免移动、升级GPU散热器加强散热等等。 |
![]() |
初版90nm GPU与90nm eDRAM |
![]() |
Y2 revision,同时在芯片周围打胶加固 |
![]() |
代号Rhea的改型,eDRAM制程改进,硅片变小了 |
![]() |
GPU 65nm制程revision,这时候才基本告别三红 |
![]() |
初版双90散热布局,GPU是铝合金挤压成型散热片,而且被压在光驱下面,尺寸有限,搭配90nm问题GPU,故障率极高 |
![]() |
从精英版开始改装了GPU散热片,更换材料并且外挂热管,故障率略有下降。双65之后,芯片故障根源解决,又换回铝制散热片。 但都只是修好了这些那些杂项,故障率大头仍然没有下来,真正的RCA很长时间内一直没有破案,导致微软其实宣布花十亿美元吃进三红故障机后很长一段时间,返修率也没有下来,很多机器二进宫三进宫。 发现真正故障原因,是很后面的事情,最终官宣承认,也就在去年。 问题的确和热循环有关,但并不是芯片底下焊接失效,而是在芯片封装内部故障。等于不是主机代工厂本身的问题,而是芯片代工厂那边的生产或者设计就出现了问题,微软这里因为超规格过热运行,进一步放大了故障率。 GPU这类大芯片早已普及FCBGA。硅片上有金属焊盘,封装厂用专门工艺植上高温焊料,面朝下贴在封装基片上高温焊接,然后往芯片和基片的间隙填充封胶固化,之后才是在基片底部植低温锡球出厂发货,送到富士康伟创力这种总装厂把低温锡球融化焊接到主机电路板上制造成品游戏机。 |
![]() |
|
![]() |
问题出在基片、封胶的选型。这几个部件的膨胀系数都不一样,封胶在高温下还有软化的趋向。 封装生产的时候需要高温焊接,基板一般比硅片膨胀更多,然后焊接在这个几何状态固化,冷却下来后,基板大量收缩,就成了双金属片那样的弯曲,内部产生应力。 |
![]() |
由于360时代推广无铅焊料,温度更高,导致硅片和封装的膨胀差距更大。 基片和硅片的膨胀系数不同,热胀冷缩的时候就会产生横向应力撕扯硅片上的焊盘。 封胶和焊料的膨胀系数不同,热胀冷缩的时候视情况可能导致焊盘被垂直方向拉扯或挤压。 反复开关机横竖蹂躏,导致焊料和焊盘脱离,厉害的时候甚至把焊盘一起带下来。 |
![]() |
硅片底下封胶的弹性模量等参数也有讲究,太硬了热胀冷缩干坏芯片,太软了又会干坏焊料。随着温度变化,封胶的力学性质还会变化,所以要划定工作温度范围。 之前选择的基片和封胶,根本不适合无铅焊接封装的生产工艺与360散热不良导致的极大温差循环,大量应力聚集在封装内部焊点上,同时温度反复循环,封胶偏软的时候热胀冷缩循环对焊点以及硅片产生破坏。 这个问题之所以一开始没有发现,一是因为真的挺难想到的,二则是早期调查的证据有挺大误导性。 Xbox 360的SMC与核心错误代码表: |
![]() |
|
![]() |
|
![]() |
绝大多数机器第一次三红,报错都是E18(0102),显存读取测试失败,修好后第二次爆灯,可能出个0020(GPU RST失败)、0021(PCIE无响应)、0022(SMC握手失败),或者经典的E74(eDRAM链路故障)。 毛巾捂的或者三方乱修的不提,原厂修的时候是有完整图纸和诊断工具的,报错既然报显存坏,那修机佬全球通用思路,换显存,还不好就换GPU。 结果多数机器换显存之后马上就测好发回了,回去玩几个礼拜又爆灯返修。 回来之后错误代码变,那么换GPU。然后这机器基本和新机器一样能续几个月到一年,之后照样坏。二修三修还不好的机器干脆换新主板吧,还是和新机器差不多的寿命,接着坏。 这时候研发部门做了几轮RCA、产线几轮revision之后也回过味来了,还有个隐藏大boss在搞我们。 产线仍然在全力产出废品主机,开开心心买回去玩然后边骂街边返修甚至写歌嘲讽或者直播砸机的用户越来越多,产线、返修中心、RCA实验室仓库堆的物料越来越多,Xbox的市场份额甚至微软牌子都快被骂臭了,眼看蚌埠住了,这才下令彻底停产调研整改。 收集了大量RCA物料,并尝试用各种高科技探伤仪器对BGA焊点研究,几乎都一无所获,直到有人灵光乍现。 捂毛巾或者电吹风土法维修,其实并没有产生足够动到BGA焊点的温度,而是产生了80-120度左右的次高温。 维修中心返修焊台换显存的时候,显存这里200多度,热量散发到GPU附近,也是80-120度左右。 并且一修机都是爆显存,二修机都是爆GPU,会不会是GPU本身的问题? GPU底下的BGA焊点没毛病,那么说明GPU内部就是坏的。 当时对GPU基片和封装内部连接探伤的超声、x光等检测方法,还不是很先进,如果拆GPU的时候高温化开,等于又销毁了证据。 于是只能土方法,磨掉上电镜看,终于看到封装内部的焊料失效。 |
![]() |
|
![]() |
这才反应过来,之前换显存都是白换,GPU本身有毛病。 120度的次高温导致GPU封胶软化或者基片膨胀,释放了应力,热胀冷缩下又把撕烂的芯片内部焊料压一块儿去了,于是导致机器受热后能回光返照,继续使用一段时间后,焊料彻底被干烂,甚至导致封装基片、硅芯片本身损坏,GPU报更多错误,只能换掉。换新的也没用,物料就是有瑕疵的,几个月后接着坏。 这个时候,十亿不得不花了。 更新,找到了Xbox 360 GPU物料的汇总。 初代Y1,90nm GPU和eDRAM,Y1有两个料号。 X02056 |
![]() |
X02056,初代有三红问题,这个版本其实一直生产到2009年,因为微软堆了很多坏主板要修,甚至到90nm晶圆线停产都没修完。大约在2008年11周到19周,封装厂换了封胶,修复三红问题。代工厂有TSMC和某未知韩国厂两家。芯片上没写Y1,Y1的名称是后一个改型套回来的X817791,2008年中出现,无三红问题。其实和X02056一样的制程,但小改了一部分东西,芯片上打了Y1的记号,算Y1系列名称来源。全部为韩国产。 |
![]() |
X817791,2008年中出现,无三红问题。其实和X02056一样的制程,但小改了一部分东西,芯片上打了Y1的记号,算Y1系列名称来源。全部为韩国产。 Y2改型, |
![]() |
Y2改型,2007年早期出现,料号X02127,全部有三红问题。80nm GPU和90nm eDRAM。针脚定义有变化,导致和初代主板不兼容,代工厂有TSMC和韩国厂。 Rhea改型,80nm GPU与eDRAM,2007年中出现,有三个料号。 X810480, |
![]() |
X810480,第一个版本,早期封胶选型不当,有三红问题,08年中停产过一段时间,09年中换封胶解决三红问题后重新生产。TSMC产。X816970 |
![]() |
X816970,微软发现三红原因后,测试封胶可靠性的试产款,芯片上有时会打Htg85的标记,意思是换了高玻璃化温度的封胶。TSMC/韩国产。无三红问题。X816971 |
![]() |
X816971,这个也是测试版本,有时会打Htg130的标记,用来识别耐高温封胶版本,无三红问题 Elpis改型 |
![]() |
Elpis改型,80nm,2009年出现,这个改型纯粹是为了Y1停产后把Rhea用到只支持Y1的板子上,其实就是个封装里面改了针脚定义的Rhea。料号X819195,全部为返修用物料,无三红问题。TSMC/韩国产。 Zeus改型,65nm GPU和80nm eDRAM。第一款全系列无三红问题的GPU,2008年后期出现,均为TSMC产。两个料号X817793和X810478,针脚定义和Rhea兼容,理论上小改主板后可以装到之前80nm系列主板上,但微软没这么做过,只有维修佬尝试成功。 |
![]() |
X817793 |
![]() |
X810478 Kronos改型,65nm GPU+eDRAM,无三红问题,09年中后期出现。由于修复了三红问题,热量又最低,是厚机最可靠的GPU型号,一个料号X820894,TSMC/韩国产。 |
![]() |
X820894 Slim的料号不整理了,和三红无关。 |
这个芯片的两个die摆的位置奇葩,导致应力集中。die角落Bump承受应力过大,形成断开。而这种情况不切开确实不容易找到。 |
可以说,唯一的原因是过热,长时间的过热,导致脱焊,或者直接把SoC烤坏了 无论是90nm,65nm还是后来的45nm,过热问题一直存在,其中90nm属于神仙难救。65nm大概可以用暴力风冷或者水冷强压。45nm好一点,我的是45nm,夏天(32度)不开空调玩一小时左右就过热死机,老板给我的解决方案是:1.开空调25度;2.改散热拆外壳上暴力扇。 微软:如果在家里玩会过热的话,为什么不多花一点时间去户外呢? 我:你的意思是,我应该多出去外面走走? 微软:你把游戏机搬到室外去玩,空气流通了不就不过热了吗? 我:你知道我这里室外35度室内32度吗? 微软:你说什么?我这里室外25度太舒适没听清 |
主机散热功效差,内部结构不合理,导致CPU,尤其是GPU过热而损坏,在其损坏后会在主机指示灯上显示三盏红灯,表明是硬件眼中出错。 |
散热没做好,早期90nm发热巨大,百度一下拆机图就知道了 老版的360有点像wiiu的散热设计,风扇是在机身尾部出风,压芯片的散热器上其实没有风扇,等于只安装了机箱风扇没安装cpu风扇。 后期双65时代由于发热量下降,这样的设计也压得住了,就没这个问题了 45nm时代x360slim的散热设计和x1 x1s是一样的,就是把电脑cpu的下压散热换了个方向,变成上吹,吹出机箱。就类似amd幽灵散热把风扇反过来 天蝎座用的是涡流风扇+均热板,类似显卡散热 |
温度很高的,当年有人用GPU的散热片来点燃香烟的 |
设计缺陷,散热不行导致焊点脱落 |
|
[收藏本文] 【下载本文】 |
上一篇文章 下一篇文章 查看所有文章 |
|
|
娱乐生活:
电影票房
娱乐圈
娱乐
弱智
火研
中华城市
印度
仙家
六爻
佛门
风水
古钱币交流专用
钓鱼
双色球
航空母舰
网球
乒乓球
中国女排
足球
nba
中超
跑步
象棋
体操
戒色
上海男科
80后
足球: 曼城 利物浦队 托特纳姆热刺 皇家马德里 尤文图斯 罗马 拉齐奥 米兰 里昂 巴黎圣日尔曼 曼联 |
网站联系: qq:121756557 email:121756557@qq.com 知识库 |