CPU是整个计算机的指挥、控制中心,它的主要功能是把指令转换为相应的控制和操作信号,实现算术和逻辑运算,控制和协调计算机主板上的各部分电路以及所有的外部设备都按照一定 的程序进行工作。由于CPU在主板上的核心地位及其担负的复杂而又繁多的重要功能,使它与主板上其他器件相比,具有如下几个显著的特点:
        内部的功能电路最多,引脚数最多。集成度最高、功耗最大、温度最高。P4级CPU的内部集成有数万只晶体管,功耗已超过80W,必须用专门的风扇及散热器来对它散热。
        内部的系统最多,要求单独供电的路数最多。而且对电源电压及其纹波系数的要求极为严格,这就使其具备一个相当庞大的电源系统。如CPU的核心供电电源就需要一个专门的电源控制芯片;由几只特殊的低耐压、大电容场效应管和环型立式电感以及十余只低压大容量的电解电容来完成控制、调压、滤波等功能。这些元器件都紧靠CPU插座,工作在温度较高的环境中,而电解电容的寿命是有限的。
       上述几个显著的特点,决定了CPU及其附属电路成为计算机主板上故障多发的部位。
       CPU不工作或者工作不正常的主要表现是:计算机整机不工作(通电并按下机箱上的"POWER"按钮后机器不启动,显示屏上无任何信息)或者在工作中出现无规律的停机、死机现象。用故障检测卡(POST )检测时,数码管不亮或数码显示“OO”、“FF”等,都说明CPU没有工作。
         对CPU故障的检测,应围绕CPU正常工作所必需的电源、时钟、复位等三大基本条件为中心进行有针对性的检测。这三个基本条件缺一不可,而且都是由外部的电路系统提供的,这就涉及到这些信号的流程及流程中的多个元器件。此外,CPU引脚与插座的接触是否良好,关系到三个基本条件能否实现以及CPU的数据、地址、控制等三条总线信息流是否畅通;散热问题关系到CPU能否长时间正常工作(若温度过高,会使CPU损坏,CPU检测到危险温度值时,会发出停机指令),这些都是至关重要的因素。因此,CPU的故障除了它本身的损坏而外,所涉及的电路范围是相当广泛的。现以P4级(478)CPU为例,由简到繁地讲述CPU及其附属电路的故障检修方法。
一、CPU接触不良的故障及其检修
        由于CPU的引脚数目众多,工作温度高、供电路数多、电流大,在长期使用中总会存在氧化、脏污等问题而造成引脚与插座接触不良。其故障表现是:在搬运或震动计算机后,不能开机或偶尔能开机但在自检过程中或进入程序时出现停机死机。
        检测该故障时常用“指压法”,即取下CPU的风扇及散热器,通电后用手指按压CPU,若显示器屏上有闪现的信息以及故障检测卡上的数码随按压过程发生内变,即可确定为CPU接触不良。维修过程可分为三步进行:

        第一步:清洁CPU引脚及插座内部的夹持铜片。过程是:提起插座右侧的拉杆,取下CPU。揭下插座上的塑料护罩,露出内部的引脚夹持铜片。用牙刷蘸香蕉水反复擦洗引脚夹持铜片和CPU的引脚,使其光亮如新。然后用镊子将距离过大的铜片拨至合适,以增大夹持力度,最后将塑料护罩还原,装上CPU,摇动几次拉杆后锁紧,即可通电试验(该过程详见图1a~d),一部分确系CPU引脚与插座内部的夹持铜片因氧化脏污而接触不良的主板,经过以上的处理都能解决问题,恢复正常工作。若通电试验故障依旧,很有可能是CPU插座与主板之间的焊点出现脱焊故障,则可进行进步的处理 。

         第二步补焊:首先要将CPU风扇座子及插座护罩等塑料件卸下,否则在烘烤过程中将被熔化。用平口改锥在主板的背面顶出风扇座子四个角上的塑料膨胀螺丝,即可取下风扇座子,操作示意见图补焊的装置及操作示意见图3。

         将主板安装CPU插座的部位伸出桌面悬空;用重物压住留在桌面内的部分,防止主板坠落。用大口径热风枪选择高温、大风量对CPU插座背面的主板部分进行烘烤,出风口离主板3~5mm,旋转。约两分钟后,在继续烘烤的同时,另一只手拿镊子轻轻拨动插座周边的元器件,当这些元器件可以拨动时,说明座子下部与主板之间的焊点已熔化,即停止烘烤,待其自然冷却后即可。补焊操作前,最好用厚0.2mm的“绝热胶纸”将北桥芯片的背面主板贴上,防止北桥芯片的BGA焊点被熔化而出现新的故障。补焊操作过程中,要经常在插座引脚夹持铜片的一面均匀地滴注松香水,起助焊作用。补焊操作结束,主板冷却后,一定要用牙刷蘸香蕉水反复刷洗引脚夹持铜片,清除松香残留物,直至夹持铜片不粘手为止。上述操作完成后,恢复风扇座子及插座护罩,装上CPU通电试验,多数脱焊或虚焊的故障都可通过这-步操作得到解决,使CPU恢复正常工作。若故障依然存在,再进行以下操作。

        第三步:更换CPU插座,装置及操作仍按图3所示,可参照前述的BGA焊接方法进行。
         绝大多数的CPU接触不良故障经上述三步的处理后都可恢复正常工作,少数情况或因主板质量差产生严重形变;或因“四层板”结构的中间两层板的铜箔线断裂,修复的可能性就不大了。
二、CPU 散热不良,温度过高引起的故障
        这是一个很常见的故障,其现象是:初次开机正常,工作一段时间就停机,等待半小时以后再开机,又可以正常工作一段更短的时间再次出现自动关机。检修时,在计算机能够正常工作的时段内操作机器进入BIOS自检程序,观察CPU温度项目,就可以发现CPU的温度上升迅速,数分钟就可由常温升至50°C。由于CPU是半导体集成器件,温度过高就会损坏。因此,计算机中都设置有一个CPU温度的极限值,CPU通过温度传感器对温升进行检测,早期CPU的温度传感器是一只热敏电阻,安装在CPU插座“中空”的位置上;目前的温度传感器集成在CPU中。当CPU检测到温度达到极限值时,就会发出停机指令,进行保护性关机,引发该故障的原因有以下几个方面:
        (1)CPU风扇的风叶和散热器上的积尘太多,使风量减小,散热器与空气的接触面减小,因而散热不良,温度升高。可用小毛刷除去积尘或用高压气流吹去积尘。
        (2)风扇轴承缺少润滑剂,使其转速下降,引起CPU散热不良,可用刀片剥开风扇中心部位转轴处的不干胶商标。滴人少许轻机油(缝纫机油亦可),再封上不干胶商标。这样处理后可观察到风扇的转速明显增高。
        (3)散热器底部与CPU顶部的接触面上有杂物或脏污,隔绝了二者之间的热量传导,使cPU散热不良。解决的方法是用牙刷蘸香蕉水刷洗散热器底面和CPU的顶部,然后再在散热器的底面均匀地涂抹上一层很薄的导热硅脂。
        (4) 用于紧固风扇总线与风扇座子之间的两根弹簧钢片卡扣断了一根,使散热器的底面与CPU项部不是全面积接触而发生歪斜,导致CPU散热不良。可配用- -对同型号废弃风扇总成上的弹簧钢片卡子或者更换风扇总成。
        (5) 使用了便宜的劣质风扇总成。实例:一台装备赛扬2.4G cPU的拼装机,送修时称“常死机”。检测时,开机仅数分钟,屏上自检信号中有关CPU项目的温度检测值为85C,而CPU风扇运转正常。怀疑是散热器与CPU接触面之间有脏污,影响散热效果。
        断电后,卸下cPu风扇,手摸铝质散热器,感觉不到明显的温度,而CPU烫手。观察该风扇总成,虽然其成色很新,但散热器底面所贴的导热膜片厚而且硬(正品Intel风扇的导热膜片薄而柔软)。因此断定该风扇总成属于伪劣仿造品一这样的导热膜片正好阻碍了CPU与散热器之间的温度传导。
        去除该导热膜片,在cPU与散热器接触面之间涂上少许导热硅脂,重装风扇后开机20余分钟,CPU温度的检测值为41C,再连续工作一段时间未见温度升高,故障排除。
        经验谈一CPU插座的故障判断:在PCI插槽上插上“故障检测卡”,在短时开机条件下不上cPU风扇,直接按压cPU或带上风扇按压散热器。这时,检测卡上原来无任何显示的数码管出现闪烁不定的数码显示,即可判断为CPU插座故障。完成清洗后再通电试机,若故障依旧,则判断为插座内部BGA焊脱焊,采取大号热风筒加热焊接的方法补焊,或者换用新的CPU插座。

三、CPU的供电系统及其检修

        CPU的供电是由ATX电源输送到主板上的15V或12V电源再经过主板上的CPU供电系统以脉宽调制(PWM)方式降压和稳压后提供的。

1.PWM单相供电原理


        PWM单相供电方式的电路如图4所示。ATX电源将12V和5V电源送到主板后,经过输人电感L1和电容组成的滤波器,加至电压调控芯片18脚。芯片内部的振荡电路开始工作,输出的振荡信号经过脉宽调制(PWM)电路的调整、控制后,分别从14和12两脚输出两路同频、反相的激励脉冲信号,使N沟道场效应管Q1和Q2交替轮流导通或截止,工作在开关状态。其工作过程如图5的等效电路所示。

        图中将Q1和Q2等效为两个交替轮流闭合或断开的开关K1和K2。当K1闭合时(K2断开),如图5(A)所示。5V电源经KID->S。供向L2、C8组成的平滑滤波电路,使负载得到电源供应。在K1闭合瞬间,流过L2的电流突然增大时,I2储能,并产生自感电动势e1,方向是左正、右负,阻止这一电流的突变,而只能缓慢变化。随着时间的推移及两路反相激励脉冲的变化,当K2闭合时(K1断开)如图5(B)所示。通过L2的电流突然下降,此时,L2释放其储能来阻止这一个电流突降的变化,自感电动势e2的方向为左负、右正。于是,由L2的电感储能转换而来的电流就在e2的推动下,沿着L2的右正->负载RL->地->K2的s->D->L2左负的回路释放。虽然这时K1正处在关断的状态下,但由于L2的储能释放及K2的“续流”作用,使负载RL的电流不会因K1关断时5V被切断而下降过多,趋于平滑、稳定状态。再加上C8的滤波作用(电容两端的电压不能突变)使负载两端的电压也趋于平滑、稳定的状态。滤波电容C8代表9只容量为100uF、耐压6.3V的电解电容的并联。英特尔白皮书对这一滤波电容所规定的容量不得少于9000uF。多只电解电容的并联,不但增大了容量,提高了滤波的效果;而且也使电解电容所固有的“寄生电感”在并联中大为减少,提高了电路的高频滤波性能(电解电容内部极板的简状卷绕方式所形成的电感量使它的高频性能下降)。
         在PWM单相供电电路中,两路相位相反的激励脉冲互成180°,于是,在Q1导通至Q1截止之前的阶段,输出电压有一个向上的波动,而在Q1截止,L2释放储能之间,输出电压又有一个向下的波动.....之,在5V供电和L2的储能供电这两种能量的交替供电之间,输出电压总会有上下的波动。经过滤波电容之后,这些电压的波动已很小,能够满足CPU供电的要求了。
         (1)调压原理:针对不同型号及不同工作电压的CPU,电压调整方式已不再是过去的“跳线式”调压方式,而是采用“可编程”数据调压方式,自动进行电压调整。调压数据是由主板的生产厂商根据当时该主板能够支持的CPU型号及工作电压而编制成的软件,在主板的生产过程中就已设置在主板的BIOS芯片内。主板启动之初,对应主板上CPU的相关调压数据就由BIOS芯片送到了电压调控芯片中。工作电压不相同的cPu对应的调压数据不同,经过D/A转换后送到PwM电路的控制电压各异,于是,输出的激励脉冲宽度各不相等,MOS管的工作状态及输出电压也就得到了调整、控制,可以适应多种cPU的需求。这种4bit可编程调压方式,可使输出电压在升压或降压的连续两挡之间,电压的变化为0.5V。
         (2)恒压和恒流控制:在图4中,电阻R2和R3以串联分压的方式直接对输出电压变化进行取样,送到电压调控芯片的10脚,与内部的基准电压在比较器中进行比较输出的误差电压送去控制PWM电路;同时,输出电流的变化也反馈到调控芯片的13脚,经内部逻辑处理后送去控制PWM电路。总之,以脉宽调制的方式来控制输出电压、输出电流的变化,达到恒压、恒流供电的目的。
         上述PWM单相供电方式下的两只MOS管最大输出电流约30A左右,显然不能适应CPU*低电压、大电流”的发展趋势。而且,CPU的工作电压越低,对纹波系数的要求越严格,PWM单相供电方式下的电压波动也不能适应这一要求。于是,产生了“PWM多相供电”方式。
2.PWM多相供电原理


          图6所示是一个三相供电电路。可以简单地理解为三个单相供电电路的并联,其输出电流累加,使电路的带载能力提高。但是,这三路激励脉冲的相位是不同的。在图6的电路中,电压调控主芯片HIP6301具有PWM1 ~PWM4共四路激励脉冲输出,每路激励脉冲的相位依次相差360°/4=90°,图6的电路中只用了三路,分别通过三个辅助驱动芯片IC2~IC4(HIP6601 )去驱动三对,共六只MOS管Q1~Q6,每一对MOS管及其附属电路都可以看成是一一个单相供电电路,其输出电流是并联垒加关系。最大负载电流可以达到90A左右。由于三路激励脉冲的相位不同,所以,三对MOS管不是在同一时刻导通或截止,而是依次相隔一段合适的时间分别依次地交替、轮流导通或截止,其开关频率的总和相当于单相供电的3倍。这样,就使上管导通时的12V电源供电和下管导通时的电感储能供电这两种能量交替供电之间的转换过程大为缩短,输出电压的波动也极大地减少了。再加上C7(1500uFx9)的滤波,其纹波系数也能满足目前CPU低压供电的需求。同时,三对MOS管共同分担总的输出的电流,使电路的功耗下降,温升降低,提高了工作的可靠性。
         图6电路中的电压调整数据VID0~VID4是预置于主板BIOS芯片内5bit数据。5bit 可编程调压方式使输出电压的调节更加细微,在数据连续改变时无论是升压不定或降压过程,输出电压每连续两档的电压调节是0.05V,适应性更强。
        稳压控制信号由R11、R1组成的串联分压电路对输出电压取样,送到主控芯片IC1的VSEN端。电流反馈信号有两路:第一路由每路的输出端分别送到对应的辅助驱动芯片IC2~IC4的⑧脚;第二路分别经过电阻.R8~R10送到主控芯片IC1的ISEN1~ISEN3。以上的三种控制数据和控制信号,都是通过脉宽调制(PWM)方式来对输出电压、电流进行调整和控制。
3.CPU供电电路的故障检测方法
          CPU的供电电路紧靠在CPU插座周围,在正常工作时,CPU是主板上功耗最大、热量最高的一个部件。其供电电路本身的热量也较高,加上电解电容是主板上使用寿命最短的元件之一- 。在环境温度高、工作时间长的条件下,很容易发生损坏。所以,这些因素使CPU供电电路成了主板上的故障高发区。检修的方法如下:
         (1)CPU的假负载:为了防止维修中的失误,使CPU的供电电压异常升高而烧坏CPU,所以,在维修CPU供电电路之后的通电实验中,常用假负载来代替CPU。
         CPU的假负载底部的针脚与所对应的系列CPU完全一样。正面的铜铆钉孔上用短路线将CPU的调压数据引脚短接,即用人工方式强制设定调压数据。否则,在不上“真CPU"的情况下,主板BIOS芯片中的调压数据是不能传输到电压调控芯片的,使电压调控芯片及整个CPU供电系统都不工作,就无法检测到CPU的供电电压是否正常。短路线的连接方法以370系列CPU的假负载为例,只是将假负载上对应CPU引脚的VID1(AM36)/VID2(AL37 )/VID3 (AJ37)和VID25MV(AK36)四个调压数据线连通后,再与地线VSS( AM34)相连,即将上述四个点接地,调压数据线中只有VIDO(AL35 )没有接地,这样就人工设定了4bit 调压数据“0001”。将假负载插到CPU插座上,通电试验时,电压调控芯片就得到了这组数据,从而控制整个CPU供电系统输出2V的CPU供电电压,适应370系列CPU。当检测到该输出电压正常后,再取下假负载,将“真CPU"插上去,就达到了安全操作要求,避免发生不必要的损失。除上述5个引脚而外,假负载上的其他引脚都没有任何连接,也不起任何作用。
         (2)目测法:对于送修机,开盖后的第一步就是“目测”,,重点就是CPU供电系统。接件时,一边拆卸机箱盖,一边询问用户该机发生故障的现象及原因。对于连续工作时间较长的计算机,尤其是“网吧机”及单位使用的机器,开盖后就要仔细观察CPU插座周围的10余只滤波电容--这就是CPU供电系统中的薄弱环节。长时间的高温条件下,电解电容发生顶部鼓皮,防爆凹槽开裂“爆浆”(电解液溢出)是最常见的。尤其在夏天,这类现象极为普遍。如图7所示,滤波电容中有四只在MOS管和CPU的双重烘烤下已严重变形,顶部上凸、防爆凹槽开裂、电解液溢出。凡是有这种外观的电解电容;漏电严重、容量大减,使CPU供电电压偏低,滤波不良。

         所以,CPU供电滤波电路中的电解电容发生这类常见故障的典型现象就是:如果有多只是如此,根本开不了机;如果有少数是如此,则在正常工作中会出现无规律“死机”或“重启”。因此,在目测过程中观察到CPU供电回路中电解电容的上述现象时,维修的步骤是卸下主板,拆去CPU后第一步就是更换电容器,最好是全数更换(这一只或几只既然已经如此,其他的也就严重受损了),然后上假负载通电测CPU的代伸展电压是否正常(测试方法及测试点见后述),如果不正常或无电压,则继续按以下叙述检测CPU供电电路;若已正常,则可取下假负载,上“真CPU",再通电试验有相当多的主板在更换滤波电容后就已恢复正常工作。对于仍不能正常工作的,就要用故障检测卡(POST)来检测其他电路的故障了。
        (3)电压法:对CPU供电电压的测量,一般是“先输人,后输出”循序渐进的逐点进行测量。输入电压12V的测试点选在输人电感(原理图中的L10两端,目标明显,焊点大,测试很方便,如图8所示。


        然后可将示波器探针移到几只MOS管的漏极(D),上进行测量,一是看12V电源是否送到MOS管“上管”的D极,否则是印制线有问题。二是判断出对管中的上管和下管--D极上有12V的是对管中的上管;无12V的是对管中的下管,以便在“波形测试”中很快找到测试点。对于CPU供电电路输出电压的测量,测试点选在储能电感的焊点上,如图9所示。

        之后,可将示波器探头穆至CPU座旁边的一排贴片电容的焊点上,作进一步的测试,如图10所示。

        最后的电压测试是将示波器探针插到假负载上端面的铜铆钉孔中,对CPU的几路重要电压进行测试,如图11所示。其中“AD19”是多路"VCC"供电中的一路;“AD20”是CPU的核心电压(vCCA)。在478系列CPU中,这两个电压都是1.75V;“F6”、 “F20”、 “AA6” 和“AA21”是CPU的基准参考电压(GTLREF)都是1.2V。


       (4)波形法:当检测到输人端的12V正常,而输出端无电压时,在排除MOS管损坏的可能性之后,就要对电压调控芯片的输出激励脉冲进行测试了。测试点选择在MOS管对管中的上管(G),如图12所示。