core temperature above threshold !!!

December 13, 2016 – 10:46 am

表記のような Kernel Error が出ていることに気付いた。このkernel error、以前にも発生し、対処したことがある。さて、今回は?

数日前、ログファイル /var/log/messages 上にこのエラーを確認。推移を眺めていたところ、昨日にいたって、数十分に一度程度同じエラーが現れるようになってしまった。

大事に至る前に措置しないと後悔することになると思案しているところだ。

ログファイル上のエラーは次のようなもの:

Dec 13 07:56:17 server01 kernel: CPU3: Core temperature above threshold, cpu clock throttled (total events = 11736871)
Dec 13 07:56:17 server01 kernel: CPU7: Core temperature above threshold, cpu clock throttled (total events = 11736869)
Dec 13 07:56:17 server01 kernel: CPU7: Core temperature/speed normal
Dec 13 07:56:17 server01 kernel: CPU3: Core temperature/speed normal

過去の履歴をたどってみると:
5.6年前に、同じエラーが発生している(我が自宅サーバにHardware Error発生)が、このときはCPUファンにとりついたホコリが原因と考え、周辺をクリーニングするなどして、エラーは見られなくなっていた。

2年前に、騒音が気になって、このサーバのCPUクーラーを交換したことがある(サーバー用CPUクーラーを交換してみた)。この時は、それまで取り付けていた、インテル純正のCPUファンに代え、Cooler Master社製のVortex211Qを取り付けた。当然のことながら、ペーストの塗り替えなどの措置を講じている。

その後、logwatch上では、cpu temperatureにかかわるようなエラーは見かけなかった。

ひと月前、バックアップ用にとサーバを増設したのであるが、それに併せて、このサーバのメンテナンスの一環として、CPUファンの清掃、そして熱伝導グリースの塗り替えをしている。熱伝導クリーニングが乾いていたこと、起動時に異音が発生するなどの症状が気になっており、メンテナンス作業にいたっている。

そのメンテナンス作業が終了し、サーバを立ち上げようとすると、cpuファンの動作が不規則(多少の異常な動作音あり)で、BIOSでcpu fan errorなる表示がでていた。しばらくすると、動作も落ち着いたので、様子をみることにしたのだが、この症状が今回のkernelエラーに関係するのかもしれない。

さあどうする
多少の出費になるが、cpuファンを新しく購入し、取り付けなおしてみるのがいいのかもしれない。

あらたな作業が発生というところだな。


  1. One Response to “core temperature above threshold !!!”

  2. cpuファンが故障していると判断し、以前使っていたIntel純正のcpuファンを改めて取り付けなおした。
    取り付けにあたっては、新たにグリースを購入。
    cpuファンの取り付けは、正しくはMBをケースから取り外したのち行うべきところだったが、そのまま取り付け。
    取り付け後、半日にわたって監視したが、問題なく動作している。
    問題解決と判断。
    Intel純正のファンで十分なのではと考えた。

    By yama on Dec 14, 2016

Post a Comment