宇宙線が装置に与える意外な影響
宇宙線中性子に起因するソフトエラーとは、いったい何でしょうか。
上薗宇宙線と言われても普段生活していくうえでまったく想像できないと思いますが、宇宙からは日々さまざまな粒子が降ってきています。
粒子には電子、陽子、中性子などさまざまな種類があるのですが、その中でも中性子はとにかく粒が小さいので、建物をすり抜けてくることがあります。
この中性子が運悪く装置の中の半導体に衝突してしまい、さらに運悪く半導体にノイズが起こって、さらに運悪くそのノイズがメモリに取り込まれてしまうと、
メモリの値が0から1に、あるいは1から0に反転してしまいます。その結果、装置に誤動作が起こったり、演算結果が間違ってしまったりします。
これが宇宙線中性子によるソフトエラーのメカニズムです。
新保ソフトエラーは昔から知られてはいたのですが、よっぽどのことがないと起こらない現象だと考えられていました。
わたしも昔からデジタル回路の設計をしてきましたが、「こんなの起きないでしょ」という考えでした。
それが最近になって問題となってきている、と。
上薗昔は半導体のサイズが大きかったので、ちょっとしたノイズではメモリの値が反転するようなことはありませんでした。
けれども近年、技術の進化でデバイスが小さくなってきて、保持する電荷も小さくなってきたことで、ちょっとしたノイズですぐに値が反転してしまうようになったのです。
新保装置に中性子を人為的に照射する実験で、実際にソフトエラーが頻発するのを目の当たりにしたときは本当に驚きました。
その後、いろいろなデバイスについてソフトエラーの発生率を調べたのですが、一部のデバイスではハードウェア自身の故障率を上回っていることもわかってきました。
宇宙線中性子によるソフトエラーには、どのような特徴があるのでしょうか。
新保ソフトエラーは、経年劣化による誤作動やハードウェア自身の故障とは違い、新しくデータが書き込まれたりすると正しい状態に戻ってしまうエラーなんです。
装置の動きが一瞬おかしくなった、でももう一度動かすと正しく動いている、と。なので、どうしてエラーになったのかわからない、
誤動作を再現できないという困ったことになります。誤動作が再現しないというのが、ソフトエラーのいちばんの特徴であり、最も厄介なところですね。
http://www.hitachi.co.jp/rd/portal/contents/story/softerr/index.html