11月 102009
 

AEC/APCとは,Advanced Equipment Control/Advanced Process Controlの略称で,半導体製造設備および半導体製造プロセスの高度制御に関する国際会議である.本体であるアメリカのAEC/APCと連動して,欧州のAEC/APC-EuropeとアジアのAEC/APC-Asiaがある.いずれも毎年開催される国際会議だ.

今回東京で開催されたAEC/APC-Asiaは第3回であり,アメリカのAEC/APCに比べると歴史は浅い.第1回は熊本,第2回は台湾で開催され,第3回は東京での開催となった.実は,第3回AEC/APC-Asiaも熊本で開催される予定であったが,国際的な経済危機の影響で,規模が縮小され,開催地も東京に変更された.しかし,これでも影響は軽微な方で,今年のAEC/APC-Europeは中止に追い込まれた.

このように経済的事情で学会が開催されなくなるというのも衝撃的だが,それにはAEC/APC特有の事情がある.AEC/APCは,私のような大学の工学研究者が普通にイメージする国際会議とは異なり,出席者のほとんどが産業界の技術者であり,学界からの参加者は例外的でしかない.AEC/APC-Asia 2009の参加者は220名程度とのことだったが,そのほとんどが日本人というなか,日本の大学から参加していたのは数名だろう.私とその学生と,私を招待して下さったA先生と.確認したのはそれだけだ.組織委員会もほぼ全員が企業の方々だ.

熊本で第1回AEC/APC-Asiaが開催されたときには,企業の方から誘っていただき,参加も検討したのだが,最終的にスケジュール調整ができずに不参加となった.このため,今回が初参加である.プログラム委員会副委員長でもある先述のA先生から,データ解析に関するチュートリアル講演を依頼され,私でお役に立てるならと喜んで引き受けさせていただいた.とは言うものの,半導体製造設備についてはド素人の私が,半導体製造設備のスペシャリストが集まる国際会議で講演するというのだから,なかなか荷が重い.そこで,思い切って,半導体のことは口にしない戦略を採用した.半導体以外の産業が抱えている課題とそれらの解決例を示すことで,課題の共通性を認識してもらおうというわけだ.さらに,問題解決を成功させるためには,手抜きをせず,基本を身に付けなければならないことを強調した.

講演が参加者の期待に応えられるものであったかどうかは,参加者の判断に委ねよう.

ANNとPLSの比較

半導体製造技術に関する研究発表をまとめて聞くのは今回が初めてであったが,興味深い発表が多かった.

その中で,1件,気になる発表があったのでコメントしておく.というのも,誤解したままになってしまう人がいるのは良くないと思うからだ.もちろん,データ解析を理解している人なら誤魔化される心配などないのだが,必ずしも基本を身に付けた人ばかりではないだろう.幸い,「ブログ見てます」と挨拶して下さった方も少なくなかったので,参考にしていただきたい.

まず,統計的モデルで外挿してはならない.線形モデルでの外挿ならまだしも,何の対策も施していないニューラルネットワークで外挿するのは無茶だ.今回の発表では,ある入力変数の値が普段とは全く異なる値を示していた.そのような場合,モデル構築時とは全く異なる運転をしているわけだから,予測値は信用できないと結論づけるべきである.そのような外挿時の精度を比較して,PLSよりもANNで良好な予測ができたというのが発表の趣旨であったが,これは説得力のある結論とは思われない.一般的に言えば,線形回帰手法であるPLSの方がANNよりもマシだ.実際,process AではANNとPLSの予測精度が同等であったことから,敢えて非線形モデルを利用する必然性のないプロセスだと思われる.少なくとも私なら非線形モデルは使わないだろう.

決して,ニューラルネットワークを否定しているわけではない.対象の非線形性が強い場合に,十分なサンプル数を確保できるなら,ニューラルネットワークを使ってもいいだろう.しかし,今回はそうではない.たまたま,PLSと比較して,ニューラルネットワークでの予測に大きな影響を及ぼさない(感度の小さい)入力変数の値が大きく変化したから,ANNの予測精度がPLSほどには悪くならなかったと解釈するのが妥当である.一般に,PLSよりもANNがロバストだなどという結論は受け入れられない.

もし,あのような大きな変化の前でも後でも推定を行いたいのであれば,当然,モデル構築用データに大きな変化の前と後とを含まなければならない.かつ,検証用データも変化の前と後とを含まなければならない.そのようにして良いモデルが構築できたのであれば,広範な運転状態での推定ができるだろう.ただし,いつでもうまくいくとは限らない.1つのモデルで広範な運転状態をカバーしたいというのは自然な欲求だが,そのような都合の良い線形モデルが構築できるとは限らないし,非線形モデルを利用する場合には,決定すべきパラメータ数の増加に見合ったサンプル数が必要となる.このような問題に対処するために利用されるのが,予め複数のモデルを準備しておく方法(multi-model)であり,推定値を計算するときの運転状態が属する領域によってモデルを切り換える.さらに,これまでに経験したことがないような運転状態にも対応していくために,Just-In-Timeモデルなどが利用される.

今回のような事例を見ても,基本を身に付けることの重要性を再認識させられる.データ解析を業務とする技術者をいかに養成していくかは大きな問題であるように思われる.

名刺交換させていただいた方々にはお伝えしましたが,AEC/APC Symposium Asia 2009に参加された方で,私に何か質問があれば,気軽にメールして下さい.答えられる範囲で,時間の許すかぎり,答えさせていただきます.