7月 042011
 

先月,品川で開催されたSONAR研究会というソフトウェアのユーザ会で,講演をさせていただいた.実は,SONAR研究会のレギュラー講演者(?)に指名されていて,毎回,話題を変えて講演させてもらっている.参加者は100%企業の方々なので,これまでは自分の産学共同研究の事例を交えながら,その基盤となるデータ解析技術について紹介するというスタイルを貫いていた.しかし今回は,企業でデータ解析を手掛けている方々に実際に役立つような話をしたいと思い,ポイントを稼ぎやすい産業界での応用事例を封印して,データ解析の基本を解説した.講演題目は「線形回帰モデルを自分で構築するための基礎力をつけよう」とした.決して面白い話はしません,基本を勉強していただきますよという雰囲気を醸し出すためだ.1時間ほどの講演なので,説明できる内容は限られる.そこで今回は,製造現場のデータを解析するときに本当に問題になる部分に焦点をあてることにした.外れ値検出,変数変換(正規分布への変換),そして変数選択だ.かなりマニアックで,実際にデータ解析をやった経験がない人には全く実感が湧かない内容だろうが,少なくとも日本語で出版されている本には書かれていないような実践的な内容で,製造現場のデータを解析する難しさを痛感している人にとっては役立つものだ(と信じている).

講演会終了後,この講演に対するアンケート調査の結果を教えていただいた.期待通り,ほぼ期待通り,どちらかと言えば不満,不満の4択で,コメントを自由に書くというものだ.貴重な時間を割いてコメントを書いて下さった方々のコメントを以下に列挙する.

<どちらかと言えば不満>

  • むずかしい.
  • 専門的な話が多かった.

<ほぼ期待通り>

  • データをグラフ化して見る重要性を改めて認識.
  • 自分の非力さを認識し,勉強が必要なことを改めて感じた.データ解析時の心構えを強く認識.
  • 基礎知識がないため,理解することができなかったが,触りだけでも参考になった.
  • 非常に参考になった.
  • 勉強になって良かった.
  • 門外漢だが,興味深かった.
  • 変数選択からかなり難しくなり,理解できなかった.
  • 後半はついていけませんでした.
  • 非常に難しかった.

<期待通り>

  • 期待以上,面白かったです.
  • 目からウロコの内容.思い込みでやってもゴールはなく,産学協同の必要性を痛感.
  • 自分の知識の穴を埋めることができた.目からウロコが落ちた.
  • 何気なく使っている手法を改めて基礎から振り返ることができた.学生時代に学んだ基礎の重要性に改めて気付いた.期待を大きく上回る成果があった.
  • わかりやすく為になった.
  • 学んだことを業務に活かしていきたい.
  • 現在の業務に役立った.
  • これから重回帰分析を行う上で参考になった.
  • 外れ値の除去は非常に問題になるところで大変勉強になった.
  • 基礎知識の重要性を改めて認識.
  • 不必要なデータ除去方法等を学べた.参考にしたい.
  • データ選択の方法,初めて知った言葉があり,実際の調査に使ってみる.もう一度,勉強し直す必要がある.
  • 新しい知見Hampel Identifierは大変参考になった.
  • Hampel Identifierがどこまで使えるか?(多峰性の確率密度分布とか)
  • データ分布と変数変換の事例をもう少し紹介して欲しい.

100人を超える方々すべてに満足してもらえうような講演というのは,やはり,そう簡単にできるものではない.それでも,多くの方々に聞いて良かったと感じていただけたことは非常に有り難い.