イベント

10/12 スモールデータ解析の方法と実問題解決への応用

分析・評価・品質管理 ICT・情報処理 / 2023年09月11日 / IT・情報通信先端技術

イベント名	スモールデータ解析の方法と実問題解決への応用
開催期間	2023年10月12日（木）～ 2023年10月20日（金）【Live配信】2023年10月12日（木）10:30～16:30 【アーカイブ配信】2023年10月20日（金）まで受付　 (視聴期間：10/20～11/2） ※会社・自宅にいながら受講可能です※
会場名	【Live配信（Zoom使用）受講】もしくは【アーカイブ配信受講】
会場の住所	オンライン
お申し込み期限日	2023年10月20日（金）16時
お申し込み受付人数	30 名様
お申し込み

スモールデータ解析の方法と実問題解決への応用

～スモールなデータからいかにして知識を抽出するのか～

■機械学習の基礎知識■
■入力変数選択・異常検知手法などスモールデータに適したデータ解析手法■
■スモールデータにおけるデータ収集の心構え■

受講可能な形式：【Live配信】or【アーカイブ配信】のみ

少量のデータから統計モデルを構築したい方、

現場でのデータ解析、データ収集についてお困りの方は是非
不特定多数の多量のデータでではなく、
特定の専門データである「スモールデータ」の活用で生産現場などの実務・現実問題の解決を
スモールデータの収集方法とその留意点、解析の実態とその手法選択、方法論

必要となるデータの質、データ収集の留意点、スモールデータ解析の手法選択

【得られる知識】

・機械学習の基礎知識
・入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
・スモールデータにおけるデータ収集の心構えの習得

【対象】

・現実のデータの解析に興味のある技術者・研究者（線形代数・微積．統計などの初歩の知識を前提とする）
・少量のデータから統計モデルを構築したいと考えられている方
・現場でのデータ解析に従事されている方
・現場におけるデータ収集についてお困りの方

講師

名古屋大学　工学研究科　物質プロセス工学専攻　准教授　博士(工学)　藤原幸一　氏
【講師紹介】

セミナー趣旨

　生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
　本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

セミナー講演内容

１．スモールデータとは
　1.1 スモールデータの特徴
　1.2 スモールデータ解析の現状

２．スモールデータ解析の方法論：次元削減と回帰分析
　2,1 主成分分析（PCA）
　　2.1.1 PCAとは
　　2.1.2 直交展開
　　2.1.3 PCAの導出
　　2.1.4 PCAと特異値分解
　2,2 最小二乗法
　　2.2.1 回帰分析とは
　　2.2.2 相関係数の意味
　　2.2.3 最小二乗法の導出
　　2.2.4 最小二乗法の幾何学的意味
　　2.2.5 多重共線性の問題
　2.3 部分的最小二乗法(PLS)
　　2.3.1 PLSとは
　　2.3.2 潜在変数モデル
　　2.3.3 PLSモデルの導出
　　2.3.4 NIPALSアルゴリズム
　　2.3.5 PLSから重回帰モデルへの変換
　　2.3.6 クロスバリデーションによるパラメータチューニング

３．スモールデータ解析の方法論：入力変数選択
　3.1 入力変数選択とは
　3.2 スパースモデリング
　　3.2.1 スパースとは
　　3.2.2 リッジ回帰
　　3.2.3 Lasso回帰
　　3.2.4 エラスティックネットモデル
　　3.2.5 Group Lasso
　3.3 変数クラスタリングによる入力変数選択
　　3.3.1 スペクトラルクラスタリング
　　3.3.2 NC法のコンセプト
　　3.3.3 NCSCアルゴリズムの導出
　　3.3.4 NCSCを用いた変数クラスタリングと入力変数選択
　　3.3.5 製薬プロセスへの応用例

４．スモールデータ解析の方法論：不均衡データ解析
　4.1 サンプリング手法
　　4.1.1 サンプリング手法とは
　　4.1.2 アンダーサンプリングとオーバーサンプリング
　4.2 ブースティング
　　4.2.1 ブースティングとは
　　4.2.2 AdaBoost
　　4.2.3 RandomForest
　4.3 ブースティングとサンプリング手法を組み合わせた不均衡データ解析
　　4.3.1 何故，ブースティングとサンプリング手法を組み合わせるか
　　4.3.2 RUSBoost
　　4.3.3 HUSDOS-Boost
　4.4 不均衡データ解析の大規模検診データへの適用例

５．スモールデータ解析の方法論：異常検出
　5.1 異常検出とは
　5.2 多変量統計的プロセス管理(MSPC)
　　5.2.1 MPSCとは
　　5.2.2 T2統計量とQ統計量の幾何学的意味
　5.3 自己符号化器(オートエンコーダー)
　5.4 異常検出問題の医療データ解析への応用例

６．スモールデータの収集・解析の考え方
　6.1 必要となるデータの質の問題
　6.2 データ収集の際の留意点
　6.3 スモールデータ解析の手法選択

□質疑応答□

キーワード：スモールデータ解析、機械学習、不均衡データ解析、異常検出

※詳細・お申込みは上記

「お申し込みはこちらから」（遷移先WEBサイト）よりご確認ください。

このページに関するお問い合わせ

【前のページ】

12/22 実験室における高薬理活性物質の取り扱い／封じ込め対応と区分による要求レベル
HOME
【次のページ】

10/31 半導体封止材の設計・開発とその技術および市場動向

サイト内検索

ページカテゴリ一覧

新着ページ

月別ページ