• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

google cloud professional machine learning engineer

date: 2021-03-19 excerpt: google cloud professional machine learning engineer認定

tag: cloud


google cloud professional machine learning engineer認定

参考ドキュメント

  • 公式の説明
  • Google Cloud Professional Machine Learning Engineer Exam(BETA)まで20日
    • ML問題のフレーミング
      • 顧客に最適な問題定義
      • 慎重な問題の読み込み
    • MLソリューションアーキテクチャ
      • GPUとTPUの違い
    • データの準備と処理
      • TFrecordsの役割
    • モデルの開発
      • BQML
      • SparkMLlib
      • AutoML
      • ML API
      • AI Platform
    • MLパイプラインの自動化とオーケストレーション
      • kubeflowパイプライン
  • Google Professional Machine Learning Engineer Exam:何を期待するか
  • How I cracked the GCP Professional ML Engineer certification in 8 days!

tensorflowの分散トレーニング

  • TPU > GPU > CPU
  • synronouse training
    • different slices of input data in sync
    • aggregationg gradients at each step
  • async training
    • all worker are independent
  • mirrored strategy
    • sync
    • GPUs on one machine
    • creates one replica per GPU
    • all variable are mirrored across all replicas
  • NVIDIA NCCL
    • all-reduce implementation
  • parameter server strategy
    • parameter server
  • central storage strategy
    • sync
    • not mirred
  • tpu strategy
    • mirred
    • all-reduce

TPUでのトレーニング

  • 公式ドキュメント

ai platformでの分散トレーニング

  • master, worker, paramter serverのcontainerでトレーニングする
  • sklearn, xgboost等はサポートされない
  • ベイス最適化がある

説明可能なAI

  • アルゴリズム
    • Integrated Gradients
    • XAI
    • Sampled Shaplely
  • AutoML tableもサポート

kubeflowパイプライン

精度

  • 再現率
  • 適合性
  • F1
  • AUCROC > AUCRP(クラスバランス不変)


cloud Share Tweet