• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

deep learning tabular

date: 2021-01-03 excerpt: pytorchでtabularデータを学習&推論する

tag: deep learningtabularpytorch


pytorchでtabularデータを学習&推論する

  • deep learningでtabularデータを扱う

参考

  • A Neural Network in PyTorch for Tabular Data with Categorical Embeddings
  • pytorch-tabular/pytorch_tabular.py

実装したもの

  • psyche/PytorchTabular.py

説明

  • pandasのデータをpytorchでdnnする
  • TabularDataset, FeedForwardNNクラス

DataLoader

dataset = TabularDataset(
		  data=data[col_x + col_y], 
		  cat_cols=categorical_features, # pandasのcategorical featの名前
		  output_col=col_y # yは複数でも良い)
dataloader = DataLoader(dataset, batchsize, shuffle=True, num_workers=1)

FeedForwardNN

model = FeedForwardNN(
	emb_dims=[], # embeddingしたいとき、tupleで指定する
    no_of_cont=8, # 連続変数の数
	lin_layer_sizes=[80, 80, 80], # 中間層のネットワークの数
	output_size=11, # 出力サイズ
	emb_dropout=0.04, # embeddingのレイヤーのドロップアウトレート
    lin_layer_dropouts=[0.001, 0.01] # 中間層のドロップアウトレート
	).to(device)


deep learningtabularpytorch Share Tweet