• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

sentence transformer

date: 2022-06-07 excerpt: sentence transformerの使い方

tag: 機械学習transformer


sentence transformerの使い方

概要

  • 文章をベクトル化するトランスフォーマー
  • 直接同じ単語を使用しなくても同じような内容は近いベクトルになるなどの特徴がある

具体例

  • "pickachu"を検索クエリにして、様々な語を検索対象としたとき
from sentence_transformers import SentenceTransformer
import pandas as pd

model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

sentences0 = ["pikachu"]
embeddings0 = model.encode(sentences0)
sentences1 = ["Hentai", "Anime", "Movie", "Wife", "Wifu", "日本", "エヴァンゲリオン", "ガンダム", "superman", "captain america", "spider man", "evangelion", "pokemon", "任天堂", "nitendo"]
embeddings1 = model.encode(sentences1)

df = pd.DataFrame(list(zip(sentences1, embeddings0[0]@embeddings1.T)))
df.sort_values(by=[1], ascending=False)

Google Colab

  • sentence transformer

参考

  • Easily get high-quality embeddings with SentenceTransformers!
  • paraphrase-multilingual-MiniLM-L12-v2/huggingface


機械学習transformer Share Tweet