LoRA(Low-Rank Adaptaion of Large Language Models)

date: 2023-05-27 excerpt: LoRA(Low-Rank Adaptaion of Large Language Models)について

LoRA(Low-Rank Adaptaion of Large Language Models)について

巨大なモデルを再学習する際にそのパラメータを動かすコストの多さから大規模な投資が必要であったが、アダプタのようなモデルの付け加え方を行うことで少ないパラメータ、少ないコンピュータリソースで再学習することができる
VAEのようなパターンに見えるが、中間層でattentionを計算していることがユニーク
- (特徴量の適切な抽出と抽象化の話がよく出る≒行列分解の話に近い)