Web: qiita.com US web_search 2026-05-01 04:05

LLMのパラメータ数、学習データ量ってなに？ - Qiita

分析結果

カテゴリ: 教育
重要度: 62
トレンドスコア: 26
要約: LLMのパラメータ数、学習データ量ってなに？ #Claude - Qiita 10 いいねしたユーザー一覧へ移動 7 X（Twitter）でシェアする Facebookでシェアするはてなブックマークに追加する more_horiz 記事を削除する close 一度削除した記事は復旧できません。この記事の編集中の下書きも削除されます。削除してよろしいですか？キャンセル削除する delete info この記事は最終更新日から1年
キーワード: 学習データパラメータモデル削除記事 LLM 相当

LLMのパラメータ数、学習データ量ってなに？ #Claude - Qiita 10 いいねしたユーザー一覧へ移動 7 X（Twitter）でシェアする Facebookでシェアするはてなブックマークに追加する more_horiz 記事を削除する close 一度削除した記事は復旧できません。この記事の編集中の下書きも削除されます。削除してよろしいですか？キャンセル削除する delete info この記事は最終更新日から1年以上が経過しています。 @ ymgc3 in TIS株式会社 LLMのパラメータ数、学習データ量ってなに？ grok LLM Claude Mixtral Command-R+ 10 最終更新日 2024年12月17日投稿日 2024年04月20日はじめに LLMのモデルサイズ（例.8B、70B）とかって、イメージ湧かなくないですか？一般の方からすると。凄さとか、学習の大変さが伝わりづらい「モデルのパラメータ数」と「事前学習のデータ量(トークン数)」も混同しがちこのへんを整理していきます。パラメータ数と学習データ量モデルのパラメータ数パラメータとは、機械学習モデルが学習によって調整する変数のことパラメータの数が多いほど、モデルは複雑な関数を表現できるパラメータ数は、モデルの "表現力" と言えます最新の大規模言語モデル (LLM) は、数百億から数兆のパラメータを持つものもある例えば、1000億のパラメータを持つモデルは、1000億個の "ニューロン" を持つ人間の脳に例えることができます。学習データ量機械学習モデルは、大量のデータから規則性やパターンを学習します学習に使うデータの量が多いほど、モデルはより多くのことを学習できます LLMの学習には、数千億から数兆トークンのテキストデータが使われます例えば、8000億トークンのテキストデータは、約80万冊分の書籍に相当します。東京都立図書館の全蔵書の約7倍に相当する膨大な量です。主要なモデルのパラメータ数と学習データ量この表から、最新のLLMがいかに膨大な量のテキストデータを使って学習されているかが一目瞭然ですね。 Chinchilla則（パラメータ数の20倍の学習データ量）を満たすか、それ以上のデータ量が使われているのがわかります。モデル名会社パラメータ数学習データ量(token) パラメータ数:データ比率学習データ量 Mixtral Mixtral AI 1760億 8000億約46倍約80万冊分に相当 Command R+ Cohere 1040億 4000億約40倍約40万冊分に相当 Grok 1.5 Grok 3140億 6000億約20倍約60万冊に相当 Claude-3 OPUS Anthropic 2兆 4兆約20倍約400万冊分に相当参考資料本記事で載せる各モデルのパラメータ数などはいかの資料をインプットにしています。モデルサイズなどは推定値を含みます。 10 いいねしたユーザー一覧へ移動 7 comment 0 コメント一覧へ移動新規登録して、もっと便利にQiitaを使ってみようあなたにマッチした記事をお届けします便利な情報をあとで効率的に読み返せますダークテーマを利用できますログインすると使える機能について新規登録ログイン 10 いいねしたユーザー一覧へ移動 7 more_horiz 記事を削除する close 一度削除した記事は復旧できません。この記事の編集中の下書きも削除されます。削除してよろしいですか？キャンセル削除する delete

LLMのパラメータ数、学習データ量ってなに？ - Qiita

分析結果

類似記事（ベクトル近傍）