ヨムナビ
大規模言語モデル入門

大規模言語モデル入門

山田 育矢, 鈴木 正敏, 山田 康輔, and 李 凌寒

累計読者数10
平均ハイライト数 15.7件/人
star総合評価 57/100
bookmarkリファレンス型
check_circle推定完走率 37%

出版社による紹介

ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し、大きな話題となっています。大規模言語モデルは、大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降、自然言語処理や機械学習の知見をもとに、パラメータ数とテキストデータの拡大により、性能が飛躍的に向上しました。 Hugging Face社の"transformers"というPythonライブラリを利用することで、プログラミングの経験があれば、モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語のデータセットも充実してきており、すぐに業務に使える実用的なモデルを作ることが可能な時代がやってきました。 本書は、大規模言語モデルの理論と実装の両方を解説した入門書です。大規模言語モデルの技術や自然言語処理の課題について理解し、実際の問題に対処できるようになることを目指しています。以下のような構成によって、理論とプログラミングの双方の側面から、大規模言語モデルに関する情報を提供します。 第1章はじめに 第2章 Transformer 第3章大規模言語モデルの基礎 第4章大規模言語モデルの進展 第5章大規模言語モデルのファインチューニング 第6章固有表現認識 第7章要約生成 第8章文埋め込み 第9章質問応答システム

この本に似ている本

すべて見る arrow_right_alt
library_books似た本をもっと見るmap書籍マップで探すroute読書パスガイドauto_awesomeAI診断で次の1冊を探す

読んだ内容を、もう忘れない。

BookNotion Zなら、Kindleのハイライトを自動で保存・整理。Notionにエクスポートして、いつでも振り返れます。

無料ではじめる

クレジットカード不要