Efficient Large Language Model Inference

Efficient Large Language Model Inference

Guo Zhiyu

生駒 : 奈良先端科学技術大学院大学, 2025.3

学位論文

巻号情報

全1件
No. 刷年 所在 請求記号 資料ID 貸出区分 状況 予約人数

1

  • Abstract

R019308

詳細情報

刊年

2025

別書名

効率的な大規模言語モデル推論

シリーズ名

奈良先端科学技術大学院大学先端科学技術研究科博士論文 ; 2025年3月

注記

学位記番号: 博第2118号

報告番号: 甲第2118号

学位授与年月日: 2025/03/31

博士(工学)

標題言語

英語 (eng)

本文言語

英語 (eng)

著者情報

Guo, Zhiyu

件名

Large Language Models

Inference Efficiency

Long Context

KV Cache

Model Compression

Sparsity