Guo Zhiyu
生駒 : 奈良先端科学技術大学院大学, 2025.3
1
R019308
2025
効率的な大規模言語モデル推論
奈良先端科学技術大学院大学先端科学技術研究科博士論文 ; 2025年3月
学位記番号: 博第2118号
報告番号: 甲第2118号
学位授与年月日: 2025/03/31
博士(工学)
英語 (eng)
Guo, Zhiyu
Large Language Models
Inference Efficiency
Long Context
KV Cache
Model Compression
Sparsity
Large Language ModelsInference EfficiencyLong ContextKV CacheModel CompressionSparsity