• Top
  • Details (Local collection)
Efficient Large Language Model Inference

Efficient Large Language Model Inference

Guo Zhiyu

生駒 : 奈良先端科学技術大学院大学, 2025.3

Thesis / Diss.

Volume No.

Total: 1
No. Printing year Location Call Number Material ID Circulation class Status Waiting

1

  • Abstract

R019308

Details

Publication year

2025

Alternative title

効率的な大規模言語モデル推論

Series title

奈良先端科学技術大学院大学先端科学技術研究科博士論文 ; 2025年3月

Note

学位記番号: 博第2118号

報告番号: 甲第2118号

学位授与年月日: 2025/03/31

博士(工学)

Country of publication

Japan

Title language

English (eng)

Language of texts

English (eng)

Author information

Guo, Zhiyu

Subject

Large Language Models

Inference Efficiency

Long Context

KV Cache

Model Compression

Sparsity