Power-efficient acceleration for large language models