libsmctrl论文的复现,添加了python端接口,可以在python端灵活调用接口来分配计算资源
A high-throughput and memory-efficient inference and serving engine for LLMs
关于多核并行与计算资源分配相关的基础测试