适配了qwen_1_5 72b在 910a上的推理 包括脚本在线推理以及mindspore lite 推理
适配了qwen_1_5 72b在 910a上的训练lash_attention的全参微调