Qwen2.5-Coder-32B-Instruct: 开源代码生成模型的最新进展

Qwen2.5-Coder是Qwen系列中专门针对代码生成任务设计的最新版本。与之前的CodeQwen相比，Qwen2.5-Coder在多个方面进行了改进，包括但不限于代码生成、代码推理和错误修复能力的显著提升。该模型基于强大的Qwen2.5架构构建，并扩展了训练数据量至5.5万亿个token，涵盖了源代码、文本-代码对齐数据、合成数据等。

超级老虎漫步

2996人浏览 · 2024-11-26 15:55:06

超级老虎漫步 · 2024-11-26 15:55:06 发布

随着人工智能和机器学习技术的发展，大型语言模型（LLM）在自然语言处理（NLP）领域取得了显著的成就。特别是针对编程任务优化的模型，它们能够生成高质量的代码、进行代码推理以及修复错误，极大地提高了开发效率。本文将详细介绍一个最新的开源代码生成模型——Qwen2.5-Coder-32B-Instruct，它由阿里云推出，旨在满足不同开发者的需求。

模型概述

主要特点

先进的代码能力：Qwen2.5-Coder-32B被公认为当前最先进的开源代码生成模型之一，其编程能力可与GPT-4相媲美。
全面的基础支持：除了增强的编码能力外，Qwen2.5-Coder还保留了在数学和一般能力方面的优势，适用于更广泛的实际应用，如代码代理等。
长上下文支持：该模型支持长达128K token的上下文长度，对于处理长文档或复杂代码库尤其有用。
灵活的模型尺寸：为了适应不同的应用场景和资源限制，Qwen2.5-Coder提供了从0.5亿到32亿参数不等的六种主流模型尺寸。

技术细节

Qwen2.5-Coder-32B-Instruct是一个经过指令调优的因果语言模型，具有以下技术特性：

模型类型：因果语言模型
训练阶段：预训练和后训练
架构：基于transformer，采用RoPE、SwiGLU、RMSNorm和Attention QKV偏置
参数数量：总参数量为325亿，非嵌入层参数量为310亿
层数：64层
注意力头数：Q头40个，KV头8个
上下文长度：完整支持131,072个token

部署指南

为了更好地利用Qwen2.5-Coder-32B-Instruct处理长文本的能力，建议使用最新的Hugging Face Transformers库版本（至少4.37.0）。较低版本可能会遇到KeyError: 'qwen2'的问题。以下是加载模型和生成内容的基本示例代码：

from modelscope import AutoModelForCausalLM, AutoTokenizer

# 定义模型名称
model_name = "Qwen/Qwen2.5-Coder-32B-Instruct"

# 加载模型和分词器
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 设置提示信息
prompt = "write a quick sort algorithm."
messages = [
    {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},
    {"role": "user", "content": prompt}
]

# 应用对话模板并生成输入
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# 生成响应
generated_ids = model.generate(**model_inputs, max_new_tokens=512)
generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

print(response)