阿里云重磅发布通义千问2.5：超越GPT-4，引领AI新纪元

阿里云在今日举行的AI智领者峰会北京站活动中，正式发布了通义千问2.5，这款大模型在多项能力上已赶超GPT-4，成为业界的焦点。

通义千问2.5相比2.1版本，在理解能力、逻辑推理、指令遵循、代码能力等方面有了显著的提升，分别提高了9%、16%、19%、10%。在中文语境下，其文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力均超越了GPT-4。此外，在权威基准OpenCompass的测评中，通义千问2.5的得分追平了GPT-4 Turbo，这也是国产大模型首次在该基准取得如此出色的成绩。

阿里云一直致力于大模型的开源推动和实践，已经陆续推出了八款参数规模横跨5亿到1100亿的开源模型。其中，最新款开源模型Qwen1.5-110B在多个基准测评中的表现超越了Meta的Llama-3-70B模型，并成功登顶开源大模型排行榜Open LLM Leaderboard。阿里云CTO周靖人表示，未来通义大模型还会持续开源，以推动AI技术的发展。

通义千问2.5在多个方面均展示了其强大的能力，例如在文档处理上，它支持单次最长1000万字、100个文档的处理，覆盖PDF、Word、Excel等多种文件格式，可解析标题、段落、图表等多种数据格式。在音视频理解方面，通义千问2.5融合了语音、LLM、多模态、翻译能力，具备实时语音识别、说话人分离功能，能够提取全文摘要、总结发言、提取关键词等，并可同时上传处理50个音视频文件。

此外，阿里云还将原通义千问App更名为通义App，将通义大模型的全套能力集于一身，致力于成为“通情达义”的AI助手。这一举措进一步展示了阿里云在AI领域的决心和实力。

通义大模型已经在多个领域得到了广泛的应用，包括PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等。通过阿里云服务的企业数量已超过9万，通过钉钉服务的企业数量已超过220万，通义开源模型的累计下载量也突破了700万。这些数字充分证明了通义大模型在产业界的广泛影响力和深远价值。

同时，多家企业也宣布与通义大模型进行合作，将大模型应用于社交媒体、保险、游戏等领域。例如，小米旗下的人工智能助手“小爱同学”与通义大模型达成合作，强化其在图片生成、图片理解等方面的多模态AI生成能力，并在小米汽车、小米手机等多类设备落地。这些合作将进一步推动通义大模型在更多领域的应用和发展。

总之，阿里云发布的通义千问2.5在多项能力上已赶超GPT-4，成为地表最强中文大模型之一。其强大的能力和广泛的应用前景将为AI技术的发展和应用带来更多的可能性。

文中内容均来源于公开资料，受限于信息的时效性和复杂性，可能存在误差或遗漏。我们已尽力确保内容的准确性，但对于因信息变更或错误导致的任何后果，本站不承担任何责任。如需引用本文内容，请注明出处并尊重原作者的版权。

THE END