阿里云在今日举行的AI智领者峰会北京站活动中,正式发布了通义千问2.5,这款大模型在多项能力上已赶超GPT-4,成为业界的焦点。
通义千问2.5相比2.1版本,在理解能力、逻辑推理、指令遵循、代码能力等方面有了显著的提升,分别提高了9%、16%、19%、10%。在中文语境下,其文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力均超越了GPT-4。此外,在权威基准OpenCompass的测评中,通义千问2.5的得分追平了GPT-4 Turbo,这也是国产大模型首次在该基准取得如此出色的成绩。
阿里云一直致力于大模型的开源推动和实践,已经陆续推出了八款参数规模横跨5亿到1100亿的开源模型。其中,最新款开源模型Qwen1.5-110B在多个基准测评中的表现超越了Meta的Llama-3-70B模型,并成功登顶开源大模型排行榜Open LLM Leaderboard。阿里云CTO周靖人表示,未来通义大模型还会持续开源,以推动AI技术的发展。
通义千问2.5在多个方面均展示了其强大的能力,例如在文档处理上,它支持单次最长1000万字、100个文档的处理,覆盖PDF、Word、Excel等多种文件格式,可解析标题、段落、图表等多种数据格式。在音视频理解方面,通义千问2.5融合了语音、LLM、多模态、翻译能力,具备实时语音识别、说话人分离功能,能够提取全文摘要、总结发言、提取关键词等,并可同时上传处理50个音视频文件。
此外,阿里云还将原通义千问App更名为通义App,将通义大模型的全套能力集于一身,致力于成为“通情达义”的AI助手。这一举措进一步展示了阿里云在AI领域的决心和实力。
通义大模型已经在多个领域得到了广泛的应用,包括PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等。通过阿里云服务的企业数量已超过9万,通过钉钉服务的企业数量已超过220万,通义开源模型的累计下载量也突破了700万。这些数字充分证明了通义大模型在产业界的广泛影响力和深远价值。
同时,多家企业也宣布与通义大模型进行合作,将大模型应用于社交媒体、保险、游戏等领域。例如,小米旗下的人工智能助手“小爱同学”与通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、小米手机等多类设备落地。这些合作将进一步推动通义大模型在更多领域的应用和发展。
总之,阿里云发布的通义千问2.5在多项能力上已赶超GPT-4,成为地表最强中文大模型之一。其强大的能力和广泛的应用前景将为AI技术的发展和应用带来更多的可能性。
暂无评论内容